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Prefácio 


Quem  imaginaria,  na  época  em  que  a  primeira  edição  de 
Análise  Multivariada  de  Dados  foi  publicada  há  mais  de 
25  anos,  que  o  uso  de  estatística  multivariada  seria  tão 
atraente  quanto  é  hoje  em  dia?  Durante  esse  período, 
vimos  grandes  mudanças  no  ambiente  de  pesquisa  tanto 
acadêmica  quanto  aplicada.  Em  primeiro  lugar,  a  revolu¬ 
ção  do  computador  pessoal  (PC)  proporcionou  poder  de 
trabalho  que  era  inimaginável  até  mesmo  há  poucos  anos. 
Nesse  trajeto,  passamos  dos  cartões  perfurados  para  o 
reconhecimento  de  voz,  revolucionando  a  maneira  como 
podemos  interagir  com  o  computador  e  usá-lo.  Simulta¬ 
neamente  vimos  tremendos  avanços  na  disponibilidade  e 
na  facilidade  de  uso  de  programas  estatísticos,  variando 
de  pacotes  computacionais  completamente  integrados  - 
como  o  SPSS  e  o  SAS  -  a  programas  especializados  em 
técnicas  como  redes  neurais  e  análise  conjunta.  Hoje,  o 
pesquisador  pode  encontrar  praticamente  qualquer  técni¬ 
ca  concebível  em  um  formato  PC  e  a  um  preço  razoável. 

No  âmbito  estatístico,  temos  presenciado  um  desen¬ 
volvimento  contínuo  de  novas  técnicas,  como  análise  con¬ 
junta  e  modelagem  de  equações  estruturais.  Todos  esses 
avanços,  porém,  têm  sido  acompanhados  por  uma  necessi¬ 
dade  crescente  de  maior  capacidade  analítica.  A  explosão 
de  dados  dos  últimos  anos  tem  pesado  não  somente  sobre 
nossos  recursos  físicos  para  lidar  e  analisar  toda  a  infor¬ 
mação  disponível,  mas  tem  exigido  também  uma  reavalia¬ 
ção  de  nossa  abordagem  à  análise  de  dados.  Finalmente, 
a  combinação  da  complexidade  dos  tópicos  abordados  e 
o  crescente  papel  da  teoria  no  planejamento  de  pesqui¬ 
sa  está  requerendo  técnicas  mais  rigorosas  e  sofisticadas 
para  executar  as  análises  confirmatórias  necessárias. 

Todos  esses  eventos  têm  contribuído  para  a  aceitação 
das  últimas  cinco  edições  deste  texto  e  para  a  demanda 
desta  sexta  edição.  Ao  promovermos  esta  revisão,  tenta¬ 
mos  contemplar  pesquisadores  tanto  acadêmicos  quanto 
aplicados,  com  uma  apresentação  fortemente  fundamen¬ 


tada  em  técnicas  estatísticas,  mas  focando  planejamento, 
estimação  e  interpretação.  Continuamente  nos  esforça¬ 
mos  para  diminuir  nossa  dependência  de  notação  e  termi¬ 
nologia  estatística,  e,  para  tal,  identificamos  os  conceitos 
fundamentais  que  afetam  nosso  uso  dessas  técnicas  e  os 
expressamos  em  termos  simples:  uma  introdução  orien¬ 
tada  a  aplicações  em  análise  multivariada  para  aqueles 
que  não  são  estatísticos.  Nosso  compromisso  ainda  é  for¬ 
necer  uma  firme  compreensão  dos  princípios  estatísticos 
e  gerenciais  inerentes  à  análise  multivariada,  de  modo  a 
desenvolver  uma  “área  de  conforto”  não  somente  para 
as  questões  estatísticas  envolvidas,  mas  também  para  os 
aspectos  práticos. 


O  QUE  HÁ  DE  NOVO? 

A  mudança  mais  evidente  na  sexta  edição  é  a  nova  base 
de  dados  -  HBAT.  A  ênfase  em  medida  melhorada,  par¬ 
ticularmente  em  construtos  multiitem,  nos  levou  a  desen¬ 
volver  a  HBAT.  Após  substanciais  testes,  acreditamos 
que  ela  fornece  uma  ferramenta  de  ensino  expandida  com 
várias  técnicas  comparáveis  às  da  base  de  dados  HATCO. 
Outra  mudança  importante  refere-se  à  inserção  de  “regras 
práticas”  para  a  aplicação  e  interpretação  das  várias  téc¬ 
nicas.  Elas  estão  em  destaque  ao  longo  dos  capítulos  para 
facilitar  seu  uso.  Estamos  confiantes  que  essas  orientações 
facilitarão  o  uso  das  técnicas.  A  terceira  mudança  impor¬ 
tante  no  texto  é  uma  expansão  substancial  na  cobertura 
de  modelagem  de  equações  estruturais.  Agora  temos  três 
capítulos  sobre  essa  técnica  cada  vez  mais  importante.  O 
Capítulo  10  apresenta  uma  visão  geral  de  modelagem  de 
equações  estruturais,  o  Capítulo  11  se  concentra  na  análi¬ 
se  fatorial  confirmatória  e  o  Capítulo  12  aborda  questões 
sobre  o  teste  de  modelos  estruturais.  Esses  três  capítulos 
fornecem  uma  abrangente  introdução  a  essa  técnica. 
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O  QUE  FOI  AMPLIADO 
E  ATUALIZADO 

Todos  os  capítulos  foram  revisados  para  incorporar  avan¬ 
ços  tecnológicos,  e  diversos  passaram  por  alterações  signi¬ 
ficativas.  O  Capítulo  5,  “Análise  discriminante  múltipla  e 
regressão  logística”,  fornece  uma  cobertura  completa  da 
análise  de  variáveis  dependentes  categóricas,  incluindo 
a  análise  discriminante  e  a  regressão  logística.  Uma  dis¬ 
cussão  ampliada  de  regressão  logística  inclui  um  exemplo 
ilustrativo  usando  a  base  de  dados  HBAT.  O  Capítulo  7, 
“Análise  conjunta”,  revisa  aspectos  do  planejamento  de 
pesquisa,  concentrando-se  no  desenvolvimento  dos  estí¬ 
mulos  conjuntos  de  maneira  concisa  e  direta.  Finalmente, 
os  Capítulos  10  a  12,  sobre  modelagem  de  equações  es¬ 
truturais,  foram  atualizados  e  ampliados  para  refletirem 
as  inúmeras  mudanças  na  área  nos  últimos  anos.  Cada 
capítulo  contém  também  diversos  tópicos  expandidos  e 
análises  de  exemplos,  como  o  teste  de  modelos  fatoriais 
de  ordem  superior,  modelos  de  grupos  e  variáveis  mode¬ 
radoras  e  mediadoras. 

Um  importante  desenvolvimento  foi  a  criação  de  um 
site  (www.prenhall.com/hair)  dedicado  à  análise  multi- 
variada,  intitulado  Great  Ideas  in  Teaching  Multivariate 
Statistics.  Esse  site  (em  inglês)  atua  como  um  centro  de 
recursos  para  os  interessados  em  análise  multivariada, 
fornecendo  links  para  recursos  de  cada  técnica  e  um 
fórum  para  a  identificação  de  novos  tópicos  ou  méto¬ 
dos  estatísticos.  Desse  modo,  podemos  fornecer  mais 
prontamente  um  retorno  a  pesquisadores,  em  vez  de 
eles  terem  que  esperar  por  uma  nova  edição  do  livro. 
Também  planejamos  o  site  para  que  sirva  como  um  am¬ 
biente  para  materiais  de  ensino  em  estatística  multiva¬ 
riada  -  fornecendo  exercícios,  base  de  dados,  e  idéias 
de  projetos. 

Todas  essas  mudanças,  bem  como  outras  não  men¬ 
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CAPITULO 


Introdução 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Explicar  o  que  é  análise  multivariada  e  quando  sua  aplicação  é  adequada. 

■  Discutir  a  natureza  das  escalas  de  medida  e  sua  relação  com  técnicas  multivariadas. 

■  Compreender  a  natureza  do  erro  de  medida  e  seu  impacto  na  análise  multivariada. 

■  Determinar  qual  técnica  multivariada  é  apropriada  para  um  problema  específico  de  pesquisa. 

■  Definir  as  técnicas  específicas  incluídas  na  análise  multivariada. 

■  Discutir  as  orientações  para  a  aplicação  e  interpretação  da  análise  multivariada 

■  Compreender  a  abordagem  em  seis  etapas  para  a  construção  de  um  modelo  multivariado. 


Apresentação  do  capítulo 

0  Capítulo  1  apresenta  uma  visão  geral  simplificada  da  análise  multivariada.  Enfatiza  que  os  métodos 
de  análise  multivariada  irão  influenciar  cada  vez  mais  não  apenas  os  aspectos  analíticos  de  pesquisa, 
mas  também  o  planejamento  e  a  abordagem  da  coleta  de  dados  para  tomada  de  decisões  e  resolução 
de  problemas.  Apesar  de  as  técnicas  multivariadas  terem  muitas  características  em  comum  com  suas 
contrapartes  univariada  e  bivariada,  várias  diferenças  importantes  surgem  na  transição  para  uma  aná¬ 
lise  multivariada.  Para  ilustrar  essa  transição,  este  capítulo  apresenta  uma  classificação  das  técnicas 
multivariadas.  Em  seguida,  fornece  linhas  gerais  para  a  aplicação  dessas  técnicas,  bem  como  uma 
abordagem  estruturada  para  a  formulação,  estimação  e  interpretação  dos  resultados  multivariados. 
O  capítulo  conclui  com  uma  discussão  das  bases  de  dados  utilizadas  ao  longo  do  livro  para  ilustrar  a 
aplicação  das  técnicas. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque  e  as  referências  cruzadas  nos 
termos-chave  estão  em  itálico.  Exemplos  ilustrativos  apare¬ 
cem  em  quadros. 

Alfa  (a)  Ver  Erro  Tipo  I. 

Análise  multivariada  nálise  de  múltiplas  variáveis  em  um  único 
relacionamento  ou  conjunto  de  relações. 

Análise  univariada  de  variância  (ANOVA)  f^cnica  esta|ísticat 

ípara  flelermlnar,  com  teásé~em  uma  metiUaã^aeiehfféTfèTsef 

amostras  são  oriundas  de  populações  com  médiasigTrãTS. 


Beta  (b)  Ver  Erro  Tipo  II. 

Bootstrapping  Uma  abordagem  para  validar  um  modelo  mul¬ 
tivariado  extraindo-se  um  grande  número  de  sub-amostras  e 
estimando  modelos  para  cada  uma  delas.  Estimativas  a  par¬ 
tir  de  todas  as  sub-amostras  são  combinadas  em  seguida, 
fornecendo  não  apenas  os  “melhores”  coeficientes  estimados 
(por  exemplo,  médias  de  cada  coeficiente  estimado  ao  longo 
de  todos  os  modelos  das  sub-amostras),  mas  também  sua 
variabilidade  esperada  e,  assim,  sua  probabilidade  de  dife¬ 
renciar  do  zero;  ou  seja,  os  coeficientes  estimados  são  esta¬ 
tisticamente  diferentes  de  zero  ou  não?  Essa  abordagem  não 
depende  de  suposições  estatísticas  sobre  a  população  para 
avaliar  significância  estatística,  mas,  ao  invés  disso,  faz  sua 
avaliação  baseada  somente  nos  dados  amostrais. 
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Confiabilidade  Extensão  em  que  uma  variável  ou  um  conjunto 
de  variáveis  é  consistente  com  o  que  se  pretende  medir.  Se 
medidas  repetidas  forem  executadas,  as  medidas  confiáveis 
serão  consistentes  em  seus  valores.  É  diferente  de  validade, 
por  se  referir  não  ao  que  deveria  ser  medido,  mas  ao  modo 
como  é  medido. 

Correlação  parcial  bivariada  Correlação  simples  (duas  variá¬ 
veis)  entre  dois  conjuntos  de  resíduos  (variâncias  não  expli¬ 
cadas)  que  permanecem  depois  que  a  associação  de  outras 
variáveis  independentes  é  removida. 

Dados  métricos  Também  chamados  de  dados  quantitativos, 
dados  intervalares  ou  dados  proporcionais,  essas  medidas 
identificam  ou  descrevem  indivíduos  (ou  objetos)  não  ape¬ 
nas  pela  posse  de  um  atributo,  mas  também  pela  quantia 
ou  grau  em  que  o  indivíduo  pode  ser  caracterizado  pelo  atri¬ 
buto.  Por  exemplo,  a  idade  ou  o  peso  de  alguém  são  dados 
métricos. 

Dados  não-métricos  Também  chamados  de  dados  qualitativos, 
são  atributos,  características  ou  propriedades  categóricas 
que  identificam  ou  descrevem  um  indivíduo  ou  objeto.  Dife¬ 
rem  dos  dados  métricos  no  sentido  de  indicarem  a  presença 
de  um  atributo,  mas  não  a  quantia.  Exemplos  são  ocupações 
(médico,  advogado,  professor)  ou  status  do  comprador  (com¬ 
prador,  não-comprador).  São  também  conhecidos  como  da¬ 
dos  nominais  ou  dados  ordinais. 

Erro  de  especificação  Omissão  de  uma  variável-chave  da  aná¬ 
lise,  que  causa  um  impacto  sobre  os  efeitos  estimados  de  va¬ 
riáveis  incluídas. 

Erro  de  medida  Imprecisão  na  mensuração  dos  valores  “verda¬ 
deiros”  das  variáveis  devido  á  falibilidade  do  instrumento  de 
medida  (ou  seja,  escalas  de  respostas  inapropriadas),  erros 
na  entrada  de  dados,  ou  enganos  dos  respondentes. 

Erro  Tipo  I  Probabilidade  de  rejeitar  incorretamente  a  hipótese 
nula  -  na  maioria  dos  casos,  isso  significa  dizer  que  existe 
uma  diferença  ou  correlação  quando,  na  verdade,  não  é  o 
caso.  Também  chamado  de  alfa  (a).  Níveis  comuns  são  5% 
ou  1%,  chamados  de  níveis  0,05  ou  0,01 ,  respectivamente. 

Erro  Tipo  II  Probabilidade  de  falhar  incorretamente  na  rejeição 
da  hipótese  nula  -  em  termos  simples,  a  probabilidade  de  não 
encontrar  uma  correlação  ou  diferença  na  média  quando  ela 
existe.  Também  chamado  de  beta  ((3),  está  inversamente  re¬ 
lacionado  ao  erro  Tipo  I.  O  valor  1  menos  o  erro  Tipo  II  (1 -(3)  é 
definido  como  poder. 

Escalas  múltiplas  Método  de  combinação  de  diversas  variá¬ 
veis  que  medem  o  mesmo  conceito  em  uma  única  variável 
como  tentativa  de  aumentar  a  confiabilidade  da  medida  por 
meio  de  medida  multivariada.  Na  maioria  dos  exemplos,  as 
variáveis  separadas  são  somadas,  e  em  seguida  seu  escore 
total  ou  médio  é  usado  na  análise. 

Indicador  Variável  única  utilizada  em  conjunção  com  uma  ou 
mais  variáveis  diferentes  para  formar  uma  medida  composta. 

Medida  composta  Ver  Escala  múltipla. 

Medida  multivariada  Uso  de  duas  ou  mais  variáveis  como  in¬ 
dicadores  de  uma  única  medida  composta.  Por  exemplo,  um 
teste  de  personalidade  pode  fornecer  as  respostas  a  diversas 
questões  individuais  (indicadores),  as  quais  são  então  com¬ 


binadas  para  formar  um  escore  único  (escala  múltipla),  que 
representa  o  tipo  de  personalidade. 

Multicolinearidade  Extensão  em  que  uma  variável  pode  ser 
explicada  pelas  outras  variáveis  na  análise.  À  medida  que 
a  multicolinearidade  aumenta,  fica  mais  complicada  a  inter¬ 
pretação  da  variável  estatística,  uma  vez  que  se  torna  mais 
difícil  verificar  o  efeito  de  qualquer  variável,  devido  a  suas 
inter-relações. 

Poder  Probabilidade  de  rejeitar  corretamente  a  hipótese  nula 
quando  a  mesma  é  falsa,  ou  seja,  de  encontrar  corretamente  um 
suposto  relacionamento  quando  ele  existe.  Determinado  como 
uma  função  (1)  do  nível  de  significância  estatística  dado  pelo 
pesquisador  para  um  erro  Tipo  1(a),  (2)  do  tamanho  da  amostra 
utilizada  na  análise,  e  (3)  do  tamanho  do  efeito  examinado. 

Significância  prática  Método  de  avaliar  resultados  da  análise 
multivariada  baseado  em  suas  descobertas  substanciais,  em 
vez  de  sua  significância  estatística.  Enquanto  a  significância 
estatística  determina  se  o  resultado  pode  ser  atribuído  ao 
acaso,  a  significância  prática  avalia  se  o  resultado  é  útil  (isto 
é,  substancial  o  bastante  para  garantir  ação)  para  atingir  os 
objetivos  da  pesquisa. 

Tamanho  do  efeito  Estimativa  do  grau  em  que  o  fenômeno  es¬ 
tudado  (por  exemplo,  correlação  ou  diferença  em  médias) 
existe  na  população. 

Técnica  de  dependência  Classificação  de  técnicas  estatísticas 
diferenciadas  por  terem  uma  variável  ou  um  conjunto  de  va¬ 
riáveis  identificado  como  a(s)  variávei(eis)  dependente(s),  e 
a(s)  variável(eis)  remanescente(s)  como  independente(s).  O 
objetivo  é  a  previsão  da(s)  variável(eis)  dependente(s)  pela(s) 
variável(eis)  independente(s).  Um  exemplo  é  a  análise  de  re¬ 
gressão. 

Técnica  de  interdependência  Classificação  de  técnicas  esta¬ 
tísticas  nas  quais  as  variáveis  não  são  divididas  em  conjuntos 
dependentes  e  independentes-,  ou  seja,  todas  as  variáveis 
são  analisadas  como  um  único  conjunto  (por  exemplo,  análise 
fatorial). 

Tratamento  Variável  independente  que  o  pesquisador  ma¬ 
nipula  para  ver  o  efeito  (se  houver)  sobre  a(s)  variável(eis) 
dependente(s),  como  em  um  experimento  (por  exemplo,  o 
teste  do  apelo  de  anúncios  coloridos  versus  preto-e-branco). 

Validade  Extensão  em  que  uma  medida  ou  um  conjunto  de  me¬ 
didas  representa  corretamente  o  conceito  do  estudo  -  o  grau 
em  que  se  está  livre  de  qualquer  erro  sistemático  ou  não-ale¬ 
atório.  A  validade  se  refere  a  quão  bem  o  conceito  é  definido 
pela(s)  medida(s),  enquanto  confiabilidade  se  refere  á  consis¬ 
tência  da(s)  medida(s). 

Variável  dependente  Efeito  presumido,  ou  resposta,  a  uma  mu¬ 
dança  na(s)  variável(eis)  independente  (s). 

Variável  dicotômica  Variável  não-métrica  transformada  em  uma 
variável  métrica  designando-se  1  ou  0  a  um  objeto,  depen¬ 
dendo  se  este  possui  ou  não  uma  característica  particular. 

Variável  estatística  Combinação  linear  de  variáveis  formada  na 
técnica  multivariada  determinando-se  pesos  empíricos  aplica¬ 
dos  a  um  conjunto  de  variáveis  especificado  pelo  pesquisador. 

Variável  independente  Causa  presumida  de  qualquer  mudan¬ 
ça  na  variável  dependente. 
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O  QUE  É  ANÁLISE  MULTIVARIADA? 

Hoje  em  dia  negócios  devem  ser  mais  lucrativos,  reagir 
mais  rapidamente  e  oferecer  produtos  e  serviços  de  maior 
qualidade,  e  ainda  fazer  tudo  isso  com  menos  pessoas  e  a 
um  menor  custo.  Uma  exigência  essencial  nesse  proces¬ 
so  é  a  criação  e  o  gerenciamento  de  conhecimento  eficaz. 
Não  há  falta  de  informação,  mas  escassez  de  conhecimen¬ 
to.  Como  disse  Tom  Peters  em  seu  livro  Thriving  on  Chã¬ 
os,  “Estamos  nos  afogando  em  informações  e  famintos 
por  conhecimento”  [7]. 

A  informação  disponível  na  tomada  de  decisões  ex¬ 
plodiu  nos  últimos  anos  e  irá  continuar  assim  no  futuro, 
provavelmente  até  mais  rapidamente.  Até  recentemente, 
muito  dessa  informação  simplesmente  desaparecia.  Ou 
não  era  coletada,  ou  era  descartada.  Hoje,  essa  informa¬ 
ção  está  sendo  coletada  e  armazenada  em  bancos  de  da¬ 
dos  e  está  disponível  para  ser  feita  a  “garimpagem”  para 
fins  de  melhoria  na  tomada  de  decisões.  Parte  dessa  infor¬ 
mação  pode  ser  analisada  e  compreendida  com  estatística 
simples,  mas  uma  grande  porção  demanda  técnicas  esta¬ 
tísticas  multivariadas  mais  complexas  para  converter  tais 
dados  em  conhecimento. 

Diversos  avanços  tecnológicos  nos  ajudam  a  aplicar 
técnicas  multivariadas.  Entre  os  mais  importantes  estão 
os  desenvolvimentos  de  hardware  e  software.  A  veloci¬ 
dade  e  o  custo  de  equipamento  computacional  têm  do¬ 
brado  a  cada  18  meses,  enquanto  os  preços  despencam. 
Pacotes  computacionais  amigáveis  trouxeram  a  análise  de 
dados  para  a  era  do  aponte-e-clique,  e  podemos  rapida¬ 
mente  analisar  montanhas  de  dados  complexos  com  rela¬ 
tiva  facilidade.  De  fato,  a  indústria,  governos  e  centros  de 
pesquisa  ligados  a  universidades  por  todo  o  mundo  estão 
fazendo  amplo  uso  dessas  técnicas. 

Ao  longo  do  texto,  usamos  o  termo  genérico  pesquisa¬ 
dor  quando  nos  referimos  a  um  analista  de  dados  no  âm¬ 
bito  das  comunidades  acadêmica  ou  profissional.  Acha¬ 
mos  inadequado  fazer  qualquer  distinção  entre  essas  duas 
áreas,  pois  a  pesquisa  em  ambas  se  sustenta  em  bases  tan¬ 
to  teóricas  quanto  quantitativas.  A  despeito  dos  objetivos 
da  pesquisa  e  a  ênfase  em  interpretação  poderem  variar, 
um  pesquisador  de  qualquer  área  deve  abordar  todas  as 
questões  conceituais  e  empíricas  levantadas  nas  discus¬ 
sões  dos  métodos  estatísticos. 


ANÁLISE  MULTIVARIADA  EM 
TERMOS  ESTATÍSTICOS 

Técnicas  de  análise  multivariada  são  populares  porque 
elas  permitem  que  organizações  criem  conhecimento,  me¬ 
lhorando  assim  suas  tomadas  de  decisões.  Análise  multi¬ 
variada  se  refere  a  todas  as  técnicas  estatísticas  que  simul¬ 
taneamente  analisam  múltiplas  medidas  sobre  indivíduos 
ou  objetos  sob  investigação.  Assim,  qualquer  análise  si¬ 


multânea  de  mais  do  que  duas  variáveis  pode  ser  conside¬ 
rada,  a  princípio,  como  multivariada. 

Muitas  técnicas  multivariadas  são  extensões  da  análise 
univariada  (análises  de  distribuições  de  uma  única  variá¬ 
vel)  e  da  análise  bivariada  (classificação  cruzada,  correla¬ 
ção,  análise  de  variância,  e  regressão  simples  usadas  para 
analisar  duas  variáveis).  Por  exemplo,  regressão  simples 
(com  uma  variável  preditora)  é  estendida  no  caso  multiva- 
riado  para  incluir  diversas  variáveis  preditoras.  Analoga¬ 
mente,  a  variável  dependente  única  encontrada  na  análise 
de  variância  é  estendida  para  incluir  múltiplas  variáveis  de¬ 
pendentes  em  análise  multivariada  de  variância.  Algumas 
técnicas  multivariadas  (por  exemplo,  regressão  múltipla 
ou  análise  multivariada  de  variância)  fornecem  um  meio 
de  executar  em  uma  única  análise  aquilo  que  antes  exigia 
múltiplas  análises  univariadas  para  ser  realizado.  Outras 
técnicas  multivariadas,  não  obstante,  são  exclusivamente 
planejadas  para  lidar  com  aspectos  multivariados,  como  a 
análise  fatorial,  que  identifica  a  estrutura  inerente  a  um 
conjunto  de  variáveis,  ou  a  análise  discriminante,  que  dis¬ 
tingue  entre  grupos  baseada  em  um  conjunto  de  variáveis. 

As  vezes  ocorrem  confusões  sobre  o  que  é  análise 
multivariada  porque  o  termo  não  é  empregado  consisten¬ 
temente  na  literatura.  Alguns  pesquisadores  usam  multi¬ 
variada  simplesmente  para  se  referirem  ao  exame  de  rela¬ 
ções  entre  mais  de  duas  variáveis.  Outros  utilizam  o  termo 
para  problemas  nos  quais  todas  as  múltiplas  variáveis  são 
assumidas  como  tendo  uma  distribuição  normal  multi¬ 
variada.  Porém,  para  ser  considerada  verdadeiramente 
multivariada,  todas  as  variáveis  devem  ser  aleatórias  e 
inter-relacionadas  de  tal  maneira  que  seus  diferentes  efei¬ 
tos  não  podem  ser  significativamente  interpretados  em 
separado.  Alguns  autores  estabelecem  que  o  objetivo  da 
análise  multivariada  é  medir,  explicar  e  prever  o  grau  de 
relação  entre  variáveis  estatísticas  (combinações  pondera¬ 
das  de  variáveis).  Assim,  o  caráter  multivariado  reside  nas 
múltiplas  variáveis  estatísticas  (combinações  múltiplas  de 
variáveis),  e  não  somente  no  número  de  variáveis  ou  ob¬ 
servações.  Para  os  propósitos  deste  livro,  não  insistimos 
em  uma  definição  rígida  para  análise  multivariada.  No 
lugar  disso,  a  análise  multivariada  incluirá  tanto  técnicas 
com  muitas  variáveis  quanto  técnicas  verdadeiramente 
multivariadas,  pois  acreditamos  que  o  conhecimento  de 
técnicas  com  muitas  variáveis  é  um  primeiro  passo  essen¬ 
cial  no  entendimento  da  análise  multivariada. 


ALGUNS  CONCEITOS  BÁSICOS 
DE  ANÁLISE  MULTIVARIADA 

Apesar  de  a  análise  multivariada  ter  suas  raízes  nas  estatís¬ 
ticas  univariada  e  bivariada,  a  extensão  para  o  domínio  mul¬ 
tivariado  introduz  conceitos  adicionais  e  questões  que  têm 
particular  relevância.  Esses  conceitos  variam  da  necessida¬ 
de  de  uma  compreensão  conceituai  do  constructo  da  análise 
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multivariada  -  a  variável  estatística  -  até  pontos  específicos 
que  lidam  com  os  tipos  de  escalas  de  medida  empregadas  e 
as  questões  estatísticas  de  testes  de  significância  e  níveis  de 
confiança.  Cada  conceito  tem  um  papel  significativo  na  apli¬ 
cação  bem-sucedida  de  qualquer  técnica  multivariada. 

A  variável  estatística 

Como  anteriormente  mencionado,  o  constructo  da  análi¬ 
se  multivariada  é  a  variável  estatística,  uma  combinação 
linear  de  variáveis  com  pesos  empiricamente  determina¬ 
dos.  As  variáveis  são  especificadas  pelo  pesquisador,  sen¬ 
do  os  pesos  determinados  pela  técnica  multivariada  para 
atingir  um  objetivo  específico.  Uma  variável  estatística  de 
n  variáveis  ponderadas  (Xj  até  X„)  pode  ser  enunciada 
matematicamente  como: 

Valor  da  variável  estatística  =  tVjXj  +  +  W3X3  H —  +  H'„X„ 

onde  X„  é  a  variável  observada  e  é  o  peso  determinado 
pela  técnica  multivariada. 

O  resultado  é  um  único  valor  que  representa  uma  com¬ 
binação  do  conjunto  inteiro  de  variáveis  que  melhor  atinge 
o  objetivo  da  análise  multivariada  específica.  Em  regres¬ 
são  múltipla,  a  variável  estatística  é  determinada  de  modo 
a  maximizar  a  correlação  entre  as  variáveis  independentes 
múltiplas  e  a  única  variável  dependente.  Em  análise  dis¬ 
criminante,  a  variável  estatística  é  formada  de  maneira  a 
criar  escores  para  cada  observação  que  diferencie  de  for¬ 
ma  máxima  entre  grupos  de  observações.  Em  análise  fato¬ 
rial,  variáveis  estatísticas  são  formadas  para  melhor  repre¬ 
sentarem  a  estrutura  subjacente  ou  padrões  das  variáveis 
conforme  representadas  por  suas  intercorrelações. 

Em  cada  caso,  a  variável  estatística  captura  o  caráter 
multivariado  da  análise.  Assim,  em  nossa  discussão  de 
cada  técnica,  a  variável  estatística  é  o  ponto  focal  da  aná¬ 
lise  em  muitos  aspectos.  Devemos  compreender  não  ape¬ 
nas  seu  impacto  coletivo  em  satisfazer  o  objetivo  da  técni¬ 
ca,  mas  também  a  contribuição  de  cada  variável  separada 
para  o  efeito  geral  da  variável  estatística. 

Escalas  de  medida 

A  análise  de  dados  envolve  a  identificação  e  a  medida 
de  variação  em  um  conjunto  de  variáveis,  seja  entre  elas 
mesmas  ou  entre  uma  variável  dependente  e  uma  ou  mais 
variáveis  independentes.  A  palavra-chave  aqui  é  medida, 
pois  o  pesquisador  não  pode  identificar  variação  a  menos 
que  ela  possa  ser  medida.  A  mensuração  é  importante  para 
representar  com  precisão  o  conceito  de  interesse,  e  é  ins¬ 
trumental  na  seleção  do  método  multivariado  apropriado 
para  análise.  Dados  podem  ser  classificados  em  uma  entre 
duas  categorias  -  não-métricos  (qualitativos)  e  métricos 
(quantitativos)  -  baseadas  no  tipo  de  atributos  ou  caracte¬ 
rísticas  que  os  dados  representam.  E  importante  observar 
que  é  responsabilidade  do  pesquisador  definir  o  tipo  de 
medida  para  cada  variável.  Para  o  computador,  os  valores 


são  apenas  números,  mas,  como  perceberemos  na  próxima 
seção,  definir  dados  como  métricos  ou  não-métricos  tem 
substancial  impacto  sobre  o  que  os  dados  podem  represen¬ 
tar  e  como  eles  podem  ser  analisados. 

Escalas  de  medida  não-métrica 

Medidas  qu^^screvem  çUífereneas  em  tipo  ou  natureza,) 
Indicando  a  presença  ou  ausência  de  uma  cara0EefíslÍcã  ou  ; 
propriedade,  são  chamadas  de  dados  não-métricos.  Essas 
propriedades  são  discretas  no  sentido  de  que,  tendo  uma 
característica  particular,  todas  as  demais  características 
são  excluídas;  por  exemplo,  se  uma  pessoa  é  do  sexo  mas¬ 
culino,  não  pode  ser  do  sexo  feminino.  Uma  “quantia” 
de  sexo  não  é  viável,  mas  apenas  o  estado  de  ser  do  sexo 
masculino  ou  feminino.  Medidas  não-métricas  podem  ser 
feitas  com  uma  escala  nominal  ou  ordinal. 

Escalas  nominais.  Uma  escala  nominal  designa  números 
para  rotular  ou  identificar  indivíduos  ou  objetos.  Os  nú¬ 
meros  designados  aos  objetos  não  têm  significado  quanti¬ 
tativo  além  da  indicação  da  presença  ou  ausência  do  atri¬ 
buto  ou  característica  sob  investigação.  Portanto,  escalas 
nominais,  também  conhecidas  como  escalas  categóricas, 
só  podem  fornecer  o  número  de  ocorrências  em  cada  clas¬ 
se  ou  categoria  da  variável  sob  estudo. 


Por  exemplo,  ao  representar  sexo  (masculino  ou  femini¬ 
no),  o  pesquisador  pode  designar  números  para  cada  ca¬ 
tegoria  (por  exemplo,  2  para  mulheres  e  1  para  homens). 
Com  esses  valores,  contudo,  podemos  apenas  tabular  o 
número  de  homens  e  de  mulheres;  carece  de  sentido  o 
cálculo  de  valor  médio  de  sexo. 


Dados  nominais  representam  somente  categorias  ou 
classes,  e  não  implicam  quantias  de  um  atributo  ou  ca¬ 
racterística.  Exemplos  freqüentemente  usados  de  dados 
nominalmente  escalonados  incluem  diversos  atributos  de¬ 
mográficos  (como  sexo,  religião,  ocupação  ou  filiação  par¬ 
tidária),  muitas  formas  de  comportamento  (como  com¬ 
portamento  de  voto  ou  atividade  de  compra),  ou  qualquer 
outra  ação  que  seja  discreta  (que  acontece  ou  não). 

Escalas  ordinais.  Escalas  ordinais  são  o  próximo  nível 
“superior”  de  precisão  em  medida.  No  caso  de  escalas  or¬ 
dinais,  variáveis  podem  ser  ordenadas  ou  ranqueadas  em 
relação  à  quantia  do  atributo  possuída.  Todo  indivíduo  ou 
objeto  pode  ser  comparado  com  outro  em  termos  de  uma 
relação  da  forma  “maior  que”  ou  “menor  que”.  Os  nú¬ 
meros  empregados  em  escalas  ordinais,  contudo,  são  real¬ 
mente  não-quantitativos  porque  eles  indicam  apenas  po¬ 
sições  relativas  em  uma  série  ordenada.  Escalas  ordinais 
não  fornecem  qualquer  medida  da  quantia  ou  magnitude 
real  em  termos  absolutos,  mas  apenas  a  ordem  dos  valo¬ 
res.  O  pesquisador  conhece  a  ordem,  mas  não  a  quantia 
de  diferença  entre  os  valores. 
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Por  exemplo,  diferentes  níveis  de  satisfação  de  um  con¬ 
sumidor  em  relação  a  diversos  novos  produtos  podem 
ser  ilustrados  primeiramente  usando-se  uma  escala  or¬ 
dinal.  A  escala  a  seguir  mostra  a  opinião  de  um  respon- 
dente  sobre  três  produtos. 

Produto  A  Produto  B  Produto  C 


Muito  satisfeito  Nada  satisfeito 

Quando  medimos  essa  variável  com  uma  escala  or¬ 
dinal,  “ranqueamos  a  ordem”  dos  produtos  baseados  no 
nível  de  satisfação.  Queremos  uma  medida  que  reflita 
que  o  respondente  está  mais  satisfeito  com  o  produto  A 
do  que  com  o  produto  B  e  mais  satisfeito  com  o  produto 
B  do  que  com  o  produto  C,  baseados  apenas  em  suas  po¬ 
sições  na  escala.  Poderíamos  designar  valores  de  “ordem 
de  ranqueamento”  (1  =  mais  satisfeito,  2  =  o  próximo 
mais  satisfeito  etc.)  de  1  para  o  produto  A  (maior  satis¬ 
fação),  2  para  o  produto  B,  e  3  para  o  produto  C. 

Quando  vistos  como  dados  ordinais,  sabemos  que  o 
produto  A  tem  a  maior  satisfação,  seguido  pelo  produto 
B  e  então  pelo  produto  C.  No  entanto,  não  podemos  fa¬ 
zer  qualquer  declaração  quantitativa  sobre  as  diferenças 
entre  produtos  (p.  ex.,  não  podemos  responder  se  a  dife¬ 
rença  entre  produtos  A  e  B  é  maior  do  que  a  diferença 
entre  os  produtos  B  e  C).  Temos  que  usar  uma  escala 
intervalar  (ver  próxima  seção)  para  avaliar  qual  é  a  mag¬ 
nitude  de  diferenças  entre  produtos. 


Em  muitos  casos,  um  pesquisador  pode  achar  atraente 
o  uso  de  medidas  ordinais,  mas  as  implicações  sobre  os  ti¬ 
pos  de  análises  que  podem  ser  executadas  são  substanciais. 
O  analista  não  pode  realizar  nenhuma  operação  aritméti¬ 
ca  (somas,  médias,  multiplicações,  divisões  etc.),  tornan¬ 
do  assim  todos  os  dados  não-métricos  bastante  limitados 
em  seu  uso  na  estimação  de  coeficientes  do  modelo.  Por 
esse  motivo,  muitas  técnicas  multivariadas  são  desenvol¬ 
vidas  apenas  para  lidar  com  dados  não-métricos  (p.  ex., 
análise  de  correspondência)  ou  para  empregar  dados  não- 
métricos  como  uma  variável  independente*  (p.  ex.,  análise 
discriminante  com  uma  variável  dependente  não-métrica, 
ou  análise  multivariada  de  variância  com  variáveis  inde¬ 
pendentes  não-métricas).  Logo,  o  analista  deve  identificar 
todos  os  dados  não-métricos  para  garantir  que  eles  sejam 
utilizados  adequadamente  nas  técnicas  multivariadas. 

Escalas  de  medida  métrica 

Em  contraste  com  dados  não-métricos,  dados  métricos 
são  utilizados  quando  indivíduos  diferem  em  quantia  ou 
grau  em  relação  a  um  atributo  em  particular.  Variáveis 


*  N.  de  R.T.:  A  frase  certa  seria  “como  uma  variável  dependente  ou 
independente”. 


metricamente  medidas  refletem  quantidade  ou  grau  rela¬ 
tivo  e  são  apropriadas  para  atributos  envolvendo  quantia 
ou  magnitude,  como  o  nível  de  satisfação  ou  compromisso 
com  um  emprego.  As  duas  escalas  de  medida  métrica  são 
as  escalas  intervalares  e  de  razão. 

Escalas  intervalares.  As  escalas  intervalares  e  escalas 
de  razão  (ambas  métricas)  fornecem  o  mais  alto  nível  de 
precisão  de  medida,  permitindo  que  quase  todas  as  ope¬ 
rações  matemáticas  sejam  executadas.  Essas  duas  escalas 
têm  unidades  constantes  de  medida,  e,  portanto,  diferen¬ 
ças  entre  quaisquer  dois  pontos  adjacentes  em  qualquer 
parte  da  escala  são  iguais. 


No  exemplo  anterior  de  medida  de  satisfação,  dados  mé¬ 
tricos  poderiam  ser  obtidos  medindo-se  a  distância  de  um 
extremo  da  escala  até  a  posição  de  cada  produto.  Consi¬ 
dere  que  o  produto  A  estava  a  2,5  unidades  do  extremo 
esquerdo,  que  o  produto  B  estava  a  6,0  unidades,  e  que 
o  produto  C  estava  a  12  unidades.  Usando  esses  valores 
como  medida  de  satisfação,  poderíamos  não  apenas  fazer 
as  mesmas  declarações  que  fizemos  com  os  dados  ordi¬ 
nais  (p.  ex.,  a  ordem  de  ranqueamento  dos  produtos),  mas 
poderíamos  também  perceber  que  a  diferença  entre  os 
produtos  A  e  B  era  muito  menor  (6,0  -  2,5  =  3,5)  do  que  a 
diferença  entre  os  produtos  B  e  C  (12,0  -  6,0  =  6,0). 


A  única  diferença  real  entre  escalas  intervalares  e  es¬ 
calas  de  razão  é  que  as  primeiras  têm  um  ponto  zero  arbi¬ 
trário,  enquanto  as  escalas  de  razão  incluem  um  ponto  de 
zero  absoluto.  As  escalas  intervalares  mais  familiares  são 
as  escalas  de  temperatura  Fahrenheit  e  Celsius.  Cada  uma 
tem  um  ponto  zero  arbitrário  diferente,  e  nenhuma  indica 
uma  quantia  nula  ou  ausência  de  temperatura,  já  que  pode¬ 
mos  registrar  temperaturas  abaixo  do  ponto  zero  em  ambas. 
Logo,  não  é  possível  dizer  que  qualquer  valor  em  uma  esca¬ 
la  intervalar  é  um  múltiplo  de  algum  outro  ponto  da  escala. 


Por  exemplo,  não  se  pode  considerar  que  um  dia  de  80°F 
tem  o  dobro  de  temperatura  de  um  dia  de  40°F,  pois  sa¬ 
bemos  que  80°F,  em  uma  escala  diferente,  como  Celsius, 
é  26,7°C.  Do  mesmo  modo,  40°F  em  Celsius  é  4,4°C. 
Apesar  de  80°F  ser  de  fato  o  dobro  de  40°F,  não  pode¬ 
mos  afirmar  que  o  calor  de  80°F  é  o  dobro  do  calor  de 
40°F,  já  que,  usando  diferentes  escalas,  o  calor  não  tem  o 
dobro  da  intensidade,  isto  é,  4,4°C  26,7°C. 


Escalas  de  razão.  As  escalas  de  razão  representam  a  mais 
elevada  forma  de  precisão  de  medida,  pois(possuem  as  van-) 
tagens  de  todas  as  escalas  inferiores  somadas  à  existência  de 
um  ponto  zero  absoluto.  Todas  as  operações  matemáticas 
são  possíveis  com  medidas  de  escala  de  razão.  As  balanças 
de  banheiros  ou  outros  aparelhos  comuns  para  medir  pesos 
são  exemplos  dessas  escalas,  pois  têm  um  ponto  zero  abso- 
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luto,  e  assim  podemos  falar  em  termos  de  múltiplos  quando 
relacionamos  um  ponto  da  escala  com  outro;  por  exemplo, 
100  libras  é  duas  vezes  o  peso  de  50  libras. 

O  impacto  na  escolha  da  escala  de  medida 

Compreender  os  diferentes  tipos  de  escalas  de  medida  é 
importante  por  duas  razões. 

1.  O  pesquisador  deve  identificar  a  escala  de  medida  de  cada 
variável  usada,  de  forma  que  dados  não-métricos  não  sejam 
incorretamente  usados  como  dados  métricos  e  vice-versa 
(como  em  nosso  exemplo  anterior  de  representação  de  sexo 
como  1  para  homem  e  2  para  mulher).  Se  o  pesquisador  in¬ 
corretamente  define  essa  medida  como  métrica,  então  ela 
pode  ser  empregada  inadequadamente  (p.  ex.,  encontrar  o 
valor  médio  de  sexo). 

2.  A  escala  de  medida  é  também  crítica  ao  determinar  quais 
técnicas  multivariadas  são  as  mais  aplicáveis  aos  dados,  com 
considerações  feitas  tanto  para  as  variáveis  independentes 
quanto  para  as  dependentes.  Na  discussão  sobre  as  técni¬ 
cas  e  sua  classificação  em  seções  apresentadas  mais  adiante 
neste  capítulo,  as  propriedades  métricas  e  não-métricas  de 
variáveis  independentes  e  dependentes  são  os  fatores  deter¬ 
minantes  na  escolha  da  técnica  apropriada. 

Erro  de  medida  e  medida  multivariada 

O  uso  de  variáveis  múltiplas  e  a  confiança  em  sua  com¬ 
binação  (a  variável  estatística)  em  técnicas  multivariadas 
também  concentra  a  atenção  em  uma  questão  comple¬ 
mentar  -  o  erro  de  medida.  Erro  de  medida  é  o  grau  em 
que  os  valores  observados  não  são  representativos  dos  va¬ 
lores  “verdadeiros”.  Há  muitas  fontes  para  erros  de  medi¬ 
da,  que  variam  desde  os  erros  na  entrada  de  dados  devido 
à  imprecisão  da  medida  (p.  ex.,  impor  escalas  com  sete 
pontos  para  medida  de  atitude  quando  o  pesquisador  sabe 
que  os  respondentes  podem  responder  precisamente  ape¬ 
nas  em  escalas  de  três  pontos)  até  a  falta  de  habilidade  dos 
respondentes  em  fornecerem  informações  precisas  (p.  ex., 
respostas  como  a  renda  familiar  podem  ser  razoavelmente 
corretas,  mas  raramente  exatas).  Assim,  todas  as  variáveis 
usadas  em  técnicas  multivariadas  devem  ser  consideradas 
como  tendo  um  certo  grau  de  erro  de  medida.  O  erro  de 
medida  acrescenta  “ruído”  às  variáveis  observadas  ou  me¬ 
didas.  Logo,  o  valor  observado  obtido  representa  tanto  o 
nível  “verdadeiro”  quanto  o  “ruído”.  Quando  usado  para 
computar  correlações  ou  médias,  o  efeito  “verdadeiro”  é 
parcialmente  mascarado  pelo  erro  de  medida,  causando 
um  enfraquecimento  nas  correlações  e  menor  precisão 
nas  médias.  O  impacto  específico  de  erro  de  medida  e  sua 
acomodação  em  relacionamentos  de  dependência  é  abor¬ 
dado  mais  detalhadamente  no  Capítulo  fO. 

Validade  e  confiabilidade 

O  objetivo  do  pesquisador  de  reduzir  o  erro  de  medida 
pode  seguir  diversos  caminhos.  Ao  avaliar  o  grau  de  erro 
presente  em  qualquer  medida,  o  pesquisador  deve  levar  em 
conta  duas  importantes  características  de  uma  medida: 


•  Validade  é  o  grau  em  que  uma  medida  representa  preci¬ 
samente  aquilo  que  se  espera.  Por  exemplo,  se  queremos 
medir  renda  discricionária,  não  devemos  perguntar  a  ren¬ 
da  familiar  total.  A  garantia  da  validade  começa  com  uma 
compreensão  direta  do  que  deve  ser  medido  e  então  realizar 
a  medida  tão  “correta”  e  precisa  quanto  possível.  No  entan¬ 
to,  valores  exatos  não  garantem  validade.  Em  nosso  exem¬ 
plo  de  renda,  o  pesquisador  poderia  definir  com  grande 
exatidão  o  que  é  renda  familiar,  mas  ainda  ter  uma  medida 
“errada”  (isto  é,  inválida)  de  renda  discricionária,  porque  a 
pergunta  “correta”  não  foi  formulada. 

•  Se  a  validade  está  garantida,  o  pesquisador  deve  ainda  consi¬ 
derar  a  confiabilidade  das  medidas.  Confiabilidade  é  o  grau 
em  que  a  variável  observada  mede  o  valor  “verdadeiro”  e 
está  “livre  de  erro”;  assim,  é  o  oposto  de  erro  de  medida. 
Se  a  mesma  medida  for  feita  repetidamente,  por  exemplo, 
medidas  mais  confiáveis  mostrarão  maior  consistência  do 
que  medidas  menos  confiáveis.  O  pesquisador  sempre  deve 
avaliar  as  variáveis  empregadas  e,  se  medidas  alternativas 
válidas  estão  disponíveis,  escolher  a  variável  com  a  maior 
confiabilidade. 

Emprego  de  medida  multivariada 

Além  de  reduzir  o  erro  de  medida  melhorando  variáveis 
individuais,  o  pesquisador  pode  também  escolher  o  de¬ 
senvolvimento  de  medidas  multivariadas,  também  conhe¬ 
cidas  como  escalas  múltiplas,  nas  quais  diversas  variáveis 
são  reunidas  em  uma  medida  composta  para  representar 
um  conceito  (p.  ex.,  escalas  de  personalidade  com  múlti¬ 
plos  itens,  ou  escalas  múltiplas  de  satisfação  com  um  pro¬ 
duto).  O  objetivo  é  evitar  o  uso  de  apenas  uma  variável 
para  representar  um  conceito  e,  ao  invés  disso,  usar  várias 
variáveis  como  indicadores,  todos  representando  diferen¬ 
tes  facetas  do  conceito  para  se  obter  uma  perspectiva  mais 
“ampla”.  O  uso  de  múltiplos  indicadores  permite  ao  pes¬ 
quisador  especificar  mais  precisamente  as  respostas  dese¬ 
jadas.  Não  deposita  total  confiança  em  uma  única  respos¬ 
ta,  mas  na  resposta  “média”  ou  “típica”  de  um  conjunto 
de  respostas  relacionadas. 


Por  exemplo,  ao  medir  satisfação,  poder-se-ia  perguntar 
simplesmente  “Quão  satisfeito  você  está?”  e  basear  a 
análise  nesta  única  resposta.  Ou  uma  escala  múltipla  po¬ 
deria  ser  desenvolvida  combinando  várias  respostas  de 
satisfação  (p.  ex.,  achar  o  escore  médio  entre  três  medi¬ 
das  -  satisfação  geral,  a  possibilidade  de  recomendação, 
e  a  probabilidade  de  novamente  comprar).  As  diferentes 
medidas  podem  estar  em  diferentes  formatos  de  respos¬ 
ta  ou  em  diferentes  áreas  de  interesse  assumidas  como 
abrangendo  satisfação  geral. 


A  premissa  guia  é  que  respostas  múltiplas  refletem  a 
resposta  “verdadeira”  com  maior  precisão  do  que  uma 
única  resposta.  Avaliação  de  confiabilidade  e  incorpora¬ 
ção  de  escalas  na  análise  são  métodos  que  o  pesquisador 
deve  empregar.  Para  uma  introdução  mais  detalhada  a 
modelos  de  múltiplas  medidas  e  construção  de  escalas,  ver 
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discussão  suplementar  no  Capítulo  3  (Análise  Fatorial)  e 
no  Capítulo  10  (Modelagem  de  Equações  Estruturais)  ou 
textos  adicionais  [8].  Além  disso,  compilações  de  escalas 
que  podem  fornecer  ao  pesquisador  uma  escala  “pronta 
para  usar”  com  confiabilidade  demonstrada  foram  publi¬ 
cadas  recentemente  [1,4]. 

O  impacto  do  erro  de  medida 

O  impacto  de  erro  de  medida  e  a  confiabilidade  ruim  não 
podem  ser  diretamente  percebidos,  uma  vez  que  estão  em¬ 
butidos  nas  variáveis  observadas.  Portanto,  o  pesquisador 
sempre  deve  trabalhar  para  aumentar  a  confiabilidade  e 
a  validade,  que  em  contrapartida  resultarão  em  uma  des¬ 
crição  mais  precisa  das  variáveis  de  interesse.  Resultados 
pobres  não  são  sempre  por  causa  de  erro  de  medida,  mas 
a  presença  de  erro  de  medida  certamente  distorce  as  rela¬ 
ções  observadas  e  torna  as  técnicas  multivariadas  menos 
poderosas.  Reduzir  erro  de  medida,  apesar  de  demandar 
esforço,  tempo  e  recursos  adicionais,  pode  melhorar  re¬ 
sultados  fracos  ou  marginais,  bem  como  fortalecer  resul¬ 
tados  demonstrados. 

Significância  estatística  versus  poder  estatístico 

Todas  as  técnicas  multivariadas,  exceto  análise  de  agru¬ 
pamentos  e  mapeamento  perceptual,  são  baseadas  na  in¬ 
ferência  estatística  dos  valores  ou  relações  entre  variáveis 
de  uma  população  a  partir  de  uma  amostra  aleatória  ex¬ 
traída  daquela  população.  Um  censo  da  população  inteira 
torna  a  inferência  estatística  desnecessária,  pois  qualquer 
diferença  ou  relação,  não  importa  quão  pequena,  é  “ver¬ 
dadeira”  e  existe.  Entretanto,  raramente,  ou  nunca,  um 
censo  é  realizado.  Logo,  o  pesquisador  é  obrigado  a  fazer 
inferências  a  partir  de  uma  amostra. 

Tipos  de  erro  estatístico  e  poder  estatístico 

Interpretar  inferências  estatísticas  requer  que  o  pesqui¬ 
sador  especifique  os  níveis  de  erro  estatístico  aceitáveis 
devido  ao  uso  de  uma  amostra  (conhecidos  como  erro 
amostrai).  A  abordagem  mais  comum  é  especificar  o  ní¬ 
vel  do  erro  Tipo  I,  também  conhecido  como  alfa  (a).  O 
erro  Tipo  1  é  a  probabilidade  de  rejeitar  a  hipótese  nula 
quando  a  mesma  é  verdadeira,  ou,  em  termos  simples,  a 
chance  de  o  teste  exibir  significância  estatística  quando  na 
verdade  esta  não  está  presente  -  o  caso  de  um  “positivo 
falso”.  Ao  especificar  um  nível  alfa,  o  pesquisador  estabe¬ 
lece  os  limites  permitidos  para  erro,  especificando  a  pro¬ 
babilidade  de  se  concluir  que  a  significância  existe  quando 
na  realidade  esta  não  ocorre. 

Quando  especifica  o  nível  de  erro  Tipo  I,  o  pesquisa¬ 
dor  também  determina  um  erro  associado,  chamado  de 
erro  Tipo  II  ou  beta  (p).  O  erro  Tipo  II  é  a  probabilidade 
de  não  rejeitar  a  hipótese  nula  quando  na  realidade  esta  é 
falsa.  Uma  probabilidade  ainda  mais  interessante  é  I  -  p, 
chamada  de  poder  do  teste  de  inferência  estatística.  Poder 
é  a  probabilidade  de  rejeitar  corretamente  a  hipótese  nula 


quando  esta  deve  ser  rejeitada.  Logo,  poder  é  a  probabi¬ 
lidade  de  a  significância  estatística  ser  indicada  se  estiver 
presente.  A  relação  das  diferentes  probabilidades  de  erro 
na  situação  hipotética  de  teste  para  a  diferença  em  duas 
médias  é  mostrada  aqui: 

Realidade 

Sem  diferença  Diferença 

Hq:  Sem  diferença 

Decisão 
estatística 

Hg:  Diferença 


Apesar  de  a  especificação  de  alfa  estabelecer  o  nível 
de  significância  estatística  aceitável,  é  o  nível  de  poder 
que  determina  a  probabilidade  de  “sucesso”  em  encontrar 
as  diferenças  se  elas  realmente  existirem.  Então  por  que 
não  fixar  ambos  alfa  e  beta  em  níveis  aceitáveis?  Porque 
os  erros  Tipo  I  e  Tipo  II  são  inversamente  relacionados, 
e,  à  medida  que  o  erro  Tipo  I  se  torna  mais  restritivo  (se 
aproxima  de  zero),  a  probabilidade  de  um  erro  Tipo  II 
aumenta.  Reduzir  erros  Tipo  I,  portanto,  reduz  o  poder 
do  teste  estatístico.  Assim,  o  pesquisador  deve  jogar  com 
o  equilíbrio  entre  o  nível  alfa  e  o  poder  resultante. 

Impactos  sobre  poder  estatístico 

Mas  por  que  níveis  elevados  de  poder  não  podem  ser  al¬ 
cançados  sempre?  O  poder  não  é  apenas  uma  função  de 
(alfa  a).  E,  na  verdade,  determinado  por  três  fatores: 

1.  Tamanho  do  efeito  -  A  probabilidade  de  atingir  significân¬ 
cia  estatística  é  baseada  não  apenas  em  considerações  esta¬ 
tísticas,  mas  também  na  verdadeira  magnitude  do  efeito  de 
interesse  (p.  ex.,  uma  diferença  de  médias  entre  dois  grupos 
ou  a  correlação  entre  variáveis)  na  população,  denominado 
tamanho  do  efeito.  Como  era  de  se  esperar,  um  efeito  maior 
é  mais  facilmente  encontrado  do  que  um  efeito  menor,  o 
que  causa  impacto  no  poder  do  teste  estatístico.  Para  avaliar 
o  poder  de  qualquer  teste  estatístico,  o  pesquisador  deve 
primeiro  compreender  o  efeito  sendo  examinado.  Os  tama¬ 
nhos  de  efeito  são  definidos  em  termos  padronizados  para 
facilitar  a  comparação.  As  diferenças  de  média  são  dadas 
em  termos  de  desvios-padrão,  de  modo  que  um  tamanho  de 
efeito  de  0,5  indica  que  a  diferença  de  média  é  metade  de 
um  desvio-padrão.  Para  correlações,  o  tamanho  do  efeito  é 
baseado  na  real  correlação  entre  as  variáveis. 

2.  Alfa  (a)  -  Como  já  foi  discutido,  quando  alfa  se  torna  mais 
restritivo,  o  poder  diminui.  Portanto,  quando  o  pesquisador 
reduz  a  chance  de  incorretamente  dizer  que  um  efeito  é  sig- 
nificante  quando  não  o  é,  a  probabilidade  de  corretamente 
encontrar  um  efeito  também  diminui.  Diretrizes  convencio¬ 
nais  sugerem  níveis  de  alfa  de  0,05  ou  0,01.  Entretanto,  o 
pesquisador  deve  considerar  o  impacto  dessa  decisão  sobre 
o  poder  antes  de  selecionar  o  nível  alfa.  A  relação  dessas 
duas  probabilidades  é  ilustrada  em  discussões  posteriores. 

3.  Tamanho  da  amostra  -  Em  qualquer  nível  alfa,  tamanhos 
de  amostras  aumentados  sempre  produzem  maior  poder 
do  teste  estatístico.  Um  problema  potencial  então  se  trans- 


1  -  a 

P 

Erro  Tipo  II 

a 

Erro  Tipo  I 

1-P 

Poder 

28  Análise  Multivariada  de  Dados 


forma  em  poder  excessivo.  Por  “excessivo”  entende-se  que 
aumentar  o  tamanho  amostrai  implica  que  efeitos  cada  vez 
menores  serão  percebidos  como  estatisticamente  significan- 
tes,  até  que  em  amostras  muito  grandes  quase  todo  efeito  é 
significante.  O  pesquisador  sempre  deve  estar  ciente  de  que 
o  tamanho  da  amostra  poderá  impactar  o  teste  estatístico, 
tornando-o  insensível  (com  amostras  pequenas)  ou  exage- 
radamente  sensível  (com  amostras  muito  grandes). 

As  relações  entre  alfa,  tamanho  da  amostra,  tama¬ 
nho  do  efeito  e  poder  são  muito  complicadas,  e  muitas 
referências  de  orientação  estão  disponíveis.  Cohen  [5] 
examina  o  poder  para  a  maioria  dos  testes  de  inferên¬ 
cia  estatística  e  apresenta  uma  orientação  para  níveis 
aceitáveis  de  poder,  sugerindo  que  estudos  devem  ser 
planejados  para  atingir  níveis  alfa  de  pelo  menos  0,05 
com  níveis  de  poder  de  80%.  Para  atingir  tais  níveis  de 
poder,  os  três  fatores  -  alfa,  tamanho  da  amostra  e  ta¬ 
manho  do  efeito  -  devem  ser  considerados  simultanea¬ 
mente.  Essas  inter-relações  podem  ser  ilustradas  por 
dois  exemplos  simples. 


O  primeiro  exemplo  envolve  o  teste  para  a  diferença 
entre  os  escores  médios  de  dois  grupos.  Considere  que 
o  tamanho  do  efeito  deva  variar  entre  pequeno  (0,2)  e 
moderado  (0,5).  O  pesquisador  agora  deve  determinar 
o  nível  alfa  e  o  tamanho  da  amostra  necessários  de  cada 
grupo.  A  Tabela  1-1  ilustra  o  impacto  do  tamanho  da 
amostra  e  do  nível  alfa  sobre  o  poder.  Como  se  vê,  o 
poder  se  torna  aceitável  com  tamanhos  de  amostra  de 
100  ou  mais  em  situações  com  um  tamanho  de  efeito 
moderado  nos  dois  níveis  alfa.  Todavia,  quando  o  ta¬ 
manho  do  efeito  é  pequeno,  os  testes  estatísticos  têm 
pouco  poder,  mesmo  com  níveis  alfa  expandidos  ou 
amostras  de  200  ou  mais.  Por  exemplo,  uma  amostra  de 
200  em  cada  grupo,  com  um  alfa  de  0,05,  ainda  tem  ape¬ 
nas  50%  de  chance  de  diferenças  significantes  serem 
encontradas  se  o  tamanho  do  efeito  for  pequeno.  Isso 
sugere  que  se  o  pesquisador  espera  que  os  efeitos  sejam 
pequenos,  ele  deverá  planejar  o  estudo  com  tamanhos 
de  amostra  muito  maiores  e/ou  níveis  alfa  menos  restri¬ 
tivos  (p.  ex.,  0,10). 

No  segundo  exemplo,  a  Figura  1-1  apresenta  grafi¬ 
camente  o  poder  para  níveis  de  significância  0,01,  0,05 
e  0,10  para  tamanhos  de  amostra  de  30  a  300  por  grupo, 
quando  o  tamanho  do  efeito  (0,35)  está  entre  pequeno  e 
moderado.  Diante  de  tais  perspectivas,  a  especificação 
de  um  nível  de  significância  de  0,01  requer  uma  amostra 
de  200  por  grupo  para  atingir  o  nível  desejado  de  80% 
de  poder.  No  entanto,  se  o  nível  alfa  é  relaxado,  um  po¬ 
der  de  80%  é  alcançado  com  amostras  de  130  para  um 
nível  alfa  de  0,05  e  de  100  para  um  nível  alfa  de  0,10. 


O  uso  do  poder  com  técnicas  multivariadas 

Tais  análises  permitem  tomadas  de  decisão  melhor  in¬ 
formadas  sobre  o  planejamento  de  estudo  e  a  interpre¬ 


tação  dos  resultados.  Ao  planejar  uma  pesquisa,  o  pes¬ 
quisador  deve  estimar  o  tamanho  esperado  do  efeito  e 
então  selecionar  o  tamanho  da  amostra  e  alfa  para  atin¬ 
gir  o  nível  de  poder  desejado.  Além  de  seus  usos  para 
planejamento,  a  análise  de  poder  também  é  utilizada 
depois  que  a  análise  está  completa  para  determinar  o 
real  poder  alcançado,  de  modo  que  os  resultados  pos¬ 
sam  ser  apropriadamente  interpretados.  Os  resultados 
são  devido  a  tamanhos  de  efeito,  tamanhos  das  amostras 
ou  níveis  de  significância?  O  pesquisador  pode  avaliar 
cada  um  desses  fatores  por  seu  impacto  na  significância 
ou  não-significância  dos  resultados.  O  pesquisador  de 
hoje  pode  consultar  estudos  publicados  que  detalham  as 
especificações  da  determinação  de  poder  [5]  ou  apelar 
para  diversos  programas  de  computador  que  auxiliam 
no  planejamento  de  estudos  com  o  propósito  de  atingir 
o  poder  desejado  ou  calcular  o  poder  de  resultados  reais 
[2,3].  Orientações  específicas  para  regressão  múltipla  e 
análise  multivariada  de  variância  -  as  aplicações  mais 
comuns  de  análise  de  poder  -  são  discutidas  com  mais 
detalhes  nos  Capítulos  4  e  6. 

Uma  vez  abordadas  as  questões  de  estender  técnicas 
multivariadas  a  partir  de  suas  origens  univariadas  e  biva- 
riadas,  apresentamos  um  esquema  de  classificação  para 
auxiliar  na  seleção  da  técnica  apropriada  pela  especifica¬ 
ção  dos  objetivos  da  pesquisa  (relação  de  independência 
ou  dependência)  e  dos  tipos  de  dados  (métricos  ou  não- 
métricos).  Em  seguida,  introduzimos  brevemente  cada 
método  multivariado  discutido  no  texto. 


UMA  CLASSIFICAÇÃO  DE 
TÉCNICAS  MULTIVARIADAS 

Para  auxiliá-lo  a  familiarizar-se  com  as  técnicas  multiva¬ 
riadas  específicas,  apresentamos  uma  classificação  de  mé- 


-  REGRAS  PRÁTICAS  1-1  - 

Análise  de  poder  estatístico 

•  Pesquisadores  sempre  devem  planejar  o  estudo  para 
conseguirem  um  nível  de  poder  de  0,80  no  nível  de 
significância  desejado. 

•  Níveis  de  significância  mais  estritos  (p.  ex.,  0,01  no  lugar 
de  0,05)  requerem  amostras  maiores  para  atingir  o  nível 
de  poder  desejado. 

•  Reciprocamente,  poder  pode  ser  aumentado 
escolhendo-se  um  nível  alfa  menos  estrito  (p.  ex.,  0,10 
no  lugar  de  0,05) 

•  Tamanhos  do  efeito  menores  sempre  demandam 
tamanhos  amostrais  maiores  para  atingir  o  poder 
desejado. 

•  Qualquer  aumento  em  poder  é  mais  facilmente 
conseguido  aumentando-se  o  tamanho  da  amostra. 
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TABELA  1-1  Níveis  de  poder  para  a  comparação  de  duas  médias:  variações  por  tamanho  de  amostra,  nível  de 
significância  e  tamanho  do  efeito 


Tamanho  da  amostra 

alfa  (a) 

=  0,05 

alfa  (a) 

=  0,01 

Tamanho  do  efeito  (ES) 

Tamanho  do  efeito  (ES) 

Pequeno  (0,2) 

Moderado  (0,5) 

Pequeno  (0,2) 

Moderado  (0,5) 

20 

0,095 

0,338 

0,025 

0,144 

40 

0,143 

0,598 

0,045 

0,349 

60 

0,192 

0,775 

0,067 

0,549 

80 

0,242 

0,882 

0,092 

0,709 

100 

0,290 

0,940 

0,120 

0,823 

150 

0,411 

0,990 

0,201 

0,959 

200 

0,516 

0,998 

0,284 

0,992 

Fonte:  SOLO  Power  Analysis,  BMDP  Statistical  Software,  Inc.  [2] 


todos  multivariados  na  Figura  1-2.  Essa  classificação  é  ba¬ 
seada  em  três  julgamentos  que  o  pesquisador  deve  fazer 
sobre  o  objetivo  da  pesquisa  e  a  natureza  dos  dados: 

1.  As  variáveis  podem  ser  divididas  em  classificações  indepen¬ 
dentes  e  dependentes  com  base  em  alguma  teoria? 

2.  Se  podem,  quantas  variáveis  são  tratadas  como  dependen¬ 
tes  em  uma  única  análise? 

3.  Como  as  variáveis,  sejam  dependentes  ou  independentes, 
são  medidas? 

A  seleção  da  técnica  multivariada  adequada  depende 
das  respostas  a  essas  três  questões. 

Quando  se  considera  a  aplicação  de  técnicas  estatís¬ 
ticas  multivariadas,  a  resposta  à  primeira  questão  -  as 


variáveis  podem  ser  divididas  em  classificações  indepen¬ 
dentes  e  dependentes  com  base  em  alguma  teoria?  -  in¬ 
dica  se  uma  técnica  de  dependência  ou  interdependência 
deveria  ser  utilizada.  Note  que  na  Figura  1-2  as  técnicas 
de  dependência  estão  no  lado  esquerdo,  e  as  de  interde¬ 
pendência  estão  à  direita.  Uma  técnica  de  dependência 
pode  ser  definida  como  uma  na  qual  uma  variável  ou 
conjunto  de  variáveis  é  identificada  como  a  variável  de¬ 
pendente  a  ser  prevista  ou  explicada  por  outras  variáveis 
conhecidas  como  variáveis  independentes.  Um  exemplo 
de  técnica  de  dependência  é  a  análise  de  regressão  múlti¬ 
pla.  Em  contrapartida,  uma  técnica  de  interdependência 
é  aquela  em  que  nenhuma  variável  ou  grupo  de  variáveis 


FIGURA  1-1  Impacto  do  tamanho  da  amostra  sobre  poder  para  vários  níveis  alfa  (0,01 , 0,05,  0,10)  com  tamanho  de  efeito 
de  0,35. 


30 


Análise  Multivariada  de  Dados 
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Métrica  Não-métrica 


*0  Capítulo  que  trata  deste  assunto  está  disponível  no  site  www.bookman.com.br. 


FIGURA  1-2  Seleção  de  uma  técnica  multivariada. 
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é  definida  como  sendo  independente  ou  dependente.  Ao 
invés  disso,  o  procedimento  envolve  a  análise  simultânea 
de  todas  as  variáveis  no  conjunto.  Análise  fatorial  é  um 
exemplo  de  técnica  de  interdependência.  Focalizemos 
primeiramente  as  técnicas  de  dependência  e  usemos  a 
classificação  na  Figura  1-2  para  selecionar  o  método  mul- 
tivariado  apropriado. 

Técnicas  de  dependência 

As  diferentes  técnicas  de  dependência  podem  ser  catego¬ 
rizadas  por  duas  características:  (1)  o  número  de  variáveis 
dependentes  e  (2)  o  tipo  de  escala  de  medida  empregada 
pelas  variáveis.  Primeiro,  no  que  se  refere  ao  número  de 
variáveis  dependentes,  técnicas  de  dependência  podem 
ser  classificadas  como  tendo  uma  única  variável  depen¬ 
dente,  diversas  variáveis  dependentes,  ou  até  mesmo  di¬ 
versas  relações  de  dependência/independência.  Segundo, 
técnicas  de  dependência  podem  ser  posteriormente  classi¬ 
ficadas  como  aquelas  com  variáveis  dependentes  métricas 
(quantitativas/numéricas)  ou  não-métricas  (qualitativas/ 
categóricas).  Se  a  análise  envolve  uma  única  variável  de¬ 
pendente  que  é  métrica,  a  técnica  apropriada  é  análise  de 
regressão  múltipla  ou  análise  conjunta.  Análise  conjun¬ 
ta  é  um  caso  especial.  Envolve  um  procedimento  de  de¬ 
pendência  que  pode  tratar  a  variável  dependente  como 
métrica  ou  não-métrica,  dependendo  do  tipo  de  dados 
coletados.  Por  outro  lado,  se  a  única  variável  dependente 
é  não-métrica  (categórica),  então  as  técnicas  adequadas 
são  análise  discriminante  múltipla  e  modelos  lineares  de 
probabilidade. 

Quando  o  problema  de  pesquisa  envolve  diversas  va¬ 
riáveis  dependentes,  outras  quatro  técnicas  de  análise  são 
apropriadas.  Se  as  diversas  variáveis  dependentes  são  mé¬ 
tricas,  devemos  olhar  para  as  variáveis  independentes.  Se  as 
mesmas  são  não-métricas,  a  técnica  de  análise  multivariada 
de  variância  (MANOVA)  deve  ser  escolhida.  Se  as  variáveis 
independentes  são  métricas,  correlação  canônica  é  adequa¬ 
da.  Se  as  diversas  variáveis  dependentes  são  não-métricas, 
então  elas  podem  ser  transformadas  em  uma  codificação  de 
variáveis  dicotômicas  e  a  análise  canônica  novamente  pode 
ser  utilizada.^  Finalmente,  se  um  conjunto  de  relações  de 
variáveis  dependentes/independentes  é  postulado,  então  a 
modelagem  de  equações  estruturais  é  apropriada. 

Existe  uma  relação  muito  grande  entre  os  diversos 
procedimentos  de  dependência,  os  quais  podem  ser  vistos 
como  uma  família  de  técnicas.  A  Tabela  1-2  define  as  vá¬ 
rias  técnicas  de  dependência  multivariada  em  termos  da 


'  Variáveis  dicotômicas  (ver  Termos-chave)  são  discutidas  mais  de¬ 
talhadamente  adiante.  Resumidamente,  a  codificação  de  variável 
dicotômica  é  uma  maneira  de  transformar  dados  não-métricos  em 
dados  métricos.  Envolve  a  criação  das  chamadas  variáveis  dicotô¬ 
micas,  nas  quais  Is  e  Os  são  designados  a  indivíduos,  dependendo 
de  os  mesmos  possuírem  ou  não  uma  característica  em  questão. 
Por  exemplo,  se  um  indivíduo  é  do  sexo  masculino,  designe  a  ele 
um  0,  e  se  for  do  sexo  feminino  designe  um  1,  ou  o  contrário. 


natureza  e  número  de  variáveis  dependentes  e  indepen¬ 
dentes.  Como  podemos  perceber,  a  correlação  canônica 
pode  ser  considerada  como  o  modelo  geral  sobre  o  qual 
muitas  outras  técnicas  multivariadas  são  baseadas,  pois  ela 
coloca  o  mínimo  de  restrições  sobre  o  tipo  e  o  número  de 
variáveis  em  ambas  as  variáveis  estatísticas,  dependente  e 
independente.  A  medida  que  restrições  são  colocadas  so¬ 
bre  variáveis  estatísticas,  conclusões  mais  precisas  podem 
ser  alcançadas  com  base  na  escala  específica  de  medidas 
de  dados  empregada.  Logo,  técnicas  multivariadas  variam 
do  método  generalizado  de  análise  canônica  à  técnica  es¬ 
pecializada  de  modelagem  de  equações  estruturais. 

Técnicas  de  interdependência 

Técnicas  de  interdependência  são  mostradas  no  lado  di¬ 
reito  da  Figura  1-2.  Os  leitores  deverão  lembrar  que  com 
técnicas  de  interdependência  as  variáveis  não  podem  ser 
classificadas  como  dependentes  ou  independentes.  Em  vez 
disso,  todas  as  variáveis  são  analisadas  simultaneamente 
em  um  esforço  para  encontrar  uma  estrutura  subjacente  a 
todo  o  conjunto  de  variáveis  ou  indivíduos.  Se  a  estrutura 
de  variáveis  deve  ser  analisada,  então  a  análise  fatorial  ou 
a  análise  fatorial  confirmatória  é  a  técnica  recomendada. 
Se  casos  ou  respondentes  devem  ser  agrupados  para  re¬ 
presentar  estrutura,  então  a  análise  de  agrupamentos  é 
selecionada.  Finalmente,  se  o  interesse  está  na  estrutura 
de  objetos,  as  técnicas  de  mapeamento  perceptual  deve¬ 
riam  ser  usadas.  Como  no  caso  das  técnicas  de  dependên¬ 
cia,  as  propriedades  de  medida  das  técnicas  deveriam  ser 
consideradas.  No  caso  geral,  análise  fatorial  e  análise  de 
agrupamentos  são  consideradas  como  técnicas  de  inter¬ 
dependência  métricas.  No  entanto,  dados  não-métricos 
podem  ser  transformados  em  uma  codificação  dicotômica 
para  o  emprego  com  formas  especiais  de  análise  fatorial  e 
análise  de  agrupamentos.  Ambas  as  abordagens  métrica 
e  não-métrica  para  o  mapeamento  perceptual  foram  de¬ 
senvolvidas.  Se  as  interdependências  de  objetos  medidos 
por  dados  não-métricos  devem  ser  analisadas,  a  análise  de 
correspondência  também  é  adequada. 


TIPOS  DE  TÉCNICAS  MULTIVARIADAS 

Análise  multivariada  é  um  conjunto  de  técnicas  para  aná¬ 
lise  de  dados  que  está  sempre  em  expansão  e  que  englo¬ 
ba  um  vasto  domínio  de  possíveis  situações  de  pesquisa, 
como  se  evidencia  pelo  esquema  de  classificação  recém 
discutido.  As  técnicas  mais  estabelecidas,  bem  como  as 
emergentes,  incluem  as  seguintes: 

1.  Análise  de  componentes  principais  e  análise  dos  fatores 
comuns 

2.  Regressão  múltipla  e  correlação  múltipla 

3.  Análise  discriminante  múltipla  e  regressão  logística 

4.  Análise  de  correlação  canônica 

5.  Análise  multivariada  de  variância  e  covariância 
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TABELA  1-2  A  relação  entre  métodos  de  dependência  multivariada 


Correlação  canônica 

v',  +  v'2+y’3  + ■■■  +  /„  =  X, +  X2  +  X3  +  --+x„ 

(métricas,  não-métricas)  (métricas,  não-métricas) 

Análise  multivariada  de  variância 

Y,  +  Y^+Y^+---  +  Y„  =  X, -rXj-rXg-t"  +X„ 

(métricas)  (não-métricas) 

Análise  de  variância 

V",  =  X, -rXj-rXg-r  -  +X„ 

(métrica)  (não-métricas) 

Análise  discriminante  múltipla 

T,  =  X, -rX^-rXg-r  -  +X„ 

(não-métrica)  (métricas) 

Análise  de  regressão  múltipla 

y,  =  X,  t-Xs-rXg-r  -  +X„ 

(métrica)  (métricas,  não-métricas) 

Análise  conjunta 

y,  =  x,  +  x^  +  x^  +  --  +  x„ 

(não-métrica,  métrica)  (não-métricas) 


Modelagem  de  equações  estruturais 

y,  =  x„+x,3  +  x,3+-  +  x,„ 

Yn  Xn-,  +  Xnn  +  Xn-3  +  ’  ‘  +  X.y„ 

X^,  +  X^  +  X^+-+X^„ 
(métrica)  (métricas,  não-métricas) 


6.  Análise  conjunta 

7.  Análise  de  agrupamentos 

8.  Mapeamento  perceptual,  também  conhecido  como  escalo¬ 
namento  multidimensional. 

9.  Análise  de  correspondência 

10.  Modelagem  de  equações  estruturais  e  análise  fatorial  confir- 
matória 

Aqui  introduzimos  cada  uma  das  técnicas  multivaria- 
das,  definindo  brevemente  a  técnica  e  o  objetivo  para  sua 
aplicação. 

Análise  de  componentes  principais 
e  análise  dos  fatores  comnns 

Análise  fatorial,  que  inclui  análise  de  componentes  prin¬ 
cipais  e  análise  dos  fatores  comuns,  é  uma  abordagem  es¬ 
tatística  que  pode  ser  usada  para  analisar  inter-relações 
entre  um  grande  número  de  variáveis  e  explicar  essas 
variáveis  em  termos  de  suas  dimensões  inerentes  comuns 
(fatores).  O  objetivo  é  encontrar  um  meio  de  condensar  a 
informação  contida  em  várias  variáveis  originais  em  um 
conjunto  menor  de  variáveis  estatísticas  (fatores)  com 
uma  perda  mínima  de  informação.  Pelo  fato  de  fornecer 
uma  estimativa  empírica  da  estrutura  das  variáveis  consi¬ 
deradas,  a  análise  fatorial  se  torna  uma  base  objetiva  para 
criar  escalas  múltiplas. 


Um  pesquisador  pode  usar  análise  fatorial,  por  exem¬ 
plo,  para  melhor  entender  as  relações  entre  avaliações 
de  clientes  de  uma  lanchonete.  Considere  que  você  peça 
a  clientes  para  avaliarem  o  local  sobre  as  seguintes  seis 
variáveis:  sabor  da  comida,  temperatura  da  comida,  se 
a  comida  é  fresca,  tempo  de  espera,  limpeza,  e  atendi¬ 
mento  por  parte  de  empregados.  O  analista  gostaria  de 
combinar  essas  seis  variáveis  em  um  número  menor. 
Analisando  as  respostas,  o  analista  pode  descobrir  que 
as  variáveis  sabor,  temperatura  e  frescor  se  combinam 
para,  juntas,  formar  um  único  fator  de  qualidade  de  co¬ 
mida,  enquanto  as  variáveis  tempo  de  espera,  limpeza, 
e  atendimento  se  combinam  para  compor  outro  fator, 
qualidade  de  serviço. 


Regressão  múltipla 

Regressão  múltipla  é  o  método  de  análise  apropriado  quan¬ 
do  o  problema  de  pesquisa  envolve  uma  única  variável  de¬ 
pendente  métrica  considerada  como  relacionada  a  duas  ou 
mais  variáveis  independentes  métricas.  O  objetivo  da  aná¬ 
lise  de  regressão  múltipla  é  prever  as  mudanças  na  variável 
dependente  como  resposta  a  mudanças  nas  variáveis  inde¬ 
pendentes.  Esse  objetivo  é  alcançado,  com  freqüência,  por 
meio  da  regra  estatística  dos  mínimos  quadrados. 
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Sempre  que  o  pesquisador  estiver  interessado  em  pre¬ 
ver  a  quantia  ou  magnitude  da  variável  dependente,  a 
regressão  múltipla  será  útil.  Por  exemplo,  despesas  men¬ 
sais  com  jantares  fora  de  casa  (variável  dependente)  po¬ 
dem  ser  previstas  a  partir  de  informações  referentes  a 
renda  familiar,  tamanho  da  família  e  idade  do  chefe  da 
família  (variáveis  independentes).  Do  mesmo  modo,  o 
pesquisador  pode  tentar  prever  as  vendas  de  uma  em¬ 
presa  a  partir  de  informações  sobre  suas  despesas  em 
publicidade,  o  número  de  vendedores  e  o  número  de  lo¬ 
jas  que  vendem  seus  produtos. 


Análise  discriminante  múltipla 
e  regressão  logística 

Análise  discriminante  múltipla  (MD  A  -  multiple  discrimi- 
nant  analysis)  é  a  técnica  multivariada  adequada  quando 
a  única  variável  dependente  é  dicotômica  (p.  ex.,  masculi¬ 
no-feminino)  ou  multicotômica  (p.  ex.,  alto-médio-baixo) 
e,  portanto,  não-métrica.  Como  na  regressão  múltipla, 
pressupõe-se  que  as  variáveis  independentes  sejam  métri¬ 
cas.  A  análise  discriminante  é  aplicável  em  situações  nas 
quais  a  amostra  total  pode  ser  dividida  em  grupos  basea¬ 
dos  em  uma  variável  dependente  não-métrica  que  carac¬ 
teriza  diversas  classes  conhecidas.  Os  objetivos  primários 
da  análise  discriminante  múltipla  são  entender  diferenças 
de  grupos  e  prever  a  probabilidade  de  que  uma  entidade 
(indivíduo  ou  objeto)  pertencerá  a  uma  classe  ou  grupo 
em  particular  com  base  em  diversas  variáveis  independen¬ 
tes  métricas. 


A  análise  discriminante  poderia  ser  empregada  para 
distinguir  inovadores  de  não-inovadores  de  acordo  com 
seus  perfis  demográficos  e  psicográficos.  Outras  aplica¬ 
ções  incluem  a  distinção  de  usuários  de  peso  daqueles 
que  não  o  são,  sexo  masculino  de  sexo  feminino,  consu¬ 
midores  de  marcas  nacionais  de  consumidores  de  mar¬ 
cas  importadas,  e  bons  riscos  de  crédito  de  riscos  ruins 
de  crédito.  Até  mesmo  o  Internai  Revenue  Service  dos 
EUA  usa  análise  discriminante  para  comparar  restitui¬ 
ções  de  impostos  federais  selecionadas  com  uma  resti¬ 
tuição  hipotética  de  contribuinte  composta  e  normal 
(com  diferentes  níveis  de  renda)  para  identificar  as  resti¬ 
tuições  mais  promissoras  e  áreas  para  auditoria. 


Modelos  de  regressão  logística,  freqüentemente  cha¬ 
mados  de  análise  logit,  são  uma  combinação  de  regressão 
múltipla  e  análise  discriminante  múltipla.  Essa  técnica  é 
semelhante  à  análise  de  regressão  múltipla  no  sentido  de 
que  uma  ou  mais  variáveis  independentes  são  usadas  para 
prever  uma  única  variável  dependente.  O  que  diferencia 
um  modelo  de  regressão  logística  de  uma  regressão  múl¬ 


tipla  é  que  a  variável  dependente  é  não-métrica,  como  na 
análise  discriminante.  A  escala  não-métrica  da  variável 
dependente  exige  diferenças  no  método  de  estimação  e 
suposições  sobre  o  tipo  de  distribuição  inerente,  ainda  que 
na  maioria  dos  outros  aspectos  seja  muito  semelhante  à  re¬ 
gressão  múltipla.  Logo,  uma  vez  que  a  variável  dependen¬ 
te  está  corretamente  especificada  e  a  técnica  adequada  de 
estimação  é  empregada,  os  fatores  básicos  considerados  na 
regressão  múltipla  são  igualmente  usados  aqui.  Modelos 
de  regressão  logística  são  diferenciados  de  análise  discri¬ 
minante  principalmente  no  sentido  de  que  eles  acomodam 
todos  os  tipos  de  variáveis  independentes  (métricas  e  não- 
métricas)  e  não  exigem  a  suposição  de  normalidade  mul¬ 
tivariada.  Não  obstante,  em  muitos  casos,  particularmente 
com  mais  de  dois  níveis  da  variável  dependente,  a  análise 
discriminante  é  a  técnica  mais  apropriada. 


Considere  que  consultores  financeiros  estavam  ten¬ 
tando  desenvolver  um  meio  para  selecionar  empresas 
emergentes  para  investimentos  de  apoio.  Para  auxiliar 
nessa  tarefa  eles  analisaram  arquivos  antigos  e  coloca¬ 
ram  firmas  em  uma  de  duas  classes:  bem-sucedidas  por 
mais  de  cinco  anos  e  malsucedidas  após  cinco  anos.  Para 
cada  firma  eles  também  tinham  uma  abundância  de  da¬ 
dos  financeiros  e  administrativos.  Eles  poderiam  então 
usar  um  modelo  de  regressão  logística  para  identificar 
aqueles  dados  financeiros  e  administrativos  que  melhor 
diferenciavam  as  empresas  bem-sucedidas  das  malsuce¬ 
didas,  a  fim  de  selecionar  os  melhores  candidatos  para 
investimento  no  futuro. 


Correlação  canônica 

A  análise  de  correlação  canônica  pode  ser  vista  como  uma 
extensão  lógica  da  análise  de  regressão  múltipla.  Lembre 
que  a  análise  de  regressão  múltipla  envolve  uma  única  va¬ 
riável  dependente  métrica  e  várias  variáveis  independen¬ 
tes  métricas.  Com  a  análise  canônica,  o  objetivo  é  corre¬ 
lacionar  simultaneamente  diversas  variáveis  dependentes 
métricas  e  diversas  variáveis  independentes  métricas.  En¬ 
quanto  a  regressão  múltipla  envolve  uma  única  variável 
dependente,  a  correlação  canônica  envolve  múltiplas  va¬ 
riáveis  dependentes.  O  princípio  subjacente  é  desenvolver 
uma  combinação  linear  de  cada  conjunto  de  variáveis  (in¬ 
dependentes  e  dependentes)  para  maximizar  a  correlação 
entre  os  dois  conjuntos.  Em  outras  palavras,  o  procedi¬ 
mento  envolve  a  obtenção  de  um  conjunto  de  pesos  para 
as  variáveis  dependentes  e  independentes  que  fornece  a 
correlação  simples  máxima  entre  o  conjunto  de  variáveis 
dependentes  e  o  de  variáveis  independentes.  Essa  técnica 
não  é  discutida  neste  texto,  mas  um  capítulo  que  fornece 
uma  visão  geral  e  aplicação  da  técnica  está  disponível  no 
site  www.bookman.com.br. 
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Imagine  que  uma  empresa  conduz  um  estudo  que  coleta 
informação  sobre  qualidade  de  seu  serviço  baseado  em 
respostas  a  50  questões  metricamente  medidas.  O  estu¬ 
do  utiliza  questões  de  pesquisas  de  qualidade  de  serviços 
publicadas  e  inclui  informação  padrão  sobre  percepções 
da  qualidade  de  serviço  de  “companhias  de  classe  mun¬ 
dial”  bem  como  da  companhia  para  a  qual  a  pesquisa 
está  sendo  conduzida.  Correlação  canônica  poderia  ser 
usada  para  comparar  as  percepções  das  companhias  de 
qualidade  sobre  as  50  questões  com  as  percepções  da 
empresa  em  questão.  A  pesquisa  poderia  então  concluir 
se  as  percepções  da  empresa  estão  correlacionadas  com 
aquelas  das  empresas  de  classe  mundial.  A  técnica  forne¬ 
ceria  informação  sobre  a  correlação  geral  de  percepções, 
bem  como  a  correlação  entre  cada  uma  das  50  questões. 


Análise  multivariada  de  variância  e  covariância 

A  análise  multivariada  de  variância  (MANOVA-  multi- 
variate  analysis  of  variancé)  é  uma  técnica  estatística  que 
pode  ser  usada  para  explorar  simultaneamente  as  relações 
entre  diversas  variáveis  independentes  categóricas  (geral¬ 
mente  chamadas  de  tratamentos)  e  duas  ou  mais  variáveis 
dependentes  métricas.  Como  tal,  representa  uma  extensão 
da  análise  nnivaríada  de  variância  (ANOVA  -  univariate 
analysis  o f  variancé).  A  análise  multivariada  de  covariância 
(MANCOVA  -  multivariate  analysis  of  covariance)  pode 
ser  usada  em  conjunção  com  MANOVA  para  remover 
(após  o  experimento)  o  efeito  de  quaisquer  variáveis  in¬ 
dependentes  métricas  não  controladas  (conhecidas  como 
covariáveis  estatísticas)  sobre  as  variáveis  dependentes.  O 
procedimento  é  análogo  ao  envolvido  na  correlação  parcial 
bivariada,  na  qual  o  efeito  de  uma  terceira  variável  é  remo¬ 
vido  da  correlação.  MANOVA  é  útil  quando  o  pesquisador 
planeja  uma  situação  experimental  (manipulação  de  várias 
variáveis  não-métricas  de  tratamento)  para  testar  hipóteses 
referentes  à  variância  em  respostas  nos  grupos  sobre  duas 
ou  mais  variáveis  dependentes  métricas. 


Imagine  que  uma  empresa  quer  saber  se  um  anúncio  di¬ 
vertido  seria  mais  ehciente  com  seus  clientes  do  que  um 
anúncio  não  engraçado.  Ela  poderia  solicitar  à  sua  agência 
de  publicidade  a  criação  de  dois  anúncios  -  um  engraçado 
e  outro  não  -  e  então  exibir  os  dois  comerciais  para  um 
grupo  de  clientes.  Após  assistirem  ambos,  os  clientes  se¬ 
riam  indagados  para  avaliarem  a  empresa  e  seus  produtos 
em  diversas  dimensões,  como  moderna  versus  tradicio¬ 
nal,  ou  alta  qualidade  versus  baixa  qualidade.  MANOVA 
seria  a  técnica  a  ser  usada  com  o  objetivo  de  determinar  a 
extensão  de  quaisquer  diferenças  estatísticas  entre  as  per¬ 
cepções  de  clientes  que  viram  o  anúncio  divertido  versus 
aqueles  que  viram  o  que  não  é  engraçado. 


Análise  conjunta 

A  análise  conjunta  é  uma  técnica  emergente  de  depen¬ 
dência  que  tem  trazido  nova  sofisticação  para  a  avaliação 
de  objetos,  como  novos  produtos,  serviços  ou  idéias.  A 
aplicação  mais  direta  é  no  desenvolvimento  de  novos  pro¬ 
dutos  ou  serviços,  viabilizando  a  avaliação  de  produtos 
complexos  e  mantendo  um  contexto  realista  de  decisão 
para  o  respondente.  O  pesquisador  de  mercado  é  capaz  de 
avaliar  a  importância  de  atributos,  bem  como  dos  níveis 
de  cada  atributo,  enquanto  consumidores  avaliam  apenas 
uns  poucos  perfis  do  produto,  os  quais  são  combinações 
de  níveis  de  produto. 


Considere  que  um  dado  produto  tenha  três  atributos 
(preço,  qualidade  e  cor),  cada  um  com  três  níveis  possí¬ 
veis  (p.  ex.,  vermelho,  amarelo  e  azul).  Em  vez  de  ava¬ 
liar  todas  as  27  (3  X  3  X  3)  combinações  possíveis,  um 
subconjunto  (9  ou  mais)  pode  ser  avaliado  por  seu  ape¬ 
lo  perante  consumidores,  e  o  pesquisador  sabe  não  ape¬ 
nas  o  quão  importante  cada  atributo  é,  mas  também  a 
importância  de  cada  nível  (p.  ex.,  a  atratividade  de  ver¬ 
melho  versus  amarelo  versus  azul).  Além  disso,  quando 
as  avaliações  do  consumidor  são  concluídas,  os  resulta¬ 
dos  da  análise  conjunta  podem  igualmente  ser  usados 
em  simuladores  de  planejamento  do  produto,  os  quais 
mostram  a  aceitação  do  consumidor  a  qualquer  número 
de  formulações  do  produto  e  ajudam  no  planejamento 
do  produto  ótimo. 


Análise  de  agrupamentos 

A  análise  de  agrupamentos  é  uma  técnica  analítica  para 
desenvolver  subgrupos  significativos  de  indivíduos  ou  ob¬ 
jetos.  Especificamente,  o  objetivo  é  classificar  uma  amos¬ 
tra  de  entidades  (indivíduos  ou  objetos)  em  um  número 
menor  de  grupos  mutuamente  excludentes,  com  base  nas 
similaridades  entre  as  entidades.  Na  análise  de  agrupa¬ 
mentos,  diferentemente  da  análise  discriminante,  os  gru¬ 
pos  não  são  pré -definidos.  Ao  invés  disso,  a  técnica  é  usa¬ 
da  para  identificar  os  grupos. 

A  análise  de  agrupamentos  geralmente  envolve  pelo 
menos  três  passos.  O  primeiro  é  a  medida  de  alguma 
forma  de  similaridade  ou  associação  entre  as  entidades 
para  determinar  quantos  grupos  realmente  existem  na 
amostra.  O  segundo  passo  é  o  real  processo  de  agru¬ 
pamento,  onde  entidades  são  particionadas  em  grupos 
(agrupamentos).  O  último  passo  é  estabelecer  o  perfil 
das  pessoas  ou  variáveis  para  determinar  sua  composi¬ 
ção.  Muitas  vezes,  isso  é  possível  pela  aplicação  da  análi¬ 
se  discriminante  aos  grupos  identificados  pela  técnica  de 
agrupamento. 
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Como  exemplo  de  análise  de  agrupamentos,  considere¬ 
mos  um  dono  de  restaurante  que  queira  saber  se  clientes 
são  fiéis  ao  restaurante  por  diferentes  razões.  Dados  po¬ 
deriam  ser  coletados  sobre  percepções  de  preços,  qua¬ 
lidade  da  comida  e  assim  por  diante.  A  análise  de  agru¬ 
pamentos  poderia  ser  usada  para  determinar  se  alguns 
subgrupos  (agrupamentos)  estão  altamente  motivados 
pelos  baixos  preços  versus  aqueles  que  estão  menos  mo¬ 
tivados  a  virem  ao  restaurante  por  conta  de  preços. 


Mapeamento  perceptual 

No  mapeamento  perceptual  (também  conhecido  como  es¬ 
calonamento  multidimensional),  o  objetivo  é  transformar 
julgamentos  de  consumidores  sobre  similaridade  ou  prefe¬ 
rência  (p.  ex.,  preferência  por  lojas  ou  marcas)  em  distân¬ 
cias  representadas  em  um  espaço  multidimensional.  Se  os 
respondentes  julgam  os  objetos  A  e  B  os  mais  semelhan¬ 
tes,  comparados  com  todos  os  outros  possíveis  pares  de 
objetos,  técnicas  de  mapeamento  perceptual  colocarão  os 
objetos  A  e  B  de  tal  forma  que  a  distância  entre  eles  no  es¬ 
paço  multidimensional  seja  menor  do  que  a  distância  entre 
quaisquer  outros  pares  de  objetos.  Os  mapas  perceptuais 
resultantes  exibem  a  posição  relativa  de  todos  os  objetos, 
mas  análises  adicionais  são  necessárias  para  descrever  ou 
avaliar  quais  atributos  ditam  a  posição  de  cada  objeto. 


Como  exemplo  de  mapeamento  perceptual,  considere¬ 
mos  um  proprietário  de  uma  loja  do  McDonald’s  que 
queira  saber  se  o  maior  competidor  é  o  Habib’s  ou  Pizza 
Hut.  A  uma  amostra  de  clientes  é  dado  um  questioná¬ 
rio  no  qual  se  pede  para  avaliar  os  pares  de  lanchonetes 
como  mais  semelhantes  e  menos  semelhantes.  Os  resul¬ 
tados  mostram  que  o  McDonald’s  é  mais  parecido  com  o 
Habib’s,  e  assim  os  proprietários  sabem  que  o  mais  for¬ 
te  competidor  é  o  Habib’s,  pois  o  mesmo  é  considerado 
como  o  mais  semelhante.  Análises  posteriores  podem 
identificar  quais  atributos  influenciam  percepções  de  se¬ 
melhança  ou  diferença. 


Análise  de  correspondência 

A  análise  de  correspondência  é  uma  técnica  de  interde¬ 
pendência  recentemente  desenvolvida  que  facilita  o  ma¬ 
peamento  perceptual  de  objetos  (p.  ex.,  produtos,  pessoas) 
em  um  conjunto  de  atributos  não-métricos.  Pesquisadores 
são  constantemente  defrontados  com  a  necessidade  de 
“quantificar  os  dados  qualitativos”  encontrados  em  va¬ 
riáveis  nominais.  A  análise  de  correspondência  difere  das 
técnicas  de  interdependência  discutidas  anteriormente  em 
sua  habilidade  para  acomodar  tanto  dados  não-métricos 
quanto  relações  não-lineares. 

Em  sua  forma  mais  básica,  a  análise  de  correspon¬ 
dência  emprega  uma  tabela  de  contingência,  que  é  a  ta¬ 


bulação  cruzada  de  duas  variáveis  categóricas.  Ela  então 
transforma  os  dados  não-métricos  em  um  nível  métrico 
e  faz  redução  dimensional  (análoga  à  análise  fatorial)  e 
mapeamento  perceptual.  A  análise  de  correspondência 
fornece  uma  representação  multivariada  de  interdepen¬ 
dência  para  dados  não-métricos  que  não  é  possível  com 
outros  métodos. 


Como  exemplo,  preferências  de  respondentes  a  mar¬ 
cas  podem  ser  tabuladas  no  cruzamento  com  variáveis 
demográficas  (p.  ex.,  sexo,  categorias  de  renda,  ocu¬ 
pação),  indicando  quantas  pessoas  que  preferem  cada 
marca  recaem  em  cada  categoria  das  variáveis  demo¬ 
gráficas.  Por  meio  de  análise  de  correspondência,  a  as¬ 
sociação  ou  “correspondência”  de  marcas  e  diferentes 
características  daqueles  que  preferem  cada  marca  é 
então  mostrada  em  um  mapa  bi  ou  tridimensional  de 
marcas  e  características  dos  respondentes.  Marcas  que 
são  percebidas  como  semelhantes  são  colocadas  pró¬ 
ximas  umas  das  outras.  Do  mesmo  modo,  as  caracte¬ 
rísticas  mais  eminentes  de  respondentes  que  preferem 
cada  marca  também  são  determinadas  pela  proximida¬ 
de  das  categorias  de  variáveis  demográficas  às  posições 
das  marcas. 


Modelagem  de  equações  estruturais 
e  análise  fatorial  confirmatória 

Modelagem  de  equações  estruturais  (SEM),  comumente 
chamada  de  LISREL  (o  nome  de  um  dos  programas  de 
computador  mais  conhecidos),  é  uma  técnica  que  permi¬ 
te  separar  relações  para  cada  conjunto  de  variáveis  de¬ 
pendentes.  Em  seu  sentido  mais  simples,  a  modelagem 
de  equações  estruturais  fornece  a  técnica  de  estimação 
apropriada  e  mais  eficiente  para  uma  série  de  equações 
de  regressão  múltipla  separadas  estimadas  simultanea¬ 
mente.  E  caracterizada  por  dois  componentes  básicos:  (1) 
o  modelo  estrutural  e  (2)  o  modelo  de  medida.  O  modelo 
estrutural  é  o  modelo  de  caminhos,  que  relaciona  variá¬ 
veis  independentes  com  dependentes.  Em  tais  situações, 
teoria,  experiência  prévia  ou  outras  orientações  permitem 
ao  pesquisador  distinguir  quais  variáveis  independentes 
prevêem  cada  variável  dependente.  Os  modelos  discu¬ 
tidos  anteriormente  que  acomodam  múltiplas  variáveis 
dependentes  -  análise  multivariada  de  variância  e  corre¬ 
lação  canônica  -  não  se  aplicam  nessa  situação,  pois  eles 
permitem  apenas  uma  única  relação  entre  variáveis  de¬ 
pendentes  e  independentes. 

O  modelo  de  medida  permite  ao  pesquisador  usar  di¬ 
versas  variáveis  (indicadores)  para  uma  única  variável 
independente  ou  dependente.  Por  exemplo,  a  variável 
dependente  poderia  ser  um  conceito  representado  por 
uma  escala  múltipla,  como  auto-estima.  Em  uma  análise 
fatorial  confirmatória  o  pesquisador  pode  avaliar  a  con¬ 
tribuição  de  cada  item  da  escala,  bem  como  incorporar  a 
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maneira  como  a  escala  mede  o  conceito  (confiabilidade). 
As  escalas  são  então  integradas  na  estimação  das  relações 
entre  variáveis  dependentes  e  independentes  no  modelo 
estrutural.  Esse  procedimento  é  semelhante  a  executar 
uma  análise  fatorial  (discutida  em  uma  seção  anterior)  dos 
itens  da  escala  e  usar  os  escores  fatoriais  na  regressão. 


Um  estudo  promovido  por  consultores  administrativos 
identificou  diversos  fatores  que  afetam  a  satisfação  do 
trabalhador:  apoio  do  supervisor,  ambiente  de  trabalho 
e  desempenho  no  emprego.  Além  dessa  relação,  eles 
perceberam  uma  relação  à  parte  na  qual  apoio  do  su¬ 
pervisor  e  ambiente  de  trabalho  eram  preditores  únicos 
de  desempenho  no  emprego.  Logo,  eles  tinham  duas  re¬ 
lações  separadas,  mas  inter-relacionadas.  Apoio  do  su¬ 
pervisor  e  o  ambiente  de  trabalho  não  apenas  afetavam 
diretamente  a  satisfação  do  trabalhador,  mas  tinham 
possíveis  efeitos  indiretos  através  da  relação  com  de¬ 
sempenho  no  emprego,  que  era  também  um  preditor  de 
satisfação  do  trabalhador.  Na  tentativa  de  avaliar  essas 
relações,  os  consultores  também  desenvolveram  escalas 
de  múltiplos  itens  para  cada  construto  (apoio  do  super¬ 
visor,  ambiente  de  trabalho,  desempenho  no  emprego, 
e  satisfação  do  trabalhador).  SEM  fornece  um  meio  de 
não  somente  avaliar  cada  uma  das  relações  simultanea¬ 
mente  no  lugar  de  análises  em  separado,  mas  também  de 
incorporar  as  escalas  de  múltiplos  itens  na  análise  para 
explicar  o  erro  de  medida  associado  com  cada  escala. 


DIRETRIZES  PARA  ANÁLISES 
MULTIVARIADAS  E  INTERPRETAÇÃO 

Como  mostrado  neste  capítulo,  o  caráter  diverso  da  aná¬ 
lise  multivariada  conduz  a  uma  poderosa  capacidade  ana¬ 
lítica  e  preditiva.  Esse  poder  é  especialmente  tentador 
quando  o  pesquisador  está  inseguro  sobre  o  planejamen¬ 
to  de  análise  mais  apropriado  e  confia,  no  lugar  disso,  na 
técnica  multivariada  como  um  substituto  para  o  desen¬ 
volvimento  conceituai  necessário.  Mesmo  quando  corre¬ 
tamente  aplicada,  a  eficácia  na  acomodação  de  múltiplas 
variáveis  e  relações  cria  substancial  complexidade  nos  re¬ 
sultados  e  suas  interpretações. 

Diante  dessa  complexidade,  advertimos  o  pesquisador 
para  proceder  apenas  quando  a  necessária  base  conceituai 
para  suportar  a  técnica  selecionada  foi  desenvolvida.  Já 
discutimos  diversas  questões  particularmente  aplicáveis 
à  análise  multivariada  e,  apesar  de  não  haver  uma  “res¬ 
posta”  única,  julgamos  que  a  análise  e  a  interpretação  de 
qualquer  problema  multivariado  podem  ser  auxiliadas 
seguindo-se  uma  série  de  diretrizes  gerais.  Apesar  de  não 
ser  uma  lista  exaustiva  de  considerações,  essas  diretrizes 
representam  mais  uma  “filosofia  de  análise  multivariada” 


que  nos  tem  sido  útil.  As  seções  seguintes  discutem  esses 
pontos  sem  obedecer  a  uma  ordem  particular,  e  com  igual 
ênfase  em  todos. 

Estabelecer  significâncía  prática,  bem 
como  significância  estatística 

A  força  da  análise  multivariada  é  sua  habilidade  aparen¬ 
temente  mágica  de  classificar  um  grande  número  de  pos¬ 
síveis  alternativas  e  encontrar  aquelas  que  têm  significân¬ 
cia  estatística.  Entretanto,  com  esse  poder  vem  também 
a  cautela.  Muitos  pesquisadores  ficam  míopes  ao  se  con¬ 
centrarem  somente  na  significância  alcançada  dos  resulta¬ 
dos  sem  compreender  suas  interpretações,  sejam  boas  ou 
ruins.  Ao  invés  disso,  o  pesquisador  deve  olhar  não  ape¬ 
nas  a  significância  estatística  dos  resultados,  mas  também 
sua  significância  prática.  A  significância  prática  faz  a  per¬ 
gunta  “E  daí?”.  Para  qualquer  aplicação  administrativa, 
os  resultados  devem  ter  um  efeito  demonstrável  que  justi¬ 
fique  uma  ação.  Em  termos  acadêmicos,  a  pesquisa  está  se 
concentrando  não  apenas  em  resultados  estatisticamente 
significantes,  mas  também  em  suas  implicações  substanti¬ 
vas  e  teóricas,  as  quais  são  muitas  vezes  extraídas  de  sua 
significância  prática. 


Por  exemplo,  uma  análise  de  regressão  é  usada  para  pre¬ 
ver  intenções  de  recompra,  medidas  como  a  probabili¬ 
dade  entre  0  e  100  de  que  o  cliente  comprará  novamente 
da  firma.  O  estudo  é  conduzido  e  os  resultados  retornam 
significantes  no  nível  de  significância  de  0,05.  Os  executi¬ 
vos  se  apressam  em  acatar  os  resultados  e  modificar  a  es¬ 
tratégia  da  firma  de  acordo  com  eles.  No  entanto,  passa 
despercebido  que,  mesmo  que  a  relação  fosse  significan- 
te,  a  habilidade  de  previsão  era  pobre  -  tão  pobre  que  a 
estimativa  de  probabilidade  de  recompra  poderia  variar 
±  20%  no  nível  de  significância  de  0,05.  A  relação  “es¬ 
tatisticamente  signiflcante”  poderia,  portanto,  ter  uma 
margem  de  erro  de  40  pontos  percentuais!  Um  cliente 
previsto  como  tendo  50%  de  chance  de  retornar  poderia 
realmente  ter  probabilidades  de  30  a  70%,  representan¬ 
do  níveis  inaceitáveis  para  uma  ação.  Se  pesquisadores  e 
administradores  tivessem  sondado  a  significância  prática 
ou  administrativa  dos  resultados,  teriam  concluído  que  a 
relação  ainda  precisava  de  refinamento,  caso  devesse  ser 
confiável  a  ponto  de  orientar  qualquer  estratégia. 


Reconhecer  que  o  tamanho  da 
amostra  afeta  todos  os  resultados 

A  discussão  sobre  poder  estatístico  demonstrou  o  impac¬ 
to  profundo  que  o  tamanho  da  amostra  representa  para 
atingir  a  significância  estatística,  tanto  para  pequenas 
amostras  quanto  grandes.  Para  amostras  menores,  a  so¬ 
fisticação  e  complexidade  da  técnica  multivariada  podem 
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facilmente  resultar  em  (1)  baixíssimo  poder  estatístico 
para  o  teste  identificar  realisticamente  resultados  sig- 
niflcantes,  ou  (2)  um  “ajuste”  muito  fácil  dos  dados,  de 
modo  que  os  resultados  são  artificialmente  bons  porque 
se  ajustam  muito  bem  na  amostra,  mas  sem  poder  de  ge¬ 
neralização. 

Um  impacto  semelhante  também  ocorre  para  amos¬ 
tras  muito  grandes,  as  quais,  como  anteriormente  discu¬ 
tido,  podem  tornar  os  testes  estatísticos  muito  sensíveis. 
Sempre  que  tamanhos  de  amostras  excederem  400  res- 
pondentes,  o  pesquisador  deverá  examinar  todos  os  resul¬ 
tados  significantes  para  garantir  que  tenham  significância 
prática  devido  ao  poder  estatístico  aumentado  pelo  tama¬ 
nho  da  amostra. 

Tamanhos  de  amostra  também  afetam  os  resultados 
quando  a  análise  envolve  grupos  de  respondentes,  como 
na  análise  discriminante  ou  em  MANOVA.  Tamanhos 
de  amostra  diferentes  entre  grupos  influenciam  os  re¬ 
sultados  e  exigem  interpretação  e/ou  análise  adicionais. 
Logo,  um  pesquisador  ou  usuário  de  técnicas  multivaria- 
das  sempre  deve  avaliar  os  resultados  à  luz  da  amostra 
usada  na  análise. 

Conhecer  seus  dados 

As  técnicas  multivariadas,  por  natureza,  identificam  rela¬ 
ções  complexas  muito  difíceis  de  serem  representadas  de 
maneira  simples.  Conseqüentemente,  a  tendência  é  acei¬ 
tar  os  resultados  sem  o  exame  comum  que  se  promove 
nas  análises  univariada  e  bivariada  (p.  ex.,  diagramas  de 
dispersão  de  correlações  e  gráficos  de  caixas  em  compa¬ 
rações  de  médias).  No  entanto,  tais  atalhos  podem  ser  um 
prelúdio  para  o  desastre.  A  análise  multivariada  demanda 
um  exame  até  mesmo  mais  rigoroso  dos  dados,  pois  a  in¬ 
fluência  de  observações  atípicas,  violações  das  suposições 
e  dados  perdidos  podem  aparecer  em  diversas  variáveis 
com  efeitos  substanciais. 

Um  conjunto  crescente  de  técnicas  de  diagnóstico 
permite  a  descoberta  dessas  relações  multivariadas  de 
maneiras  muito  semelhantes  aos  métodos  univariados  e 
bivariados.  O  pesquisador  multivariado  deve  dispor  de 
tempo  para  usar  essas  medidas  diagnósticas  para  uma  me¬ 
lhor  compreensão  dos  dados  e  das  relações  básicas  exis¬ 
tentes.  Com  essa  compreensão,  o  pesquisador  se  agarra 
não  apenas  ao  “quadro  geral”,  mas  também  sabe  onde 
procurar  por  formulações  alternativas  do  modelo  original 
que  podem  ajudar  no  ajuste  do  modelo,  como  relações 
não-lineares  e  interativas. 

Esforçar-se  por  modelos  parcimoniosos 

As  técnicas  multivariadas  são  planejadas  para  acomodar 
múltiplas  variáveis  na  análise.  Essa  característica,  contu¬ 
do,  não  deveria  substituir  o  desenvolvimento  do  modelo 
conceituai  antes  de  as  técnicas  multivariadas  serem  aplica¬ 
das.  Apesar  de  sempre  ser  mais  importante  evitar  a  omis¬ 
são  de  uma  variável  preditora  crítica,  o  que  se  chama  de 


erro  de  especificação,  o  pesquisador  também  deve  evitar 
a  inserção  indiscriminada  de  variáveis,  esperando  que  a 
técnica  multivariada  “arrume”  as  variáveis  relevantes,  por 
duas  razões  fundamentais: 

1.  Variáveis  irrelevantes  geralmente  aumentam  a  habilidade 
da  técnica  de  ajustar  os  dados  da  amostra,  mas  ao  preço  de 
superajustar  os  dados  e  tornar  os  resultados  menos  generali¬ 
záveis  à  população.  Tratamos  dessa  questão  mais  detalhada¬ 
mente  quando  o  conceito  de  graus  de  liberdade  é  discutido 
no  Capítulo  4. 

2.  A  despeito  das  variáveis  irrelevantes  tipicamente  não  vie- 
sarem  as  estimativas  das  variáveis  relevantes,  elas  podem 
mascarar  os  verdadeiros  efeitos  por  causa  de  um  aumento 
da  multicolinearidade.  Multicolinearidade  representa  o 
grau  em  que  qualquer  efeito  de  variável  pode  ser  previsto 
ou  explicado  pelas  outras  variáveis  na  análise.  Quando  a 
multicolinearidade  aumenta,  a  habilidade  de  definir  qual¬ 
quer  efeito  de  variável  diminui.  Incluir  variáveis  irrelevan¬ 
tes  ou  de  significado  marginal  pode  apenas  aumentar  o  grau 
de  multicolinearidade,  o  que  torna  a  interpretação  de  todas 
as  variáveis  mais  complicada. 

Logo,  incluir  variáveis  que  não  são  conceitualmente 
relevantes  pode  conduzir  a  vários  efeitos  nocivos,  mesmo 
se  as  variáveis  adicionais  não  viesam  diretamente  os  resul¬ 
tados  do  modelo. 

Examinar  seus  erros 

Mesmo  com  o  alcance  estatístico  das  técnicas  multivaria¬ 
das,  raramente  atingimos  a  melhor  previsão  na  primei¬ 
ra  análise.  O  pesquisador  deve  então  encarar  a  questão 
“Para  onde  vamos  a  partir  daqui?”.  A  melhor  resposta  é 
examinar  os  erros  na  previsão,  se  eles  são  os  resíduos  da 
análise  de  regressão,  os  erros  na  classificação  de  observa¬ 
ções  na  análise  discriminante,  ou  observações  atípicas  na 
análise  de  agrupamentos.  Em  cada  caso,  o  pesquisador 
deve  usar  os  erros  na  previsão  não  como  uma  medida  de 
falha  ou  algo  que  simplesmente  deve  ser  eliminado,  mas 
como  um  ponto  de  partida  para  diagnosticar  a  validade 
dos  resultados  obtidos  e  uma  indicação  das  relações  res¬ 
tantes  sem  explicação. 

Validar  seus  resultados 

A  habilidade  da  análise  multivariada  para  identificar  in- 
ter-relações  complexas  também  significa  que  podem  ser 
encontrados  resultados  específicos  apenas  para  a  amos¬ 
tra  e  não-generalizáveis  para  a  população.  O  pesquisador 
sempre  deve  garantir  que  haja  observações  suficientes  por 
parâmetro  estimado,  para  evitar  “superajustamento”  da 
amostra,  como  já  discutido.  Contudo,  igualmente  impor¬ 
tantes  são  os  esforços  para  validar  os  resultados  por  qual¬ 
quer  dentre  os  vários  métodos,  incluindo: 

1.  Separar  a  amostra,  e  usar  uma  subamostra  para  estimar  o 
modelo  e  a  segunda  para  estimar  a  precisão  de  previsão. 

2.  Juntar  uma  amostra  em  separado  para  garantir  que  os  resul¬ 
tados  são  apropriados  para  outras  amostras. 


CAPITULO  1  Introdução  39 


3.  Empregar  a  técnica  bootstrapping  [6],  a  qual  valida  um  mo¬ 
delo  multivariado  pela  extração  de  um  grande  número  de 
subamostras,  estimando  modelos  para  cada  subamostra  e 
então  determinando  os  valores  para  as  estimativas  de  parâ¬ 
metros  a  partir  do  conjunto  de  modelos,  calculando  a  média 
de  cada  coeficiente  estimado  ao  longo  de  todos  os  modelos 
de  sub-amostras.  Essa  abordagem  também  não  se  baseia  em 
suposições  estatísticas  para  avaliar  se  um  parâmetro  difere 
de  zero  (ou  seja,  são  os  coeficientes  estimados  estatistica¬ 
mente  diferentes  de  zero  ou  não?).  Em  vez  disso,  ela  exami¬ 
na  os  valores  reais  a  partir  de  repetidas  amostras  para  fazer 
tal  avaliação. 

Sempre  que  uma  técnica  multivariada  for  empregada, 
o  pesquisador  deve  se  esforçar  não  apenas  para  estimar 
um  modelo  significante,  mas  para  garantir  que  ele  seja  re¬ 
presentativo  da  população  como  um  todo.  Lembre-se  de 
que  o  objetivo  não  é  determinar  o  melhor  “ajuste”  apenas 
para  os  dados  da  amostra,  mas  desenvolver  um  modelo 
que  melhor  descreva  a  população  como  um  todo. 


UM  TRATAMENTO  ESTRUTURADO 
PARA  CONSTRUIR  MODELOS 
MULTIVARIADOS 

À  medida  que  discutimos  as  numerosas  técnicas  multi- 
variadas  disponíveis  ao  pesquisador  e  a  miríade  de  ques¬ 
tões  envolvidas  em  suas  aplicações,  fica  aparente  que  a 
conclusão  bem-sucedida  de  uma  análise  multivariada  en¬ 
volve  mais  do  que  somente  a  seleção  do  método  correto. 
Questões  que  variam  da  definição  do  problema  à  diagnose 
crítica  dos  resultados  devem  ser  abordadas.  Para  ajudar  o 
pesquisador  ou  o  usuário  a  aplicar  métodos  multivariados, 
um  tratamento  com  seis  passos  para  a  análise  multivariada 
é  apresentado.  A  meta  não  é  fornecer  um  conjunto  rígido 
de  procedimentos  a  serem  seguidos,  mas  sim  orientações 
que  enfatizam  uma  maneira  de  construir  modelos.  Esse 
tratamento  para  a  construção  de  modelos  se  concentra  na 
análise  em  um  plano  de  pesquisa  bem-definido,  começan¬ 
do  com  um  modelo  conceituai  que  detalhe  as  relações  a  se¬ 
rem  examinadas.  Uma  vez  definido  em  termos  conceituais, 
as  questões  empíricas  podem  ser  abordadas,  incluindo  a 
seleção  da  técnica  multivariada  específica  e  os  problemas 
de  implementação.  Depois  que  foram  obtidos  resultados 
significantes,  concentramo-nos  em  sua  interpretação,  com 
especial  atenção  à  variável  estatística.  Finalmente,  as  me¬ 
didas  diagnósticas  garantem  que  o  modelo  não  é  válido 
apenas  para  os  dados  da  amostra,  mas  que  é  tão  generali¬ 
zável  quanto  possível.  A  discussão  que  se  segue  brevemen¬ 
te  descreve  cada  passo  desse  tratamento. 

Esse  processo  de  seis  passos  para  construir  modelos 
fornece  uma  estrutura  para  desenvolver,  interpretar  e  vali¬ 
dar  qualquer  análise  multivariada.  Cada  pesquisador  deve 
desenvolver  critérios  para  “sucesso”  ou  “falha”  em  cada 
estágio,  mas  as  discussões  de  cada  técnica  fornecem  orien¬ 
tações  sempre  que  disponíveis.  Neste  ponto,  a  ênfase  em 


um  tratamento  de  construção  de  modelos,  em  vez  de  sim¬ 
plesmente  apontar  as  especificidades  de  cada  técnica,  deve¬ 
ria  fornecer  uma  base  mais  ampla  para  o  desenvolvimento, 
estimação  e  interpretação  de  modelos,  que  irão  melhorar  a 
análise  multivariada  do  profissional  e  do  acadêmico. 

Estágio  1:  Definição  do  problema 
da  pesquisa,  dos  objetivos  e  da 
técnica  multivariada  a  ser  usada 

O  ponto  de  partida  para  qualquer  análise  multivariada  é 
definir  o  problema  da  pesquisa  e  os  objetivos  de  análise 
em  termos  conceituais,  antes  de  especificar  quaisquer  va¬ 
riáveis  ou  medidas.  O  papel  do  desenvolvimento  do  mo¬ 
delo  conceituai,  ou  da  teoria,  não  pode  ser  superestimado. 
Não  importa  se  é  pesquisa  aplicada  ou  acadêmica,  o  pes¬ 
quisador  deve  primeiro  ver  o  problema  em  termos  con¬ 
ceituais,  definindo  os  conceitos  e  identificando  as  relações 
fundamentais  a  serem  investigadas.  Desenvolver  um  mo¬ 
delo  conceituai  não  é  atribuição  exclusiva  de  acadêmicos; 
é  também  algo  ajustado  para  aplicação  no  mundo  real. 

Um  modelo  conceituai  não  precisa  ser  complexo  e  de¬ 
talhado;  pode  ser  uma  simples  representação  das  relações 
a  serem  estudadas.  Se  uma  relação  de  dependência  é  pro¬ 
posta  como  o  objetivo  de  pesquisa,  o  pesquisador  preci¬ 
sa  especificar  os  conceitos  dependentes  e  independentes. 
Para  uma  aplicação  de  uma  técnica  de  interdependência, 
as  dimensões  de  estrutura  ou  similaridade  devem  ser  espe¬ 
cificadas.  Note  que  um  conceito,  diferentemente  de  uma 
variável,  é  definido  em  ambas  as  situações,  sejam  de  de¬ 
pendência  ou  de  interdependência.  O  pesquisador  primei¬ 
ro  identifica  as  idéias  ou  os  tópicos  de  interesse,  em  vez 
de  se  concentrar  nas  medidas  específicas  a  serem  usadas. 
Essa  seqüência  minimiza  a  chance  de  conceitos  relevantes 
serem  omitidos  no  esforço  de  desenvolver  medidas  e  de 
definir  as  especificidades  do  plano  de  pesquisa.  Os  leitores 
interessados  no  desenvolvimento  de  modelos  conceituais 
devem  ver  o  Capítulo  10. 

Com  os  objetivos  e  o  modelo  conceituai  especificados, 
o  pesquisador  deve  apenas  escolher  a  técnica  multivaria¬ 
da  apropriada.  O  uso  de  um  método  de  dependência  ou 
interdependência  é  selecionado,  e  então  a  última  decisão 
é  selecionar  a  técnica  em  particular  com  base  nas  carac¬ 
terísticas  de  medidas  das  variáveis  dependentes  e  inde¬ 
pendentes.  Variáveis  para  cada  conceito  são  especificadas 
antes  do  estudo  em  seu  planejamento,  mas  podem  ser 
re-especificadas  ou  mesmo  estabelecidas  de  uma  forma 
diferente  (p.  ex.,  transformações  ou  criações  de  variáveis 
dicotômicas)  após  a  coleta  de  dados. 

Estágio  2:  Desenvolvimento  do  plano  de  análise 

Com  o  modelo  conceituai  estabelecido  e  a  técnica  multi¬ 
variada  selecionada,  a  atenção  se  volta  para  a  implemen¬ 
tação.  Para  cada  técnica,  o  pesquisador  deve  desenvolver 
um  plano  de  análise  que  aborde  as  questões  particulares 
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a  seu  propósito  e  projeto.  As  questões  incluem  considera¬ 
ções  gerais,  como  tamanho  mínimo  ou  desejado  da  amos¬ 
tra  e  tipos  permitidos  ou  exigidos  de  variáveis  (métricas 
versus  não-métricas)  e  métodos  de  estimação,  além  de  as¬ 
pectos  específicos,  como  o  tipo  de  medidas  de  associação 
usadas  em  mapeamento  perceptual,  a  estimação  de  resul¬ 
tados  agregados  ou  desagregados  em  análise  conjunta,  ou 
o  uso  de  formulações  especiais  de  variáveis  para  represen¬ 
tar  efeitos  não-lineares  ou  interativos  em  regressão.  Em 
cada  caso,  essas  questões  resolvem  detalhes  específicos  e 
finalizam  a  formulação  do  modelo  e  exigências  para  a  co¬ 
leta  de  dados. 

Estágio  3:  Avaliação  das  suposições 
inerentes  à  técnica  multivariada 

Com  os  dados  coletados,  a  primeira  tarefa  não  é  estimar  o 
modelo  multivariado,  mas  avaliar  as  suposições  subjacen¬ 
tes.  Todas  as  técnicas  multivariadas  têm  suposições  ine¬ 
rentes,  tanto  estatísticas  quanto  conceituais,  que  influen¬ 
ciam  muito  suas  habilidades  para  representar  relações 
multivariadas.  Para  as  técnicas  baseadas  em  inferência  es¬ 
tatística,  as  suposições  de  normalidade  multivariada,  line¬ 
aridade,  independência  de  termos  de  erro,  e  igualdade  de 
variâncias  em  uma  relação  de  dependência  devem  todas 
ser  satisfeitas.  A  avaliação  dessas  suposições  é  discutida 
em  maiores  detalhes  no  Capítulo  2.  Cada  técnica  também 
envolve  uma  série  de  suposições  conceituais  que  lidam 
com  questões  como  a  formulação  de  modelo  e  os  tipos  de 
relações  representadas.  Antes  que  qualquer  estimação  de 
modelo  seja  tentada,  o  pesquisador  deve  garantir  que  as 
suposições  estatísticas  e  conceituais  estejam  satisfeitas. 

Estágio  4:  Estimação  do  modelo  multivariado 
e  avaliação  do  ajuste  geral  do  modelo 

Com  as  suposições  satisfeitas,  a  análise  inicia  a  real  esti¬ 
mação  do  modelo  multivariado  e  uma  avaliação  do  ajuste 
geral  do  modelo.  No  processo  de  estimação,  o  pesquisador 
pode  escolher  entre  opções  para  atender  características 
específicas  dos  dados  (p.  ex.,  uso  de  covariáveis  estatísti¬ 
cas  em  MANOVA)  ou  maximizar  o  ajuste  dos  dados  (p. 
ex.,  rotação  de  fatores  ou  funções  discriminantes).  Depois 
que  o  modelo  é  estimado,  o  seu  ajuste  geral  é  avaliado 
para  estabelecer-se  se  atinge  níveis  aceitáveis  sobre  os  cri¬ 
térios  estatísticos  (p.  ex.,  nível  de  significância),  se  iden¬ 
tifica  as  relações  propostas  e  se  tem  significância  prática. 
Muitas  vezes,  o  modelo  é  reespecificado,  em  uma  tenta¬ 
tiva  de  atingir  melhores  níveis  de  ajuste  e/ou  explicação. 
Em  todos  os  casos,  contudo,  um  modelo  aceitável  deve 
ser  obtido  antes  de  se  prosseguir. 

Não  importa  qual  nível  de  ajuste  geral  do  modelo  seja 
conseguido,  o  pesquisador  também  deve  determinar  se 
os  resultados  são  excessivamente  afetados  por  alguma 
observação  ou  pequeno  conjunto  de  observações  que  in¬ 
dique  que  os  resultados  podem  ser  instáveis  ou  não-gene¬ 


ralizáveis.  Esses  esforços  garantem  que  os  resultados  são 
“robustos”  e  estáveis,  aplicando-se  razoavelmente  bem  a 
todas  as  observações  na  amostra.  Observações  de  ajustes 
prejudiciais  podem  ser  identificadas  como  observações 
atípicas,  observações  influentes  ou  resultados  errôneos  (p. 
ex.,  agrupamentos  unitários  ou  casos  muito  mal  classifica¬ 
dos  em  análise  discriminante). 

Estágio  5:  Interpretação  da(s) 
variável(eis)  estatística(s) 

Com  um  nível  aceitável  de  ajuste  do  modelo,  interpretar 
a(s)  variável(eis)  estatística(s)  revela  a  natureza  da  re¬ 
lação  multivariada.  A  interpretação  de  efeitos  para  va¬ 
riáveis  individuais  é  feita  examinando-se  os  coeficientes 
estimados  (pesos)  para  cada  variável  na  variável  estatís¬ 
tica  (p.  ex.,  pesos  de  regressão,  cargas  fatoriais  ou  utili¬ 
dades  conjuntas).  Além  disso,  algumas  técnicas  também 
estimam  múltiplas  variáveis  estatísticas  que  representam 
dimensões  latentes  de  comparação  ou  associação  (i.e., 
funções  discriminantes  ou  componentes  principais).  A 
interpretação  pode  conduzir  a  reespecificações  adicionais 
das  variáveis  e/ou  da  formulação  do  modelo,  onde  o  mo¬ 
delo  é  reestimado  e  então  novamente  interpretado.  O  ob¬ 
jetivo  é  identificar  evidência  empírica  de  relações  multiva¬ 
riadas  nos  dados  da  amostra  que  possam  ser  generalizadas 
para  a  população  total. 

Estágio  6:  Validação  do  modelo  multivariado 

Antes  de  aceitar  os  resultados,  o  pesquisador  deve  sub¬ 
metê-los  a  um  conjunto  final  de  análises  diagnósticas  que 
avaliem  o  grau  de  generabilidade  dos  resultados  pelos 
métodos  de  validação  disponíveis.  As  tentativas  de  vali¬ 
dar  o  modelo  são  direcionadas  no  sentido  de  demonstrar 
a  generalidade  dos  resultados  para  a  população  total  (ver 
discussão  anterior  sobre  técnicas  de  validação).  Essas  aná¬ 
lises  diagnósticas  acrescentam  pouco  à  interpretação  dos 
resultados,  mas  podem  ser  vistas  como  uma  “garantia”  de 
que  os  resultados  são  os  melhores  descritivos  dos  dados  e 
ainda  generalizáveis  à  população. 

Um  fluxograma  de  decisão 

Para  cada  técnica  multivariada,  a  abordagem  de  seis  passos 
para  a  construção  de  modelos  multivariados  será  retratada 
em  um  fluxograma  de  decisão  dividido  em  duas  seções.  A 
primeira  seção  (estágios  1  a  3)  lida  com  as  questões  rela¬ 
tivas  à  preparação  para  a  estimação  do  modelo  real  (i.e., 
objetivos  da  pesquisa,  considerações  sobre  planejamento 
da  pesquisa,  e  teste  das  suposições).  A  segunda  seção  do 
fluxograma  de  decisão  (estágios  4  a  6)  trata  dos  aspectos 
pertinentes  à  estimação  do  modelo,  interpretação  e  valida¬ 
ção.  O  fluxograma  de  decisão  fornece  ao  pesquisador  um 
método  simplificado,  mas  sistemático,  de  uso  da  aborda¬ 
gem  estrutural  de  construção  do  modelo  multivariado  em 
qualquer  aplicação  da  técnica  multivariada. 
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BASES  DE  DADOS 

Para  melhor  explicar  e  ilustrar  cada  técnica  multivaria- 
da,  usamos  conjuntos  de  dados  hipotéticos  ao  longo  do 
livro.  Os  conjuntos  de  dados  são  para  as  Indústrias  HBAT 
(HBAT),  um  fabricante  de  produtos  de  papel.  Considera- 
se  cada  conjunto  de  dados  como  baseado  em  questionários 
preenchidos  por  clientes  em  um  site  seguro  administrado 
por  uma  consagrada  empresa  de  pesquisa  de  mercado.  A 
companhia  de  pesquisa  contata  gerentes  de  compras  e  os 
encoraja  a  participarem.  Para  fazer  isso,  gerentes  acessam 
o  site  e  completam  o  questionário.  Os  conjuntos  de  dados 
são  suplementados  por  outra  informação  compilada  e  ar¬ 
mazenada  no  banco  de  dados  da  HBAT  e  são  acessíveis 
através  de  seu  sistema  de  suporte  de  decisão. 

Base  de  dados  primária 

A  base  de  dados  primária,  consistindo  de  100  observações 
sobre  18  variáveis  separadas,  é  sustentada  por  um  estudo 
de  segmentação  de  mercado  de  clientes  HBAT.  A  HBAT 
vende  produtos  de  papel  para  dois  segmentos  do  mercado: 
a  indústria  de  jornais  e  a  indústria  de  revistas.  Além  dis¬ 
so,  os  produtos  de  papel  são  vendidos  a  esses  segmentos 
do  mercado  ou  diretamente  ao  cliente,  ou  indiretamente 
via  um  intermediário.  Dois  tipos  de  informação  foram  co¬ 
letados  nas  pesquisas.  O  primeiro  tipo  foi  sobre  percep¬ 
ções  de  desempenho  da  HBAT  sobre  13  atributos.  Esses 
atributos,  desenvolvidos  através  de  grupos  de  foco,  um 
pré-teste,  e  uso  em  estudos  anteriores,  são  considerados 
os  mais  influentes  na  seleção  de  fornecedores  na  indústria 
de  papel.  Entre  os  respondentes  havia  gerentes  de  com¬ 
pras  de  firmas  que  compram  da  HBAT,  e  eles  avaliaram  a 
HBAT  em  cada  um  dos  13  atributos  usando  uma  escala  de 
0  a  10,  com  10  sendo  “excelente”  e  0,  “pobre”.  O  segundo 
tipo  de  informação  se  refere  a  resultados  de  compra  e  re¬ 
lações  nos  negócios  (p.  ex.,  satisfação  com  a  HBAT  e  se  a 
firma  consideraria  uma  aliança/parceria  estratégica  com  a 
HBAT).  Um  terceiro  tipo  de  informação  está  disponível 
a  partir  dos  dados  da  HBAT  e  inclui  itens  como  tamanho 
do  cliente  e  extensão  da  relação  de  compra. 

Analisando  os  dados,  a  HBAT  pode  desenvolver  uma 
melhor  compreensão  das  características  de  seus  clientes  e 
das  relações  entre  suas  percepções  da  HBAT  e  suas  ações 
em  relação  à  HBAT  (p.  ex.,  satisfação  e  probabilidade  de 
recomendar).  A  partir  dessa  compreensão  de  seus  clien¬ 
tes,  a  HBAT  estará  em  uma  boa  posição  para  desenvol¬ 
ver  seu  plano  de  marketing  para  o  próximo  ano.  Breves 
descrições  das  variáveis  da  base  de  dados  são  fornecidas 
na  Tabela  1-3,  na  qual  as  variáveis  são  classificadas  como 
independentes  ou  dependentes,  e  métricas  ou  não-métri- 
cas.  Além  disso,  uma  lista  completa  e  uma  cópia  eletrôni¬ 
ca  da  base  de  dados  estão  disponíveis  na  Web  em  www. 
bookman.com.br.  Uma  definição  de  cada  variável  e  uma 
explicação  de  sua  codificação  são  dadas  nas  seções  que  se 
seguem. 


Variáveis  de  classificação  do  banco  de  dados 

Como  respondentes  foram  selecionados  para  a  amostra 
a  ser  usada  pela  empresa  de  pesquisa  de  marketing,  cin¬ 
co  variáveis  foram  também  extraídas  do  banco  de  dados 
HBAT  para  refletir  as  características  básicas  da  firma  e 
sua  relação  de  negócios  com  a  HBAT.  As  cinco  variá¬ 
veis  são: 

Aj  Tipo  de  cliente  Período  de  tempo  em  que 

um  dado  cliente  tem 
comprado  da  HBAT: 

1  =  menos  de  um  ano 

2  =  entre  1  e  5  anos 

3  =  mais  do  que  5  anos 

X2  Tipo  de  indústria  Tipo  de  indústria  que 

compra  os  produtos  de 
papel  da  HBAT: 

0  =  indústria  de  revistas 
1  =  indústria  de  jornais 

TTj  Tamanho  da  firma  Quantia  de  empregados: 

0  =  empresa  pequena, 
menos  de  500 
empregados 
1  =  empresa  grande,  500 
ou  mais  empregados 
Região  Local  do  cliente: 

0  =  EUA/ América  do 
Norte 

1  =  fora  da  América  do 
Norte 

Aj  Sistema  de  Como  os  produtos  de  papel 

distribuição  são  vendidos  para  clientes: 

0  =  vendidos 
indiretamente 
através  de  um 
intermediário 
1  =  vendidos 
diretamente 

Percepções  de  HBAT 

As  percepções  sobre  HBAT  de  cada  cliente  em  um  con¬ 
junto  de  funções  de  negócios  foram  medidas  em  uma  esca¬ 
la  gráfica  de  avaliação,  onde  uma  linha  de  10  centímetros 
foi  desenhada  entre  os  extremos  chamados  de  “Pobre”  e 
“Excelente”. 


Pobre  Excelente 

Como  parte  da  pesquisa,  os  respondentes  indicaram 
suas  percepções  fazendo  uma  marca  em  algum  ponto  da 
linha.  A  posição  da  marca  era  eletronicamente  observada, 
e  a  distância  a  partir  de  0  (em  centímetros)  era  gravada 
na  base  de  dados  para  aquela  pesquisa  em  particular.  O 


42  Análise  Multivariada  de  Dados 


resultado  foi  uma  variação  de  escala  de  0  a  10,  arredon¬ 
dada  em  uma  única  casa  decimal.  Os  13  atributos  HBAT 


avaliados 

pelos  respondentes  foram: 

Qualidade  do 
produto 

Nível  percebido  de 
qualidade  dos  produtos  de 
papel  HBAT 

Atividades  de 

comércio 

eletrônico/ 

Web  site 

Imagem  geral  do  Web  site 
da  HBAT,  especialmente 
a  facilidade  de  uso 

Suporte  técnico 

Grau  em  que  o  apoio 
técnico  é  oferecido  para 
ajudar  em  questões  sobre 
produto/serviços 

A, 

Solução  de 
reclamação 

Grau  em  que  as 
reclamações  são  resolvidas 
em  termos  de  prazo  e 
eficiência 

^10 

Anúncio 

Percepções  sobre  as 
campanhas  de  anúncios  da 
HBAT  em  todos  os  tipos 
de  mídia 

Linha  de  produto 


^12 

Imagem  da  força 
de  venda 

^13 

Preço  competitivo 

^14 

Garantia  e 
reclamações 

^15 

Novos  produtos 

^16 

Encomenda  e 
cobrança 

Profundidade  e  amplitude 
da  linha  de  produtos  da 
HBAT  para  atender  às 
necessidades  dos  clientes 
Imagem  geral  da  força  de 
venda  da  HBAT 
Grau  em  que  a 
HBAT  oferece  preços 
competitivos 
Grau  em  que  a  HBAT 
atua  diante  das  garantias 
e  reclamações  sobre 
produtos  e  serviços 
Grau  em  que  a  HBAT 
desenvolve  e  vende  novos 
produtos 

Percepções  de  que 
encomenda  e  cobrança  são 
lidadas  com  eficiência  e 
corretamente 


TABELA  1  -3  Descrição  de  variáveis  da  base  de  dados 


Descrição  da  variável 

Tipo  de  variável 

Variáveis  de  classificação  do  banco  de  dados 

Tipo  de  cliente 

não-métrica 

X, 

Tipo  de  indústria 

não-métrica 

Tamanho  da  firma 

não-métrica 

Região 

não-métrica 

>^5 

Sistema  de  distribuição 

não-métrica 

Variáveis  de  percepções  de  desempenho 

Qualidade  do  produto 

métrica 

Atividades  de  comércio  eletrônico/Web  site 

métrica 

Suporte  técnico 

métrica 

Solução  de  reclamação 

métrica 

Anúncio 

métrica 

Linha  de  produto 

métrica 

Imagem  da  equipe  de  venda 

métrica 

Preço  competitivo 

métrica 

Garantia  e  reclamações 

métrica 

Novos  produtos 

métrica 

Encomenda  e  cobrança 

métrica 

>^,7 

Flexibilidade  de  preço 

métrica 

Velocidade  de  entrega 

métrica 

Medidas  de  resultado/relaçáo 

Satisfação 

métrica 

><■20 

Probabilidade  de  recomendação 

métrica 

Probabilidade  de  futura  compra 

métrica 

X,, 

Atual  nível  de  compra/uso 

métrica 

><■23 

Considerar  aliança/parceria  estratégica  no  futuro 

não-métrica 
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Flexibilidade 
de  preço 


Velocidade  de 
entrega 


Percepção  sobre  a 
disposição  dos 
representantes  de  vendas 
da  FIBAT  para  negociar 
preços  nas  compras  de 
produtos  de  papel 
Tempo  de  demora  para  a 
entrega  de  produtos 
de  papel  uma  vez  que 
a  encomenda  seja 
confirmada. 


Resultados  de  compras 

Foram  obtidas  cinco  medidas  específicas  que  refletem  os 
resultados  das  relações  de  compras  do  respondente  com  a 
HBAT.  Essas  medidas  incluem  as  seguintes: 


X^g  Satisfação  do 
cliente 


X2Q  Probabilidade 
de  recomendar 
a  HBAT 


X21  Probabilidade 
de  futuras 
compras  da 
HBAT 

X22  Percentual  de 
compras 
da  HBAT 


X22  Percepção  de 
futura  relação 
com  a  HBAT 


Satisfação  do  cliente  com 
as  últimas  compras  feitas 
na  HBAT,  medida  em  uma 
escala  gráfica  de  10  pontos. 

Probabilidade  de 
recomendar  a  HBAT  para 
outras  empresas  como 
fornecedor  de  produtos 
de  papel,  medida  em  uma 
escala  de  10  pontos. 
Probabilidade  de 
futuramente  comprar 
produtos  de  papel  da 
HBAT,  medida  em  uma 
escala  de  10  pontos. 
Percentual  das  necessidades 
da  firma  respondente 
de  compras  da  HBAT, 
medido  em  uma  escala 
percentual  de  100  pontos. 
Grau  em  que  o  cliente/ 
respondente  vê  a  si  mesmo 
em  parceria/aliança  com  a 
HBAT: 

0  =  não  consideraria 

1  =  sim,  consideraria 
aliança  ou  parceria 
estratégica 


Outras  bases  de  dados 

Outras  cinco  bases  de  dados  especializadas  são  emprega¬ 
das  no  texto.  Primeiro,  o  Capítulo  6  usa  uma  versão  ex¬ 
pandida  da  base  de  dados  HBAT  contendo  200  respon- 
dentes  (HBAT200)  que  fornece  tamanhos  de  amostras 
suficientes  para  análises  MANOVA  mais  complexas.  O 
Capítulo  2  utiliza  uma  base  de  dados  menor  de  muitas 
dessas  variáveis  obtidas  em  algumas  pesquisas.  O  objetivo 


é  ilustrar  a  identificação  de  observações  atípicas,  o  manu¬ 
seio  de  dados  perdidos  e  o  teste  de  suposições  estatísticas. 
O  Capítulo  9  sobre  MDS  e  análise  de  correspondência  e 
os  capítulos  SEM  (10, 11  e  12)  usam  bases  de  dados  distin¬ 
tas  que  atendem  às  exigências  específicas  daquelas  técni¬ 
cas.  Em  cada  caso,  a  base  de  dados  é  descrita  de  maneira 
mais  completa  naqueles  capítulos.  Uma  listagem  completa 
dessas  bases  de  dados  é  dada  em  www.bookman.com.br. 


ORGANIZAÇÃO  DOS 
DEMAIS  CAPÍTULOS 

Os  outros  capítulos  do  texto  são  organizados  em  cinco  se¬ 
ções;  cada  uma  aborda  um  estágio  separado  para  executar 
uma  análise  multivariada. 


Seção  I:  Preparação  para  uma 
análise  multivariada 

A  seção  inicial  lida  com  questões  que  devem  ser  resolvidas 
antes  que  uma  análise  multivariada  possa  ser  aplicada.  Essa 
seção  começa  com  o  Capítulo  2,  o  qual  cobre  os  tópicos  de 
acomodação  de  dados  perdidos,  a  garantia  de  atender  as 
suposições  estatísticas  inerentes,  e  a  identificação  de  obser¬ 
vações  atípicas  que  poderiam  influenciar  desproporcional¬ 
mente  os  resultados.  O  Capítulo  3  cobre  a  análise  fatorial, 
uma  técnica  particularmente  adequada  para  examinar  as 
relações  entre  variáveis  e  as  oportunidades  de  criar  escalas 
múltiplas.  Esses  dois  capítulos  se  combinam  para  fornecer 
ao  pesquisador  não  apenas  as  ferramentas  diagnósticas  ne¬ 
cessárias  para  preparar  os  dados  para  análise,  mas  também 
os  meios  para  redução  de  dados  e  construção  de  escala  que 
podem  ser  incluídos  em  outras  técnicas  multivariadas. 

Seção  II:  Técuicas  de  depeudêucia 

Essa  seção  trata  de  quatro  técnicas  de  dependência  -  re¬ 
gressão  múltipla  (Capítulo  4),  análise  discriminante  (Ca¬ 
pítulo  5),  análise  multivariada  de  variância  (Capítulo  6)  e 
análise  conjunta  (Capítulo  7).  Como  observado  anterior¬ 
mente,  as  técnicas  de  dependência  permitem  ao  pesquisa¬ 
dor  avaliar  o  grau  de  relação  entre  as  variáveis  dependen¬ 
tes  e  independentes.  As  técnicas  de  dependência  variam 
no  tipo  e  caráter  da  relação,  o  que  se  reflete  nas  proprieda¬ 
des  de  medida  das  variáveis  dependentes  e  independentes. 
Cada  técnica  é  examinada  sob  sua  perspectiva  única  de 
avaliar  uma  relação  de  dependência  e  sua  habilidade  de 
tratar  com  um  tipo  particular  de  objetivo  de  pesquisa. 

Seção  III:  Técnicas  de  interdependência 

Dois  capítulos  (Capítulos  8  e  9)  cobrem  as  técnicas  de 
análise  de  agrupamentos  e  mapeamento  perceptual.  Es¬ 
sas  técnicas  apresentam  ao  pesquisador  ferramentas  par¬ 
ticularmente  adequadas  para  avaliar  estruturas,  focali- 
zando-se  na  descrição  das  relações  entre  objetos,  sejam 
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respondentes  (análise  de  agrupamentos)  ou  objetos  como 
empresas,  produtos  e  assim  por  diante  (mapeamento  per- 
ceptual).  Deve-se  notar  que  uma  das  técnicas  primárias  de 
interdependência,  análise  fatorial,  e  sua  habilidade  para 
avaliar  a  relação  entre  variáveis,  é  abordada  na  Seção  I. 

Seção  IV:  Para  além  do  básico 

Essa  seção  apresenta  ao  pesquisador  uma  técnica  multi¬ 
variada  avançada  amplamente  usada,  a  saber,  modelagem 
de  equações  estruturais.  O  Capítulo  10  fornece  uma  visão 
geral  da  modelagem  de  equações  estruturais,  concentran- 
do-se  na  aplicação  de  um  processo  de  decisão  em  análises 
SEM.  Os  Capítulos  11  e  12  estendem  a  discussão  SEM 
para  as  duas  aplicações  mais  amplamente  usadas:  análise 
fatorial  confirmatória  (CEA,  confirmatory  factor  analysis) 
e  modelagem  estrutural. 

Resumo 

Análise  multivariada  de  dados  é  uma  poderosa  ferramen¬ 
ta  para  pesquisadores.  A  aplicação  apropriada  dessas  téc¬ 
nicas  revela  relações  que  em  outras  situações  não  seriam 
identificadas.  Este  capítulo  introduz  o  leitor  aos  principais 
conceitos  e  o  ajuda  a  fazer  o  seguinte: 

Explicar  o  que  é  análise  multivariada  e  quando  seu  uso  é 
adequado.  Técnicas  de  análise  multivariada  são  popula¬ 
res  porque  viabilizam  a  organizações  a  criar  conhecimen¬ 
to  e  assim  melhorar  suas  tomadas  de  decisões.  A  análise 
multivariada  se  refere  a  todas  as  técnicas  estatísticas  que 
simultaneamente  analisam  múltiplas  medidas  sobre  indiví¬ 
duos  ou  objetos  sob  investigação.  Desse  modo,  quaisquer 
análises  simultâneas  de  mais  do  que  duas  variáveis  podem 
ser  consideradas  como  análises  multivariadas. 

Alguma  confusão  pode  surgir  sobre  o  que  é  análise 
multivariada,  pois  o  termo  não  é  empregado  consistente¬ 
mente  na  literatura.  Alguns  pesquisadores  usam  o  termo 
multivariada  simplesmente  para  se  referir  ao  exame  de 
relações  entre  duas  ou  mais  variáveis.  Outros  utilizam  o 
termo  apenas  para  problemas  nos  quais  todas  as  múlti¬ 
plas  variáveis  são  assumidas  como  tendo  uma  distribuição 
normal  multivariada.  Neste  livro,  não  insistimos  em  uma 
definição  rígida  de  análise  multivariada.  No  lugar  disso,  a 
análise  multivariada  inclui  técnicas  de  múltiplas  variáveis, 
bem  como  técnicas  verdadeiramente  multivariadas,  pois 
acreditamos  que  o  conhecimento  de  técnicas  de  múltiplas 
variáveis  é  um  primeiro  passo  essencial  na  compreensão 
da  análise  multivariada. 

Discutir  a  natureza  das  escalas  de  medida  e  sua  relação 
com  técnicas  multivariadas.  A  análise  de  dados  envolve 
a  identificação  e  medida  de  variação  em  um  conjunto  de 
variáveis,  seja  entre  elas  mesmas,  seja  entre  uma  variável 
dependente  e  uma  ou  mais  variáveis  independentes.  A 
palavra-chave  aqui  é  medida,  porque  o  pesquisador  não 
pode  identificar  variação  a  menos  que  ela  possa  ser  me¬ 


dida.  Medida  é  importante  na  representação  precisa  dos 
conceitos  de  pesquisa  sendo  estudados  e  é  instrumental 
na  escolha  do  método  multivariado  de  análise  adequado. 
Dados  podem  ser  classificados  em  uma  entre  duas  cate¬ 
gorias  -  não-métricos  (qualitativos)  e  métricos  (quantita¬ 
tivos)  -  com  base  nos  tipos  de  atributos  ou  característi¬ 
cas  que  eles  representam.  O  pesquisador  deve  definir  o 
tipo  de  medida  para  cada  variável.  Para  o  computador,  os 
valores  são  apenas  números.  A  questão  de  dados  serem 
métricos  ou  não-métricos  afeta  o  que  os  mesmos  podem 
representar,  como  podem  ser  analisados  e  as  técnicas  mul¬ 
tivariadas  adequadas  para  uso. 

Entender  a  natnreza  do  erro  de  medida  e  sen  impacto 
sobre  a  análise  mnitivariada.  O  emprego  de  múltiplas 
variáveis  e  a  confiança  em  suas  combinações  (a  variável 
estatística)  em  métodos  multivariados  concentra  atenção 
em  um  tópico  complementar:  erro  de  medida.  Erro  de 
medida  é  o  grau  em  que  os  valores  observados  não  são 
representativos  dos  valores  “verdadeiros”.  Erro  de  me¬ 
dida  tem  muitas  fontes,  variando  de  erros  na  entrada  de 
dados  até  a  imprecisão  da  medida  e  a  falta  de  habilidade 
dos  respondentes  em  fornecer  informações  precisas.  As¬ 
sim,  todas  as  variáveis  usadas  em  técnicas  multivariadas 
devem  ser  consideradas  como  tendo  algum  grau  de  erro 
de  medida.  Quando  variáveis  com  erro  de  medida  são  em¬ 
pregadas  para  computar  correlações  ou  médias,  o  “ver¬ 
dadeiro”  efeito  é  parcialmente  mascarado  pelo  erro  de 
medida,  fazendo  com  que  as  correlações  se  enfraqueçam 
e  as  médias  sejam  menos  precisas. 

Determinar  qnal  técnica  mnitivariada  é  adeqnada  para  nm 
problema  específico  de  pesqnisa.  As  técnicas  multivaria¬ 
das  podem  ser  classificadas  com  base  em  três  julgamentos 
que  o  pesquisador  deve  fazer  sobre  o  objetivo  da  pesquisa 
e  a  natureza  dos  dados:  (1)  as  variáveis  podem  ser  divi¬ 
didas  em  independentes  e  dependentes  tomando-se  por 
base  alguma  teoria?  (2)  Se  podem,  quantas  variáveis  são 
tratadas  como  dependentes  em  uma  única  análise?,  e  (3) 
como  são  medidas  tanto  as  variáveis  dependentes  quanto 
as  independentes?  A  seleção  da  técnica  multivariada  ade¬ 
quada  depende  das  respostas  a  essas  três  perguntas. 

Definir  as  técnicas  específicas  íncinídas  em  análise  mnlti- 
variada.  Análise  multivariada  é  um  conjunto  de  técnicas 
em  contínuo  desenvolvimento  para  a  análise  de  dados  e 
que  engloba  um  vasto  domínio  de  possíveis  situações  de 
pesquisa.  Entre  as  técnicas  mais  consagradas  e  emergen¬ 
tes  estão  a  análise  de  componentes  principais  e  a  análise 
dos  fatores  comuns,  regressão  múltipla  e  correlação  múl¬ 
tipla,  análise  discriminante  múltipla  e  regressão  logística, 
análise  de  correlação  canônica,  análise  multivariada  de 
variância  e  covariância,  análise  conjunta,  análise  de  agru¬ 
pamentos,  mapeamento  perceptual,  também  conhecido 
como  escalonamento  multidimensional,  análise  de  corres¬ 
pondência,  e  modelagem  de  equações  estruturais  (SEM), 
que  inclui  a  análise  fatorial  confirmatória. 
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Discutir  as  diretrizes  para  aplicação  e  interpretação  de  aná¬ 
lises  multivariadas.  A  análise  multivariada  tem  poderosas 
capacidades  analíticas  e  preditivas.  O  poder  de  acomodar 
múltiplas  variáveis  e  relações  cria  substancial  complexidade 
nos  resultados  e  suas  interpretações.  Diante  dessa  comple¬ 
xidade,  o  pesquisador  é  advertido  a  usar  métodos  multiva- 
riados  somente  quando  foi  desenvolvida  a  exigida  funda¬ 
mentação  conceituai  para  apoiar  a  técnica  selecionada.  As 
seguintes  orientações  representam  uma  “filosofia  da  análise 
multivariada”  que  deveria  ser  seguida  em  sua  aplicação: 

1.  Estabelecer  significância  prática,  bem  como  significância  es¬ 
tatística. 

2.  Reconhecer  que  tamanhos  de  amostras  afetam  resultados. 

3.  Conhecer  seus  dados. 

4.  Esforçar-se  por  modelos  parcimoniosos. 

5.  Examinar  seus  erros. 

6.  Validar  seus  resultados. 

Compreender  o  tratamento  em  seis  etapas  para  a  constru¬ 
ção  de  modelo  multivariado.  O  processo  de  seis  etapas 
para  a  construção  de  modelo  fornece  uma  estrutura  para 
desenvolver,  interpretar  e  validar  qualquer  análise  multi¬ 
variada. 

1.  Definir  o  problema  de  pesquisa,  os  objetivos  e  a  técnica 
multivariada  a  ser  usada. 

2.  Desenvolver  o  plano  de  análise. 

3.  Avaliar  as  suposições. 

4.  Estimar  o  modelo  multivariado  e  avaliar  o  ajuste. 

5.  Interpretar  as  variáveis  estatísticas. 

6.  Validar  o  modelo  multivariado. 

Este  capítulo  introduziu  o  excitante  e  desafiador  tópi¬ 
co  da  análise  multivariada  de  dados.  Os  capítulos  a  seguir 
discutem  cada  uma  dessas  técnicas  em  detalhes  suficientes 
para  viabilizar  ao  pesquisador  iniciante  a  compreensão 
sobre  o  que  uma  técnica  em  particular  pode  conseguir, 
quando  e  como  ela  deve  ser  aplicada,  e  como  os  resulta¬ 
dos  dessa  aplicação  devem  ser  interpretados. 

Questões 

1.  Defina  análise  multivariada  com  suas  próprias  palavras. 

2.  Liste  os  fatores  mais  importantes  que  contribuem  para  a 
crescente  aplicação  de  técnicas  para  a  análise  multivariada 
de  dados  na  última  década. 


3.  Liste  e  descreva  as  técnicas  de  análise  multivariada  de  da¬ 
dos  descritas  neste  capítulo.  Cite  exemplos  nos  quais  cada 
técnica  se  mostre  adequada. 

4.  Explique  por  que  e  como  os  vários  métodos  multivariados 
podem  ser  vistos  como  uma  família  de  técnicas. 

5.  Por  que  o  conhecimento  de  escalas  de  medida  é  importante 
para  um  entendimento  da  análise  multivariada  de  dados? 

6.  Quais  são  as  diferenças  entre  significância  estatística  e  práti¬ 
ca?  Uma  é  pré-requisito  da  outra? 

7.  Quais  são  as  implicações  do  baixo  poder  estatístico?  Como  o 
poder  pode  ser  melhorado  se  for  considerado  muito  baixo? 

8.  Detalhe  o  processo  de  construção  de  modelos  para  a  análise 
multivariada,  concentrando-se  nas  principais  questões  em 
cada  passo. 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustram  aspectos  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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S  E  Ç  A  o 


Preparação  para  uma  Análise  Multívaríada 


VISÃO  GERAL 

A  Seção  I  fornece  um  conjunto  de  ferramentas  e  análises  que 
ajudam  a  preparar  o  pesquisador  para  a  complexidade  cres¬ 
cente  de  uma  análise  multivariada.  O  pesquisador  prudente 
compreende  a  necessidade  de  um  maior  nível  de  compreen¬ 
são  dos  dados,  tanto  em  termos  estatísticos  quanto  concei¬ 
tuais.  Apesar  de  as  técnicas  multivariadas  discutidas  neste 
texto  apresentarem  ao  pesquisador  um  poderoso  conjunto  de 
ferramentas  analíticas,  elas  também  representam  o  risco  de 
posteriormente  distanciar  o  pesquisador  de  um  entendimento 
sólido  dos  dados  e  de  o  conduzir  à  noção  equivocada  de  que 
as  análises  apresentam  um  meio  “rápido  e  fácil”  para  identi¬ 
ficar  relações.  À  medida  que  o  pesquisador  confia  mais  ce¬ 
gamente  nessas  técnicas  para  encontrar  a  resposta  e  menos 
em  uma  base  e  entendimento  conceituais  das  propriedades 
fundamentais  dos  dados,  aumenta  o  risco  de  problemas  sé¬ 
rios  no  uso  indevido  de  técnicas,  na  violação  de  propriedades 
estatísticas,  ou  na  inferência  e  interpretação  inadequadas  dos 
resultados.  Esses  riscos  jamais  podem  ser  totalmente  elimi¬ 
nados,  mas  as  ferramentas  e  análises  discutidas  nesta  seção 
melhorarão  a  habilidade  do  pesquisador  para  reconhecer 
muitos  desses  problemas,  quando  eles  ocorrem,  e  aplicar  as 
medidas  corretivas  apropriadas. 


CAPÍTULOS  NA  SEÇÃO  I 

Esta  seção  começa  com  o  Capítulo  2,  Exame  de  seus  Dados, 
0  qual  cobre  os  tópicos  de  acomodação  de  dados  perdidos, 
atendimento  das  suposições  estatísticas  inerentes,  e  identi¬ 
ficação  de  observações  atípicas  que  podem  influenciar  os 
resultados  de  maneira  desproporcional.  Essas  análises  forne¬ 
cem  simples  avaliações  empíricas  que  detalham  as  proprie¬ 
dades  estatísticas  críticas  dos  dados.  O  Capítulo  3,  Análise 
Fatorial,  apresenta  uma  discussão  de  uma  técnica  de  inter¬ 
dependência  particularmente  adequada  para  examinar  as 
relações  entre  variáveis  e  a  criação  de  escalas  múltiplas.  A 
“busca  por  estrutura”  com  a  análise  fatorial  pode  revelar  inter- 
relações  substanciais  entre  variáveis  e  fornecer  uma  base  ob¬ 
jetiva  para  o  desenvolvimento  do  modelo  conceituai  e  uma 
melhor  parcimônia  entre  as  variáveis  em  uma  análise  multiva¬ 
riada.  Assim,  os  dois  capítulos  desta  seção  se  harmonizam 
para  fornecer  ao  pesquisador  não  apenas  as  ferramentas 
diagnósticas  necessárias  à  preparação  de  dados  para  análi¬ 
se,  mas  também  os  meios  para  redução  de  dados  e  constru¬ 
ção  de  escala  que  podem  melhorar  consideravelmente  outras 
técnicas  multivariadas. 


CAPÍTULO 


Exame 


Dados 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Selecionar  o  método  gráfico  apropriado  para  examinar  as  características  dos  dados  ou 
relações  de  interesse. 

■  Avaliar  o  tipo  e  o  potencial  impacto  de  dados  perdidos. 

■  Compreender  os  diferentes  tipos  de  processos  de  dados  perdidos. 

■  Explicar  as  vantagens  e  desvantagens  das  abordagens  disponíveis  para  lidar  com  dados 
perdidos. 

■  Identificar  observações  atípicas  univariadas,  bivariadas  e  multivariadas. 

■  Testar  seus  dados  para  as  suposições  subjacentes  à  maioria  das  técnicas  multivariadas. 

■  Determinar  o  melhor  método  de  transformação  de  dados,  dado  um  problema  específico. 

■  Compreender  como  incorporar  variáveis  não-métricas  como  variáveis  métricas. 


Apresentação  do  capítulo 

Exame  de  dados  é  um  passo  inicial  que  consome  tempo,  mas  necessário,  que  às  vezes  é  ignorado 
por  pesquisadores.  Aqui  o  pesquisador  avalia  o  impacto  de  dados  perdidos,  identifica  observações 
atípicas  e  testa  suposições  inerentes  à  maioria  das  técnicas  multivariadas.  O  objetivo  dessas  tarefas 
de  exame  de  dados  é  muito  mais  no  sentido  de  revelar  o  que  não  é  aparente  do  que  retratar  os  dados 
reais,  pois  os  efeitos  “ocultos”  são  facilmente  despercebidos.  Por  exemplo,  os  vieses  introduzidos  por 
dados  perdidos  não-aleatórios  jamais  serão  conhecidos  a  não  ser  que  sejam  explicitamente  identifi¬ 
cados  e  remediados  pelos  métodos  discutidos  em  uma  seção  posterior  deste  capítulo.  Além  disso,  a 
menos  que  o  pesquisador  reveja  os  resultados  com  base  em  uma  análise  caso  a  caso,  a  existência  de 
observações  atípicas  não  será  aparente,  mesmo  quando  elas  afetam  substancialmente  os  resultados. 
Violações  da  suposição  estatística  podem  provocar  vieses  ou  não-significância  nos  resultados  que  não 
podem  ser  distinguidos  dos  resultados  verdadeiros. 

Antes  de  discutirmos  uma  série  de  ferramentas  empíricas  para  ajudar  no  exame  de  dados,  a  seção 
introdutória  deste  capítulo  oferece  um  resumo  de  várias  técnicas  gráficas  disponíveis  ao  pesquisador 
como  um  meio  de  representar  dados.  Essas  técnicas  fornecem  ao  pesquisador  um  conjunto  de  maneiras 
simples,  ainda  que  abrangentes,  para  examinar  tanto  as  variáveis  individuais  quanto  as  relações  entre 
elas.  As  técnicas  gráficas  não  são  destinadas  como  substitutivas  das  ferramentas  empíricas,  mas,  ao 
invés  disso,  como  um  meio  complementar  para  retratar  os  dados  e  suas  relações.  Como  o  leitor  verá,  um 
histograma  pode  mostrar  graficamente  o  formato  da  distribuição  de  dados,  exatamente  como  podemos 
refletir  a  mesma  distribuição  com  valores  de  assimetria  e  curtose.  As  medidas  empíricas  quantificam  as 
características  da  distribuição,  enquanto  o  histograma  as  retrata  de  uma  maneira  simples  e  visual.  Ana¬ 
logamente,  outras  técnicas  gráficas  (i.e.,  gráficos  de  dispersão  e  de  caixas)  mostram  relações  entre  va¬ 
riáveis  representadas  pelo  coeficiente  de  correlação  e  teste  de  diferenças  de  médias,  respectivamente. 

Com  as  técnicas  gráficas  abordadas,  a  próxima  tarefa  a  ser  encarada  pelo  pesquisador  é  como  ava¬ 
liar  e  superar  armadilhas  resultantes  do  delineamento  de  pesquisa  (p.  ex.,  elaboração  de  questionário)  e 
práticas  de  coleta  de  dados.  Especificamente,  este  capítulo  trata  do  que  se  segue: 
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•  Avaliação  de  dados  perdidos 

•  Identificação  de  observações  atípicas 

•  Teste  das  suposições  inerentes  ã  maioria  das  técnicas  multivariadas 

Dados  perdidos  são  um  incômodo  para  pesquisadores  e  principalmente  resultam  de  erros  na  co¬ 
leta  ou  entrada  de  dados,  ou  da  omissão  de  respostas  pelos  respondentes.  A  classificação  de  dados 
perdidos  e  as  razões  por  trás  de  sua  presença  são  abordadas  através  de  uma  série  de  passos  que  não 
somente  identificam  os  impactos  de  dados  perdidos,  mas  fornecem  soluções  para  lidar  com  eles  na 
análise.  Observações  atípicas  ou  respostas  extremas  podem  influenciar  de  maneira  a  invalidar  o  resul¬ 
tado  de  qualquer  análise  multivariada.  Por  essa  razão,  métodos  para  avaliar  o  impacto  das  mesmas  são 
discutidos.  Finalmente,  as  suposições  estatísticas  inerentes  ã  maioria  das  análises  multivariadas  são 
revistas.  Antes  de  aplicar  qualquer  técnica  multivariada,  o  pesquisador  deve  avaliar  o  ajuste  dos  dados 
da  amostra  com  as  suposições  estatísticas  subjacentes  àquela  técnica  multivariada.  Por  exemplo,  pes¬ 
quisadores  que  querem  aplicar  análise  de  regressão  (Capítulo  4)  estariam  particularmente  interessados 
em  avaliar  as  suposições  de  normalidade,  homocedasticidade,  independência  de  erro  e  linearidade. 
Cada  um  desses  requisitos  deve  ser  tratado  de  alguma  forma  para  cada  técnica  multivariada. 

Além  disso,  este  capítulo  introduz  o  pesquisador  a  métodos  para  incorporação  de  variáveis  não- 
métricas  em  aplicações  que  requerem  variáveis  métricas  por  meio  da  criação  de  um  tipo  especial  de 
variável  métrica  conhecida  como  dicotômica.  A  aplicabilidade  de  variáveis  dicotômicas  varia  conforme 
cada  projeto  de  análise  de  dados. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque  e  as  referências  cruzadas  nos 
termos-chave  estão  em  itáíico.  Exemplos  ilustrativos  apare¬ 
cem  em  quadros. 

Abordagem  de  caso  completo  Tratamento  para  lidar  com  da¬ 
dos  perdidos  que  computa  valores  com  base  em  dados  so¬ 
mente  de  casos  completos,  ou  seja,  casos  sem  dados  perdi¬ 
dos.  Também  conhecido  como  método  por  listagem. 

Abordagem  de  disponibilidade  Método  de  atribuição  para  da¬ 
dos  perdidos  que  computa  valores  com  base  em  todas  as 
observações  válidas  disponíveis,  também  conhecido  como 
método  aos  pares. 

Assimetria  Medida  da  simetria  de  uma  distribuição;  na  maioria 
dos  casos,  a  comparação  é  feita  com  uma  distribuição  normal. 
Uma  distribuição  positivamente  assimétrica  tem  relativamente 
poucos  valores  grandes  e  uma  cauda  mais  alongada  à  direi¬ 
ta,  e  uma  distribuição  negativamente  assimétrica  tem  relativa¬ 
mente  poucos  valores  pequenos  e  uma  cauda  mais  alongada 
ã  esquerda.  Valores  assimétricos  fora  do  intervalo  -1  a  -f1  indi¬ 
cam  uma  distribuição  substancialmente  assimétrica. 
Categoria  de  referência  A  categoria  de  uma  variável  não-métri¬ 
ca  que  é  omitida  quando  se  criam  variáveis  dicotômicas  e  atua 
como  ponto  de  referência  na  interpretação  das  variáveis  dico¬ 
tômicas.  Na  codificação  indicadora,  a  categoria  de  referência 
tem  valores  zero  (0)  para  todas  as  variáveis  dicotômicas.  Com 
codificação  de  efeitos,  a  categoria  de  referência  tem  valores 
de  menos  um  (-1 )  para  todas  as  variáveis  dicotômicas. 
Codificação  de  efeitos  Método  para  especificar  a  categoria  de 
referência  para  um  conjunto  de  variáveis  diootõmicas,  sendo 
que  a  categoria  de  referência  recebe  um  valor  de  menos  um 
(-1 )  sobre  o  conjunto  de  variáveis  dicotômicas.  Com  esse  tipo 
de  codificação,  os  coeficientes  da  variável  dicotômica  repre¬ 


sentam  desvios  do  grupo  em  relação  ã  média  de  todos  os 
grupos,  0  que  contrasta  com  codificação  indicadora. 

Codificação  indicadora  Método  para  especificar  a  categoria  de 
referência  para  um  conjunto  de  variáveis  dicotômicas  onde  a 
categoria  de  referência  recebe  um  valor  0  ao  longo  do  conjun¬ 
to  de  variáveis  dicotômicas.  Os  coeficientes  das  variáveis  di¬ 
cotômicas  representam  as  diferenças  de  categoria  em  relação 
ã  categoria  de  referência.  Ver  também  codificação  de  efeitos. 

Completamente  perdidos  ao  acaso  (MCAR  -  missing  comple- 
tely  at  random)  Classificação  de  dados  perdidos  aplicável 
quando  valores  perdidos  de  Y  não  dependem  de  X.  Quando 
os  dados  perdidos  são  MCAR,  os  valores  observados  de  Y 
são  uma  amostra  verdadeiramente  aleatória  de  todos  os  va¬ 
lores  de  Y,  sem  um  processo  inerente  que  induza  vieses  aos 
dados  observados. 

Curtose  Medida  da  elevação  ou  do  achatamento  de  uma  distribui¬ 
ção  quando  comparada  com  uma  distribuição  normal.  Um  valor 
positivo  indica  uma  distribuição  relativamente  elevada,  e  um  va¬ 
lor  negativo  indica  uma  distribuição  relativamente  achatada. 

Dados  censurados  Observações  que  são  incompletas  de  uma 
maneira  sistemática  e  conhecida.  Um  exemplo  ocorre  no  es¬ 
tudo  de  causas  de  morte  em  uma  amostra  na  qual  alguns 
indivíduos  ainda  estão  vivos.  Os  dados  censurados  são  um 
exemplo  de  dados  perdidos  ignoráveis. 

Dados  perdidos  ignoráveis  Processo  de  dados  perdidos  que 
é  explicitamente  identificável  e/ou  está  sob  o  controle  do 
pesquisador.  Os  dados  perdidos  ignoráveis  não  demandam 
ações  corretivas,  pois  os  dados  perdidos  são  explicitamente 
tratados  na  técnica  empregada. 

Dados  perdidos  Informação  não-disponível  de  um  indivíduo  (ou 
caso)  sobre  o  qual  outra  informação  está  disponível.  Os  dados 
perdidos  freqüentemente  ocorrem  quando  um  respondente 
deixa  de  responder  uma  ou  mais  questões  em  uma  pesquisa. 

Diagrama  de  dispersão  Representação  da  relação  entre  duas 
variáveis  métricas  que  descreve  os  valores  conjuntos  de  cada 
observação  em  um  gráfico  bidimensional. 
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Diagrama  de  ramo-e-folhas  Uma  variante  do  histograma  que 
fornece  uma  descrição  visuai  da  distribuição  de  variável,  bem 
como  uma  enumeração  dos  valores  reais  dos  dados. 

Distribuição  normai  Distribuição  contínua  de  probabiiidade  pu¬ 
ramente  teórica  na  quai  o  eixo  horizontai  representa  todos  os 
valores  possíveis  de  uma  variávei  e  o  eixo  vertical  representa 
a  probabilidade  de  esses  vaiores  ocorrerem.  Os  vaiores  sobre 
a  variávei  estão  agrupados  em  torno  da  média  em  um  padrão 
simétrico,  unimodal,  conhecido  como  curva  normal,  ou  forma 
de  sino. 

Gráfico  de  probabiiidade  normai  Comparação  gráfica  da  for¬ 
ma  da  distribuição  com  a  distribuição  normal.  Na  representa¬ 
ção  gráfica  da  probabilidade  normal,  a  distribuição  é  repre¬ 
sentada  por  uma  reta  inclinada  em  45  graus.  A  distribuição 
real  é  comparada  com  essa  reta  de  maneira  que  diferenças 
são  mostradas  como  desvios  da  reta,  tornando  a  identificação 
de  diferenças  bastante  visível  e  interpretável. 

Gráficos  de  caixas  {boxplot)  Método  para  representar  a  distri¬ 
buição  de  uma  variável.  Uma  caixa  representa  a  maior  par¬ 
te  da  distribuição,  e  as  extensões  -  chamadas  de  whiskers 
-  atingem  os  pontos  extremos  da  distribuição.  Muito  útil  para 
fazer  comparações  de  uma  ou  mais  variáveis  em  grupos. 

Grupo  de  comparação  Ver  categoria  de  referência. 

Heteroscedasticidade  Ver  homocedasticidade. 

Histograma  epresentação  gráfica  da  distribuição  de  uma  única 
variávei.  Ao  fazer  contagem  de  freqüência  em  categorias,  a 
forma  da  distribuição  da  variávei  pode  ser  mostrada.  Usado 
para  fazer  uma  comparação  visuai  com  a  distribuição  normal. 

Homocedasticidade  Quando  a  variância  dos  termos  de  erro  (e) 
parece  constante  ao  iongo  de  um  domínio  de  variáveis  predi- 
toras,  diz-se  que  os  dados  são  homoscedásticos.  A  suposição 
de  variância  iguai  do  erro  E  da  população  (onde  E  é  estimado 
a  partir  de  e)  é  crítica  para  a  aplicação  correta  de  muitas  téc¬ 
nicas  muitivariadas.  Quando  os  termos  de  erro  têm  variância 
crescente  ou  fiutuante,  diz-se  que  os  dados  são  heterosoedás- 
ticos.  A  análise  de  resíduos  iiustra  melhor  esse  ponto. 

Linearidade  Usada  para  expressar  o  conceito  de  que  o  mode- 
io  possui  as  propriedades  de  aditividade  e  homogeneidade. 
Em  termos  gerais,  os  modelos  lineares  prevêem  valores  que 
recaem  em  uma  linha  reta  que  tem  uma  mudança  com  unida¬ 
de  constante  (coeficiente  angular)  da  variável  dependente  em 
relação  a  uma  mudança  com  unidade  constante  da  variável 
independente.  No  modeio  de  popuiação  Y=  bo  +  b^X,  +  e,o 
efeito  de  uma  mudança  de  1  em  X,  deve  acrescentar  b,  (uma 
constante)  unidades  em  Y. 

Métodos  de  atribuição  Processo  de  estimação  dos  dados  per¬ 
didos  de  uma  observação  baseado  em  valores  válidos  das 
outras  variáveis.  Q  objetivo  é  empregar  reiações  conhecidas 
que  possam  ser  identificadas  nos  valores  válidos  da  amostra 
para  auxiliar  na  representação  ou  mesmo  na  estimação  das 
substituições  para  vaiores  perdidos. 

Normalidade  Grau  em  que  a  distribuição  dos  dados  da  amostra 
corresponde  a  uma  distribuição  normal. 

Observação  atípica  Uma  observação  que  é  substancialmente 
diferente  das  outras  (i.e.,  tem  um  valor  extremo)  em  uma  ou 
mais  características  (variáveis).  O  mais  importante  é  a  sua  re- 
presentatividade  da  população. 


Perdidos  ao  acaso  (MAR  -  missing  at  random)  Classificação 
de  dados  perdidos  aplicávei  quando  valores  perdidos  de  Y 
dependem  de  X,  mas  não  de  Y.  Quando  dados  perdidos  são 
MAR,  dados  observados  para  Y  são  uma  amostra  verdadei¬ 
ramente  aieatória  para  os  vaiores  de  X  na  amostra,  mas  não 
uma  amostra  aieatória  de  todos  os  vaiores  de  Y  devido  a  va¬ 
lores  perdidos  de  X. 

Processo  de  dados  perdidos  Quaiquer  evento  sistemático  ex¬ 
terno  ao  respondente  (como  erros  na  entrada  de  dados  ou 
problemas  na  coleta  de  dados)  ou  qualquer  ação  por  parte  do 
respondente  (como  a  recusa  a  responder  uma  questão)  que 
conduz  a  dados  perdidos. 

Representação  gráfica  multivariada  Método  para  apresen¬ 
tação  de  um  perfil  multivariado  de  uma  observação  em  três 
ou  mais  variáveis.  Qs  métodos  incluem  procedimentos  como 
glifos,  transformações  matemáticas  e  até  mesmo  representa¬ 
ções  iconográficas  (p.  ex.,  faces). 

Resíduo  Parte  de  uma  variável  dependente  não  explicada  por 
uma  técnica  muitivariada.  Associado  a  métodos  de  depen¬ 
dência  que  tentam  prever  a  variávei  dependente,  o  resíduo  re¬ 
presenta  a  parte  inexplicada  da  mesma.  Os  resíduos  podem 
ser  usados  em  procedimentos  diagnósticos  para  identificar 
problemas  na  técnica  de  estimação  ou  para  identificar  reia¬ 
ções  não-especificadas. 

Robustez  A  habiiidade  de  uma  técnica  estatística  de  desempe¬ 
nhar  razoavelmente  bem  mesmo  quando  as  suposições  esta¬ 
tísticas  inerentes  foram  de  algum  modo  violadas. 

Transformações  de  dados  Uma  variável  pode  ter  uma  carac¬ 
terística  indesejávei,  como  não-normaiidade,  que  diminui  seu 
uso  em  uma  técnica  multivariada.  Uma  transformação,  como 
0  iogaritmo  ou  a  raiz  quadrada  da  variável,  cria  uma  variável 
transformada  que  é  mais  adequada  para  descrever  a  relação. 
As  transformações  podem  ser  aplicadas  em  variáveis  depen¬ 
dentes,  independentes  ou  ambas.  A  necessidade  e  o  tipo  es¬ 
pecífico  de  transformação  podem  ser  baseados  em  razões 
teóricas  (p.  ex.,  transformar  uma  relação  não-linear  conheci¬ 
da)  ou  razões  empíricas  (p.  ex.,  probiemas  identificados  por 
meios  gráficos  ou  estatísticos). 

Variável  dicotômica  Variávei  métrica  especiai  usada  para  re¬ 
presentar  uma  única  categoria  de  uma  variável  não-métrica. 
Para  dar  conta  de  L  níveis  de  uma  variável  não-métrica,  L  - 
1  variáveis  dicotômicas  são  necessárias.  Por  exempio,  sexo 
é  medido  como  masculino  ou  feminino  e  poderia  ser  repre¬ 
sentado  por  duas  variáveis  dicotômicas  (X,  e  X^).  Quando  o 
respondente  é  do  sexo  mascuiino,  X,  =  1  e  Xj  =  0.  Do  mesmo 
modo,  quando  o  respondente  é  do  sexo  feminino,  X,  =  0  e 
X^  =  1 .  No  entanto,  quando  X,  =  1 ,  sabemos  que  Xj  deve  ser 
igual  a  0.  Logo,  precisamos  de  apenas  uma  variável,  X,  ou  X2, 
para  representar  a  variável  sexo.  Se  uma  variável  não-métrica 
tem  três  níveis,  apenas  duas  variáveis  dicotômicas  são  neces¬ 
sárias.  Sempre  temos  uma  variável  dicotômica  a  menos  do 
que  0  número  de  níveis  para  a  variável  não-métrica.  A  catego¬ 
ria  omitida  é  chamada  de  categoria  de  referênoia. 

Variável  estatística  Combinação  linear  de  variáveis  formada 
na  técnica  multivariada  por  meio  da  determinação  de  pesos 
empíricos  apiicados  a  um  conjunto  de  variáveis  especificadas 
pelo  pesquisador. 
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INTRODUÇÃO 

As  tarefas  envolvidas  no  exame  de  seus  dados  podem  pa¬ 
recer  comuns  e  inconseqüentes,  mas  são  uma  parte  essen¬ 
cial  de  qualquer  análise  multivariada.  As  técnicas  multi- 
variadas  colocam  um  tremendo  poder  analítico  nas  mãos 
do  pesquisador.  Mas  também  colocam  maior  responsabi¬ 
lidade  sobre  o  pesquisador  para  garantir  que  a  estrutu¬ 
ra  estatística  e  teórica  na  qual  se  baseiam  também  está 
sustentada.  Ao  examinar  os  dados  antes  da  aplicação  de 
qualquer  técnica  multivariada,  o  pesquisador  passa  a  ter 
uma  visão  crítica  das  características  dos  dados. 

•  Primeiro  e  mais  importante,  o  pesquisador  conquista  uma 
compreensão  básica  dos  dados  e  das  relações  entre  variá¬ 
veis.  As  técnicas  multivariadas  impõem  grandes  exigências 
ao  pesquisador  para  entender,  interpretar  e  articular  resul¬ 
tados  com  base  em  relações  que  são  mais  complexas  do  que 
anteriormente  percebido.  O  conhecimento  das  inter-rela- 
ções  de  variáveis  pode  ajudar  incrivelmente  na  especifica¬ 
ção  e  no  refinamento  do  modelo  multivariado,  bem  como 
fornecer  uma  perspectiva  racional  para  a  interpretação  dos 
resultados. 

•  Segundo,  o  pesquisador  garante  que  os  dados  inerentes  à 
análise  atendem  todas  as  exigências  para  uma  análise  mul¬ 
tivariada.  As  técnicas  multivariadas  demandam  muito  mais 
dos  dados  em  termos  de  maiores  conjuntos  de  dados  e  su¬ 
posições  mais  complexas  do  que  aquilo  que  se  encontra  na 
análise  univariada.  Dados  perdidos,  observações  atípicas  e 
as  características  estatísticas  dos  dados  são  muito  mais  difí¬ 
ceis  de  avaliar  em  um  contexto  multivariado.  Assim,  a  sofis¬ 
ticação  analítica  necessária  para  garantir  que  essas  exigên¬ 
cias  sejam  atendidas  tem  forçado  o  pesquisador  a  empregar 
uma  série  de  técnicas  de  exame  de  dados  tão  complexas 
quanto  as  próprias  técnicas  multivariadas. 

Tanto  os  pesquisadores  iniciantes  quanto  os  expe¬ 
rientes  podem  ser  tentados  a  ler  superficialmente  ou 
mesmo  pular  este  capítulo  para  despender  mais  tempo 
com  as  técnicas  multivariadas.  O  tempo,  o  esforço  e  os 
recursos  dedicados  ao  processo  de  exame  de  dados  po¬ 
dem  parecer  quase  desperdiçados,  pelo  fato  de  que  mui¬ 
tas  vezes  nenhuma  ação  corretiva  é  garantida.  Porém, 
o  pesquisador  deve  ver  essas  técnicas  como  “investi¬ 
mentos  em  seguro  multivariado”  que  garantem  que  os 
resultados  obtidos  a  partir  da  análise  multivariada  são 
verdadeiramente  válidos  e  precisos.  Sem  este  “investi¬ 
mento”  é  muito  fácil,  por  exemplo,  que  diversas  observa¬ 
ções  atípicas  não-identificadas  perturbem  os  resultados, 
que  dados  perdidos  introduzam  um  viés  nas  correlações 
entre  variáveis  ou  que  variáveis  não-normais  invalidem 
os  resultados.  Mas  o  aspecto  mais  problemático  dessas 
questões  é  o  fato  de  serem  “ocultas”,  pois  na  maioria  dos 
casos  as  técnicas  multivariadas  seguirão  adiante  e  forne¬ 
cerão  resultados.  Somente  se  o  pesquisador  “investiu”, 
o  potencial  dos  problemas  catastróficos  será  reconheci¬ 
do  e  corrigido  antes  que  a  análise  seja  executada.  Esses 
problemas  podem  ser  evitados  seguindo-se  essas  análi¬ 


ses  toda  vez  que  uma  técnica  multivariada  é  usada.  Esses 
esforços  irão  mais  do  que  compensar  a  longo  prazo;  a 
ocorrência  de  um  problema  sério  e  possivelmente  fatal 
convencerá  qualquer  pesquisador.  Encorajamos  o  leitor 
a  adotar  essas  técnicas  antes  que  problemas  oriundos  da 
análise  o  forcem  a  fazê-lo. 


EXAME  GRÁEICO  DOS  DADOS 

Como  discutido  anteriormente,  o  uso  de  técnicas  multi¬ 
variadas  representa  uma  responsabilidade  adicional  do 
pesquisador  para  entender,  avaliar  e  interpretar  resul¬ 
tados  complexos.  Essa  complexidade  requer  uma  com¬ 
preensão  direta  das  características  básicas  dos  dados 
subjacentes  e  suas  relações.  Quando  análises  univaria- 
das  são  consideradas,  o  nível  de  compreensão  é  bastante 
simples.  A  medida  que  o  pesquisador  se  dirige  a  análises 
multivariadas  mais  complexas,  porém,  a  necessidade  e 
o  nível  de  compreensão  aumentam  dramaticamente  e 
requerem  medidas  diagnósticas  empíricas  ainda  mais 
poderosas.  O  pesquisador  pode  ser  inestimavelmente 
auxiliado  a  conquistar  maior  entendimento  sobre  o  sig¬ 
nificado  dessas  medidas  diagnósticas  através  do  emprego 
de  técnicas  gráficas,  retratando  as  características  básicas 
de  variáveis  individuais  e  relações  entre  as  mesmas  em 
uma  “imagem”  simples.  Por  exemplo,  um  simples  dia¬ 
grama  de  dispersão  não  apenas  representa  em  uma  só 
imagem  os  dois  elementos  básicos  de  um  coeficiente  de 
correlação  -  o  tipo  de  relação  (positiva  ou  negativa)  e  a 
força  da  relação  (a  dispersão  dos  casos)  -  mas  é  também 
um  meio  visual  simples  de  avaliação  de  linearidade,  que 
requer  uma  análise  muito  mais  detalhada  se  considerar¬ 
mos  estritamente  meios  empíricos.  Em  correspondência, 
um  gráfico  de  caixas  ilustra  não  apenas  o  nível  geral  de 
diferenças  ao  longo  de  grupos  mostrado  em  um  teste-t 
ou  análise  de  variância,  mas  também  as  diferenças  entre 
pares  de  grupos  e  a  existência  de  observações  atípicas 
que  exigiriam  mais  análise  empírica  para  serem  detecta¬ 
das  se  o  método  gráfico  não  fosse  usado.  O  objetivo  do 
uso  de  técnicas  gráficas  não  é  a  substituição  de  medidas 
empíricas,  mas  complementar  com  uma  representação 
visual  das  relações  básicas,  de  modo  que  os  pesquisa¬ 
dores  possam  se  sentir  confiantes  em  seu  entendimento 
dessas  relações. 

O  advento  e  a  difusão  dos  programas  estatísticos  proje¬ 
tados  para  o  computador  pessoal  têm  aumentado  o  acesso 
a  tais  métodos.  A  maioria  dos  programas  estatísticos  tem 
módulos  abrangentes  de  técnicas  gráficas  para  exame  de 
dados  que  são  ampliados  com  medidas  estatísticas  mais 
detalhadas  da  descrição  dos  dados.  As  seções  que  seguem 
detalham  algumas  das  técnicas  mais  amplamente  usadas 
para  o  exame  de  características  da  distribuição,  das  rela¬ 
ções  bivariadas,  das  diferenças  de  grupos  e  mesmo  dos 
perfis  multivariados. 
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Perfil  univariado:  exame  do 
formato  da  distribuição 

O  ponto  de  partida  para  o  entendimento  da  natureza  de 
qualquer  variável  é  caracterizar  a  forma  de  sua  distribui¬ 
ção.  Várias  medidas  estatísticas  são  discutidas  em  uma 
seção  adiante  sobre  normalidade,  mas  muitas  vezes  o  pes¬ 
quisador  pode  alcançar  uma  perspectiva  adequada  sobre  a 
variável  por  meio  de  um  histograma.  Um  histograma  é  uma 
representação  gráfica  de  uma  única  variável  que  representa 
a  freqüência  de  ocorrências  (valores  dos  dados)  dentro  de 
categorias  de  dados.  As  freqüências  são  graficamente  re¬ 
presentadas  para  examinar  a  forma  da  distribuição  de  va¬ 
lores.  Se  os  valores  inteiros  variam  de  1  a  10,  o  pesquisador 
pode  construir  um  histograma  contando  o  número  de  res¬ 
postas  para  cada  valor  inteiro.  Para  variáveis  contínuas,  são 
formadas  categorias,  dentro  das  quais  as  freqüências  de  va¬ 
lores  dos  dados  são  tabuladas.  Se  o  exame  da  distribuição 
é  para  avaliar  sua  normalidade  (ver  seção  sobre  teste  de 
suposições  para  detalhes  sobre  este  ponto),  a  curva  normal 
também  pode  ser  sobreposta  sobre  a  distribuição  para  ava¬ 
liar  a  correspondência  da  distribuição  real  com  a  desejada 
distribuição  (normal).  O  histograma  pode  ser  empregado 
para  examinar  qualquer  tipo  de  variável  métrica. 


Por  exemplo,  as  respostas  para  dQ  a  partir  do  banco  de 
dados  introduzido  no  Capítulo  1  são  representadas  na 
Figura  2-1.  Categorias  com  pontos  médios  de  5,0,  5,25, 
5,50,  5,75, ...,  10,0  são  usadas.  A  altura  das  barras  repre¬ 
senta  as  freqüências  dos  valores  dos  dados  dentro  de 
cada  categoria.  A  curva  normal  também  é  sobreposta 
na  distribuição.  Como  será  mostrado  posteriormente, 
medidas  empíricas  indicam  que  a  distribuição  de  dQ  des¬ 
via  significativamente  da  distribuição  normal.  Mas  de 
que  forma  difere?  A  medida  empírica  que  mais  difere 
é  a  curtose,  representando  a  elevação  ou  o  achatamen¬ 
to  da  distribuição.  Os  valores  indicam  que  a  distribui¬ 
ção  é  mais  achatada  do  que  o  esperado.  O  que  o  histo¬ 
grama  revela?  O  meio  da  distribuição  recai  abaixo  da 
curva  normal  sobreposta,  enquanto  ambos  os  extremos 
laterais  são  mais  altos  do  que  o  esperado.  Assim,  a  dis¬ 
tribuição  não  mostra  qualquer  assimetria  considerável 
para  um  lado  ou  outro,  mas  apenas  um  encurtamento  de 
observações  no  centro  da  distribuição.  Essa  comparação 
também  fornece  orientação  sobre  o  tipo  de  transforma¬ 
ção  que  seria  efetiva  se  aplicada  como  correção  para  a 
não-normalidade.  Todas  essa  informações  sobre  a  distri¬ 
buição  são  mostradas  em  um  único  histograma. 


Um  variante  do  histograma  é  o  diagrama  de  ramo- 
e-folhas,  o  qual  apresenta  a  mesma  ilustração  gráfica  do 
histograma,  mas  também  fornece  uma  enumeração  dos 
valores  reais  dos  dados.  Como  no  histograma,  os  valores 
dos  dados  são  divididos  em  categorias,  e  as  freqüências 
para  cada  categoria  são  tabuladas.  Mas  o  elemento  único 


vem  no  estabelecimento  do  valor  raiz  de  cada  categoria  e 
em  mostrar  cada  valor  dos  dados  na  representação  grá¬ 
fica.  Por  exemplo,  considere  que  uma  categoria  é  defini¬ 
da  como  todos  os  valores  entre  3,0  e  4,0.  Na  distribuição 
sendo  apurada,  assuma  que  quatro  valores  recaem  nesta 
categoria  (3,5,  3,7,  3,7  e  3,9).  Em  um  histograma,  essa  fre¬ 
qüência  é  mostrada  por  uma  barra  com  quatro  unidades 
de  altura.  O  diagrama  de  ramo-e-folhas  também  exibe 
essa  freqüência,  mas  no  lugar  de  uma  barra  há  uma  série 
de  quatro  valores.  Como  os  valores  são  retratados?  Com  o 
ramo  definido  como  3,0,  as  folhas  são  definidas  como  5,  7, 
7  e  9.  Assim,  quando  vemos  o  diagrama  de  ramo-e-folhas, 
percebemos  que  a  categoria  contém  quatro  valores,  mas 
podemos  também  rapidamente  calcular  os  valores  reais 
adicionando  o  ramo  para  cada  uma  das  folhas. 


Novamente,  examinemos  a  distribuição  de  dQ,  desta  vez 
com  um  diagrama  de  ramo-e-folhas  (Figura  2-2).  A  pri¬ 
meira  categoria  é  de  5,0  a  5,5;  logo,  o  ramo  é  5,0.  As  três 
observações  com  valores  nesse  intervalo  são  5,0,  5,1  e 
5,2.  Essa  distribuição  é  mostrada  como  três  folhas  de  0, 
1  e  2.  Elas  são  também  os  três  valores  mais  baixos  para 
Ag.  No  próximo  ramo,  o  valor  é  novamente  5,0.  Aqui, 
10  observações  variam  de  5,5  a  5,9.  Esses  valores  corres¬ 
pondem  às  folhas  de  5  e*  9.  No  outro  extremo  da  figura, 
o  ramo  é  10,0.  Ele  é  associado  com  duas  folhas  (0  e  0), 
representando  dois  valores  de  10,0,  os  mais  altos  de  X^. 
O  pesquisador  pode  obter  a  mesma  visão  da  forma  da 
distribuição  como  no  histograma,  mas  também  examinar 
os  valores  reais  de  dados. 


Perfil  bivariado:  exame  da 
relação  entre  variáveis 

Quando  o  exame  da  distribuição  de  uma  variável  é  essen¬ 
cial,  muitas  vezes  o  pesquisador  também  está  interessado 
em  examinar  relações  entre  duas  ou  mais  variáveis.  O  mé¬ 
todo  mais  popular  para  examinar  relações  bivariadas  é  o 
diagrama  de  dispersão,  um  gráfico  de  pontos  baseado  em 
duas  variáveis.  Uma  variável  define  o  eixo  horizontal  e  a 
outra  define  o  eixo  vertical.  Variáveis  podem  ser  qualquer 
valor  métrico.  Os  pontos  no  gráfico  representam  os  valo¬ 
res  conjuntos  correspondentes  das  variáveis  para  qualquer 
caso  dado.  O  padrão  de  pontos  representa  a  relação  entre 
variáveis.  Uma  forte  organização  de  pontos  ao  longo  de 
uma  linha  reta  caracteriza  uma  relação  linear  ou  correla¬ 
ção.  Um  conjunto  curvilíneo  de  pontos  pode  denotar  uma 
relação  não-linear,  a  qual  pode  ser  acomodada  de  muitas 
maneiras  (ver  discussões  posteriores  sobre  linearidade). 
Ou  pode  haver  apenas  um  padrão  aparentemente  aleatório 
de  pontos,  indicando  relação  alguma. 


*  N.  de  R.  T.:  A  frase  correta  seria  “Esses  valores  correspondem  às 
folhas  de  5  a  9”. 
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Xe  (Qualidade  do  produto) 

FIGURA  2-1  Representação  gráfica  de  distribuição  univariada. 


Entre  os  muitos  tipos  de  diagramas  de  dispersão,  um 
formato  particularmente  adequado  a  técnicas  multivaria- 
das  é  a  matriz  de  dispersão,  na  qual  os  diagramas  de  dis¬ 
persão  são  representados  para  todas  as  combinações  de 
variáveis  na  parte  inferior  da  matriz.  A  diagonal  contém 
histogramas  das  variáveis.  Matrizes  de  dispersão  e  diagra¬ 
mas  individuais  de  dispersão  estão  agora  disponíveis  em 
todos  os  programas  estatísticos  populares.  Uma  variante 
do  diagrama  de  dispersão  é  discutida  na  seção  seguinte 
sobre  detecção  de  observações  atípicas,  onde  uma  elip¬ 
se  representando  um  intervalo  especificado  de  confiança 
para  a  distribuição  normal  bivariada  é  sobreposta  para 
permitir  a  identificação  de  observações  atípicas. 


A  Figura  2.3  apresenta  os  diagramas  de  dispersão  para 
um  conjunto  de  cinco  variáveis  da  base  de  dados  FIBAT 
(Aj,  X-,,  Ag,  Ajj  e  Ajj).  Por  exemplo,  a  mais  alta  corre¬ 
lação  pode  ser  facilmente  identificada  como  ocorrendo 
entre  A,  e  como  apontado  pelas  observações  pro¬ 
ximamente  alinhadas  em  um  padrão  linear  bem  defini¬ 
do.  No  lado  extremo,  a  correlação  logo  acima  (A,  ver¬ 
sus  Ag)  mostra  uma  quase  total  falta  de  relação,  como 
evidenciado  pelo  padrão  altamente  disperso  de  pontos  e 
a  correlação  de  0,001.  Finalmente,  uma  relação  inversa 
ou  negativa  é  vista  para  várias  combinações,  mais  no¬ 
tavelmente  a  correlação  entre  A^  e  A^  (-0,401).  Além 
disso,  nenhuma  combinação  parece  exibir  uma  relação 
não-linear  que  não  pudesse  ser  representada  em  uma 
correlação  bivariada. 


A  matriz  de  dispersão  fornece  um  método  rápido  e 
simples  para  não  apenas  avaliar  a  força  e  magnitude  de 
qualquer  relação  bivariada,  mas  também  um  meio  para 
identificar  padrões  não-lineares  que  possam  estar  ocul¬ 
tos  se  apenas  as  correlações  bivariadas,  que  são  baseadas 
em  uma  relação  linear,  são  examinadas. 


Perfil  bivariado:  exame  das  diferenças  de  grupos 

O  pesquisador  também  enfrenta  a  compreensão  da  ex¬ 
tensão  e  do  caráter  de  diferenças  de  uma  ou  mais  variá¬ 
veis  métricas  ao  longo  de  dois  ou  mais  grupos  formados 
a  partir  das  categorias  de  uma  variável  não-métrica.  Ava¬ 
liação  de  diferenças  de  grupos  é  feita  através  de  análises 
univariadas  como  t-testes  e  análise  de  variância,  e  técnicas 
multivariadas  de  análise  discriminante  e  análise  multiva¬ 
riada  de  variância.  Outro  aspecto  importante  é  identificar 
observações  atípicas  (descritas  com  mais  detalhes  em  uma 
seção  adiante)  que  podem  se  tornar  aparentes  apenas 
quando  os  valores  dos  dados  são  separados  em  grupos. 

O  método  usado  para  essa  tarefa  é  o  gráfico  de  caixas, 
uma  representação  pictórica  da  distribuição  de  dados  de 
uma  variável  métrica  para  cada  grupo  (categoria)  de  uma 
variável  não-métrica  (ver  exemplo  na  Figura  2-4).  Primei¬ 
ro,  os  quartis  superior  e  inferior  da  distribuição  de  dados 
formam  os  limites  superior  e  inferior  da  caixa,  com  o  com- 
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FIGURA  2-2  Perfil  univariado:  gráfico  de  ramo-e-folhas  de  Xg 
(Qualidade  do  produto). 


CAPÍTULO  2  Exame  de  seus  Dados  55 


FIGURA  2-3  Perfil  bivariado  de  relações  entre  variáveis:  matriz  de 
dispersão  de  variáveis  métricas  selecionadas  (X^,  X-,,  Xg,  X,2  e  X,3). 

Nota:  Valores  acima  da  diagonal  sâo  correlações  bivarladas,  com  diagramas 
de  dispersão  correspondentes  abaixo  da  diagonal.  A  diagonal  representa  a 
distribuição  de  cada  variável. 


primento  da  caixa  sendo  a  distância  entre  o  25°  percen- 
til  e  o  75°  percentil.  A  caixa  contém  os  50%  centrais  dos 
dados,  e  quanto  maior  a  caixa,  maior  a  dispersão  (p.  ex., 
desvio  padrão)  das  observações.  A  mediana  é  represen¬ 
tada  por  uma  linha  sólida  dentro  da  caixa.  Se  a  mediana 
se  encontra  próxima  de  um  extremo  da  caixa,  assimetria 
na  direção  oposta  é  indicada.  As  linhas  que  se  estendem  a 
partir  de  cada  caixa  (chamadas  de  whiskers)  representam 


a  distância  da  menor  e  da  maior  das  observações  que  es¬ 
tão  a  menos  de  um  quartil  da  caixa.  Observações  atípicas 
(que  variam  entre  1,0  e  1,5  quartis  de  distância  da  caixa) 
e  valores  extremos  (observações  a  mais  de  1,5  quartis  do 
extremo  da  caixa)  são  representados  por  símbolos  fora 
dos  whiskers.  Ao  usar  gráficos  de  caixas,  a  meta  é  retratar 
não  somente  a  informação  que  é  dada  em  testes  estatísti¬ 
cos  (os  grupos  são  diferentes?),  mas  outras  informações 
descritivas  que  aumentam  nossa  compreensão  sobre  as 
diferenças  de  grupos. 


A  Figura  2-4  mostra  os  gráficos  de  caixas  para  e  A, 
para  cada  um  dos  três  grupos  de  (Tipo  de  cliente). 
Antes  de  examinar  os  gráficos  de  caixas  para  cada  variá¬ 
vel,  vejamos  primeiramente  o  que  os  testes  estatísticos 
nos  dizem  sobre  as  diferenças  ao  longo  desses  grupos 
para  cada  variável.  Para  Aj,  um  teste  de  análise  simples 
de  variância  indica  diferença  estatística  altamente  signi- 
ficante  (valor  F  de  36,6  e  um  nível  de  significância  de 
0,000)  ao  longo  dos  três  grupos.  Para  Xj,  porém,  o  teste 
de  análise  de  variância  não  mostra  qualquer  diferença 
estatisticamente  significante  (nível  de  significância  de 
0,419)  ao  longo  dos  grupos  de  X^. 

Usando  gráficos  de  caixas,  o  que  podemos  aprender 
sobre  essas  mesmas  diferenças  de  grupos?  Como  vemos 
no  gráfico  de  caixas  de  Ag,  percebemos  diferenças  subs¬ 
tanciais  ao  longo  dos  grupos  que  confirmam  os  resultados 
estatísticos.  Podemos  também  perceber  que  as  diferenças 
primárias  estão  entre  grupos  1  e  2  versus  grupo  3.  Essen¬ 
cialmente,  os  grupos  1  e  2  parecem  mais  ou  menos  iguais. 
Se  executássemos  mais  testes  estatísticos  olhando  para 
cada  par  de  grupos  separadamente,  os  testes  confirmariam 
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{Continuação) 

que  as  únicas  diferenças  estatisticamente  significantes  são 
grupo  1  versus  3  e  grupo  2  versus  3.  Também  podemos 
perceber  que  o  grupo  2  tem  substancialmente  mais  disper¬ 
são  (uma  seção  de  caixa  maior  no  gráfico  de  caixas),  o  que 
evita  sua  diferença  do  grupo  1.  Os  gráficos  de  caixas  assim 
fornecem  mais  informações  sobre  a  extensão  das  diferen¬ 
ças  de  grupos  de  Xg  do  que  o  teste  estatístico. 

Para  X,  podemos  ver  que  os  três  grupos  são  essencial¬ 
mente  iguais,  como  verificado  pelo  teste  estatístico  não- 
significante.  Podemos  também  perceber  várias  observa¬ 
ções  atípicas  em  cada  um  dos  três  grupos  (como  indicado 
pelas  notações  na  parte  superior  de  cada  representação 
gráfica  além  dos  whiskers).  Apesar  de  as  observações  atí¬ 
picas  não  impactarem  as  diferenças  de  grupos  neste  caso, 
o  pesquisador  é  alertado  sobre  sua  presença  pelos  grá¬ 
ficos  de  caixas.  O  pesquisador  deve  examinar  essas  ob¬ 
servações  e  considerar  as  possíveis  prevenções  discutidas 
mais  detalhadamente  ao  longo  deste  capítulo. 


Perfis  multiyariados 

Até  aqui,  os  métodos  gráficos  têm  se  restringido  a  des¬ 
crições  univariadas  ou  bivariadas.  No  entanto,  em  muitos 
casos,  o  pesquisador  pode  querer  comparar  observações 
caracterizadas  sobre  um  perfil  multivariado,  seja  para 
fins  descritivos  ou  como  complemento  a  procedimentos 
analíticos.  Para  tratar  dessa  necessidade,  foram  elabora¬ 
dos  vários  métodos  gráficos  multivariados  que  giram  em 
torno  de  uma  entre  três  abordagens  [10].  A  primeira  é  um 
retrato  direto  dos  valores  dos  dados,  por  (a)  glifos  ou  me- 
troglifos,  que  são  uma  espécie  de  círculo  cujo  raio  corres¬ 
ponde  a  um  valor  de  um  dado,  ou  (b)  perfis  multivariados 
que  retratam  algo  como  uma  barra  para  cada  observação. 
Uma  segunda  forma  de  visual  multivariado  envolve  uma 
transformação  matemática  dos  dados  originais  em  uma  re¬ 
lação  matemática  que  pode  ser  representada  graficamen¬ 
te.  A  técnica  mais  comum  é  a  transformação  de  Fourier 
de  Andrew  [1].  O  tratamento  final  é  o  uso  de  disposições 
gráficas  à  base  de  ícones,  sendo  o  mais  popular  uma  face 
[5].  O  valor  desse  tipo  de  visual  é  a  capacidade  inerente  de 
processamento  que  os  humanos  têm  para  sua  interpreta¬ 
ção.  Como  observado  por  Chernoff  [5]: 

Acredito  que  aprendemos  muito  cedo  a  estudar  e 
reagir  a  rostos  reais.  Nossa  biblioteca  de  respostas  a 
rostos  esgota  uma  grande  parte  de  nosso  dicionário 
de  emoções  e  idéias.  Percebemos  os  rostos  como 
um  todo,  e  nosso  computador  interno  é  rápido  em 
assimilar  a  informação  relevante  e  filtrar  o  ruído 
quando  olhamos  um  número  limitado  de  rostos. 

As  representações  faciais  fornecem  um  formato  grá¬ 
fico  potente,  mas  também  geram  algumas  considerações 
que  influenciam  a  correspondência  das  variáveis  a  expres¬ 
sões  faciais,  percepções  não-intencionais  e  a  quantidade 


de  informação  que  pode  realmente  ser  acomodada.  Uma 
discussão  dessas  questões  está  além  do  escopo  deste  texto, 
e  os  leitores  interessados  são  encorajados  a  estudá-las  an¬ 
tes  de  qualquer  tentativa  de  usar  esses  métodos  [24,  25]. 


A  Figura  2-5  contém  ilustrações  de  três  tipos  de  repre¬ 
sentação  gráfica  multivariada  produzida  por  meio  de 
SYSTAT,  os  quais  também  estão  disponíveis  em  diver¬ 
sos  outros  programas  estatísticos  de  computador.  A  par¬ 
te  superior  da  Figura  2-5  contém  exemplos  de  cada  tipo 
de  representação  gráfica  multivariada:  perfis,  transfor¬ 
mações  de  Fourier,  e  ícones  (faces  de  Chernoff).  Valo¬ 
res  de  dados  (escores  médios)  para  quatro  grupos  sobre 
sete  variáveis  estão  contidos  em  uma  tabela  na  parte  de 
baixo  da  figura.  A  partir  dos  valores  reais  na  tabela,  simi¬ 
laridades  e  diferenças  tanto  ao  longo  de  variáveis  em  um 
grupo  quanto  entre  grupos  são  difíceis  de  distinguir.  O 
objetivo  dos  perfis  multivariados  é  retratar  os  dados  de 
uma  maneira  que  permita  a  identificação  de  diferenças  e 
similaridades. 

A  primeira  representação  na  Figura  2-5  contém  perfis 
multivariados.  Começando  com  a  parte  mais  à  esquerda 
dos  gráficos,  vemos  o  gráfico  para  o  grupo  2  como  o  mais 
baixo  e  o  mais  alto  para  os  grupos  1  e  4.  Esse  padrão  cor¬ 
responde  aos  valores  de  Vj  (menor  para  grupo  2  e  maior 
para  os  grupos  1  e  4).  Analogamente,  podem  ser  feitas 
comparações  entre  variáveis  para  o  grupo  1,  onde  facil¬ 
mente  percebemos  que  Fj  tem  o  mais  alto  valor.  O  se¬ 
gundo  tipo  de  disposição  gráfica  multivariada  na  figura  é 
a  transformação  de  Fourier  de  Andrew,  a  qual  represen¬ 
ta  os  valores  dos  dados  por  meio  de  uma  expressão  ma¬ 
temática.  Apesar  de  comparações  sobre  um  único  valor 
serem  mais  difíceis,  essa  forma  de  disposição  gráfica  for¬ 
nece  uma  representação  única  que  viabiliza  comparação 
e  agrupamento  generalizados  de  observações.  Tem  parti¬ 
cular  valor  quando  o  número  de  observações  é  grande. 

Finalmente,  ícones  (faces  de  Chernoff)  foram  cons¬ 
truídos  com  as  sete  variáveis  associadas  a  diversas  carac¬ 
terísticas  faciais.  Neste  exemplo,  controla  a  retratação 
da  boca,  Fj  corresponde  à  sobrancelha,  F3  é  associada  ao 
nariz,  F4  são  os  olhos,  F5  controla  o  formato  do  rosto,  Fj 
refere-se  às  orelhas,  e  F7  é  associada  à  posição  da  pupila. 
No  que  se  refere  a  Fj,  os  grupos  1  e  4  têm  sorrisos,  e  o 
grupo  2,  uma  carranca.  Isso  corresponde  a  grandes  valo¬ 
res  para  os  grupos  1  e  4  e  pequenos  valores  para  o  grupo 
dois.  Essa  forma  de  disposição  gráfica  combina  a  habili¬ 
dade  de  fazer  comparações  específicas  entre  ou  dentro 
de  grupos  vistos  no  método  de  perfil  com  a  facilidade  de 
realizar  comparações  globais  mais  generalizadas  encon¬ 
tradas  nas  transformações  de  Fourier  de  Andrew. 


O  pesquisador  pode  empregar  qualquer  um  dos  méto¬ 
dos  quando  examina  dados  multivariados  para  fornecer 
um  formato  que  é  muitas  vezes  mais  esclarecedor  do  que 
apenas  uma  revisão  dos  valores  reais  de  dados.  Além  dis- 
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FIGURA  2-5  Exemplos  de  representações  gráficas  multivariadas. 


so,  os  métodos  multivariados  capacitam  o  pesquisador  a 
usar  uma  única  representação  gráfica  para  descrever  um 
grande  número  de  variáveis,  no  lugar  de  usar  um  grande 
número  de  métodos  univariados  ou  bivariados  para  retra¬ 
tar  o  mesmo  número  de  variáveis. 

Resumo 

As  disposições  gráficas  desta  seção  não  são  um  substituto 
para  as  medidas  diagnósticas  estatísticas  discutidas  em  se¬ 
ções  posteriores  deste  e  de  outros  capítulos.  Elas  fornecem 
um  meio  complementar  para  desenvolver  uma  perspectiva 
sobre  o  caráter  dos  dados  e  das  inter-relações  existentes, 
mesmo  que  sejam  de  natureza  multivariada.  O  velho  adá¬ 
gio  “uma  imagem  vale  mais  que  mil  palavras”  demonstra 
ser  verdadeiro  muitas  vezes  no  emprego  de  representações 
gráficas  para  aplicações  comparativas  ou  diagnósticas. 


DADOS  PERDIDOS 

Dados  perdidos,  onde  valores  válidos  sobre  uma  ou  mais 
variáveis  não  estão  disponíveis  para  análise,  são  um  fato 
da  vida  em  análise  multivariada.  De  fato,  raramente  o 
pesquisador  evita  algum  tipo  de  problema  com  dados  per¬ 
didos.  O  desafio  do  pesquisador  é  abordar  as  questões  ge¬ 
radas  pelos  dados  perdidos  que  afetam  a  generalidade  dos 
resultados.  Para  conseguir  isso,  a  preocupação  primária 
do  pesquisador  é  identificar  padrões  e  relações  inerentes 
aos  dados  perdidos  a  fim  de  manter  tanto  quanto  possível 
a  distribuição  original  de  valores  quando  qualquer  ação 
corretiva  é  aplicada.  A  extensão  dos  dados  perdidos  é 
uma  questão  secundária  na  maioria  dos  casos,  afetando 
o  tipo  de  ação  corretiva  empregada.  Esses  padrões  e  rela¬ 
ções  são  um  resultado  de  um  processo  de  dados  perdidos, 
que  é  qualquer  evento  sistemático  externo  ao  responden- 
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te  (como  erros  de  entrada  de  dados  ou  problemas  de  co¬ 
leta  de  dados)  ou  qualquer  ação  por  parte  do  respondente 
(como  recusa  a  responder)  que  leva  a  valores  perdidos.  A 
necessidade  de  se  concentrar  nos  motivos  dos  dados  per¬ 
didos  surge  do  fato  de  que  o  pesquisador  deve  compreen¬ 
der  os  processos  que  conduzem  aos  dados  perdidos  a  fim 
de  selecionar  o  curso  de  ação  apropriado. 

O  impacto  de  dados  perdidos 

Os  efeitos  de  alguns  processos  de  dados  perdidos  são  co¬ 
nhecidos  e  diretamente  acomodados  no  plano  de  pesqui¬ 
sa,  como  será  discutido  adiante  nesta  seção.  Mais  freqüen- 
temente,  os  processos  de  dados  perdidos,  especialmente 
aqueles  baseados  em  ações  do  respondente  (p.  ex.,  não 
responder  a  uma  questão  ou  conjunto  de  questões),  ra¬ 
ramente  são  conhecidos  de  antemão.  Para  identificar  pa¬ 
drões  nos  dados  perdidos  que  caracterizariam  o  processo 
de  dados  perdidos,  o  pesquisador  questiona  coisas  como 
(1)  Os  dados  perdidos  estão  distribuídos  ao  acaso  pelas 
observações,  ou  são  padrões  distintos  identificáveis?  e  (2) 
Qual  é  a  freqüência  dos  dados  perdidos?  Se  forem  encon¬ 
trados  padrões  distintos  e  a  extensão  dos  dados  perdidos 
for  suficiente  para  garantir  uma  ação,  então  se  considera 
que  algum  processo  de  dados  perdidos  está  em  operação. 

Por  que  se  preocupar  com  os  processos  de  dados  per¬ 
didos?  Não  pode  a  análise  ser  executada  com  os  valores 
válidos  que  temos?  Apesar  de  parecer  prudente  proceder 
apenas  com  os  valores  válidos,  tanto  considerações  subs¬ 
tantivas  quanto  práticas  necessitam  de  um  exame  dos  pro¬ 
cessos  de  dados  perdidos. 

•  O  impacto  prático  de  dados  perdidos  é  a  redução  do  ta¬ 
manho  de  amostra  disponível  para  análise.  Por  exemplo, 
se  ações  corretivas  para  dados  perdidos  não  são  aplicadas, 
qualquer  observação  com  dados  perdidos  sobre  qualquer 
uma  das  variáveis  será  excluída  da  análise.  Em  muitas  aná¬ 
lises  multivariadas,  particularmente  aplicações  de  pesquisa, 
dados  perdidos  podem  eliminar  tantas  observações  que  o 
que  era  uma  amostra  adequada  é  reduzido  a  uma  amostra 
inadequada.  Por  exemplo,  foi  mostrado  que  se  10%  dos 
dados  são  aleatoriamente  perdidos  em  um  conjunto  de  5 
variáveis,  em  média  quase  60%  dos  casos  terá  pelo  menos 
um  valor  perdido  [17].  Assim,  quando  dados  completos  são 
exigidos,  a  amostra  é  reduzida  a  40%  do  tamanho  original. 
Em  tais  situações,  o  pesquisador  deve  ou  reunir  observações 
adicionais,  ou  encontrar  uma  ação  corretiva  para  os  dados 
perdidos  na  amostra  original. 

•  Sob  uma  perspectiva  substantiva,  qualquer  resultado  estatís¬ 
tico  baseado  em  dados  com  um  processo  não-aleatório  de 
dados  perdidos  poderia  ser  tendencioso.  Esse  viés  acontece 
quando  o  processo  de  dados  perdidos  “provoca”  a  perda  de 
certos  dados  e  esses  dados  perdidos  conduzem  a  resultados 
errôneos.  Por  exemplo,  o  que  faríamos  se  descobríssemos 
que  indivíduos  que  não  forneceram  suas  rendas  familiares 
tendiam  a  ser  quase  que  exclusivamente  aqueles  com  maior 
renda?  Você  não  ficaria  desconfiado  dos  resultados  sabendo 
que  esse  grupo  específico  de  pessoas  foi  excluído?  Os  efeitos 
de  dados  perdidos  são  chamados  às  vezes  de  ocultos  devido 


ao  fato  de  que  ainda  conseguimos  resultados  das  análises 
mesmo  sem  os  dados  perdidos.  O  pesquisador  poderia  con¬ 
siderar  esses  resultados  tendenciosos  como  válidos  a  menos 
que  os  processos  inerentes  de  perda  de  dados  sejam  identifi¬ 
cados  e  compreendidos. 

A  preocupação  com  dados  perdidos  é  semelhante 
à  necessidade  de  compreender  as  causas  de  ausência  de 
resposta  no  processo  de  coleta  de  dados.  Assim  como  es¬ 
tamos  preocupados  sobre  quem  não  respondeu  durante  a 
coleta  de  dados  e  qualquer  viés  subseqüente,  também  de¬ 
vemos  ficar  preocupados  com  a  ausência  de  respostas  ou 
dados  perdidos  entre  os  dados  coletados.  Portanto,  o  pes¬ 
quisador  precisa  não  apenas  remediar  os  dados  perdidos, 
se  possível,  mas  também  entender  qualquer  processo  de 
perda  de  dados  e  seus  impactos.  Porém,  muito  freqüen- 
temente,  pesquisadores  ou  ignoram  os  dados  perdidos, 
ou  invocam  uma  ação  corretiva  sem  se  preocuparem  com 
os  efeitos  dos  dados  perdidos.  A  próxima  seção  emprega 
um  exemplo  simples  para  ilustrar  alguns  desses  efeitos  e 
algumas  ações  corretivas  simples,  ainda  que  efetivas.  Em 
seguida,  um  processo  de  quatro  etapas  para  identificar  e 
remediar  processos  de  perda  de  dados  é  apresentado.  Fi¬ 
nalmente,  o  processo  de  quatro  etapas  é  aplicado  a  um  pe¬ 
queno  conjunto  de  dados  com  dados  perdidos. 

Um  exemplo  simples  de  uma 
análise  de  dados  perdidos 

Para  ilustrar  os  impactos  substantivos  e  práticos  da  per¬ 
da  de  dados,  a  Tabela  2-1  contém  um  exemplo  simples  de 
dados  perdidos  entre  20  casos.  Como  é  comum  em  mui¬ 
tos  conjuntos  de  dados,  particularmente  em  pesquisas  de 
levantamento,  o  número  de  dados  perdidos  varia  muito, 
tanto  entre  casos  quanto  entre  variáveis. 


Neste  exemplo,  percebemos  que  todas  as  variáveis  (Vj 
a  Vj)  têm  alguns  dados  perdidos,  sendo  que  tem  per¬ 
didos  mais  da  metade  (55%)  de  todos  os  valores.  Três 
casos  (3, 13  e  15)  têm  mais  de  50%  de  dados  perdidos,  e 
apenas  cinco  casos  têm  dados  completos.  Ao  todo,  23% 
dos  valores  dos  dados  estão  perdidos. 

De  um  ponto  de  vista  prático,  os  dados  perdidos  neste 
exemplo  podem  se  tornar  bastante  problemáticos  em  ter¬ 
mos  de  redução  do  tamanho  da  amostra.  Por  exemplo,  se 
fosse  empregada  uma  análise  multivariada  que  exigisse 
dados  completos  sobre  todas  as  cinco  variáveis,  a  amostra 
seria  reduzida  a  apenas  os  cinco  casos  sem  dados  perdi¬ 
dos  (casos  1,  7,  8,  12  e  20).  Este  tamanho  de  amostra  é 
pequeno  para  qualquer  tipo  de  análise.  Entre  as  soluções 
para  dados  perdidos  que  serão  discutidas  detalhadamente 
em  seções  adiante,  uma  opção  óbvia  é  a  eliminação  de  va¬ 
riáveis  e/ou  casos.  Em  nosso  exemplo,  assumindo  que  os 
fundamentos  conceituais  da  pesquisa  não  são  substancial¬ 
mente  alterados  pela  eliminação  de  uma  variável,  elimi¬ 
nar  Vj  é  um  tratamento  para  reduzir  o  número  de  dados 

(Continua) 
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perdidos.  Eliminando-se  apenas  Vj,  sete  casos  adicionais, 
em  um  total  de  12,  agora  têm  informações  completas.  Se 
os  três  casos  (3, 13, 15)  com  números  excepcionalmente 
altos  de  dados  perdidos  também  forem  eliminados,  o  nú¬ 
mero  total  de  dados  perdidos  se  reduzirá  a  apenas  cinco 
casos,  ou  7,4%  de  todos  os  valores. 

O  impacto  substantivo,  contudo,  pode  ser  visto  nes¬ 
tes  cinco  que  ainda  são  dados  perdidos;  todos  ocorrem 
em  V^.  Comparando  os  valores  de  Uj  P^ra  os  cinco  casos 
remanescentes  com  dados  perdidos  para  V,^  (casos  2,  6, 
14, 16  e  18)  versus  aqueles  casos  que  têm  valores  V),  vá¬ 
lidos,  um  padrão  distinto  emerge.  Os  cinco  casos  com 
valores  perdidos  para  têm  os  cinco  menores  valores 
para  V2,  indicando  que  dados  perdidos  para  U4  estão 
fortemente  associados  a  escores  menores  sobre  Vj-  Essa 
associação  sistemática  entre  dados  perdidos  e  válidos 
provoca  um  impacto  direto  em  qualquer  análise  na  qual 
1^4  e  V2  estejam  incluídas.  Por  exemplo,  o  escore  médio 
para  V2  será  maior  se  casos  com  dados  perdidos  sobre  V4 
forem  excluídos  (média  =  8,4)  do  que  se  incluírem  aque¬ 
les  cinco  casos  (média  =  7,8).  Neste  caso,  o  pesquisador 
sempre  deve  examinar  minuciosamente  os  resultados 
que  incluem  e  Uj  com  vistas  ao  possível  impacto  desse 
processo  de  dados  perdidos  sobre  os  resultados. 


Como  vimos  no  exemplo,  encontrar  uma  solução  para 
dados  perdidos  (p.  ex.,  eliminar  casos  ou  variáveis)  pode 
ser  uma  solução  prática  para  os  mesmos.  Entretanto,  o 
pesquisador  deve  se  proteger  contra  a  aplicação  de  tais 
soluções  sem  o  diagnóstico  dos  processos  de  perda  de  da¬ 
dos.  Evitando-se  o  diagnóstico,  pode-se  tratar  do  proble¬ 
ma  prático  de  tamanho  de  amostra,  mas  apenas  se  cobrem 
as  preocupações  substantivas.  O  que  se  faz  necessário  é 
um  processo  estruturado  de  primeiramente  identificar  a 
presença  de  processos  de  dados  perdidos,  e  então  aplicar 
as  ações  corretivas  apropriadas.  Na  próxima  seção,  discu¬ 
timos  um  processo  de  quatro  etapas  para  abordar  tanto  as 
questões  práticas  quanto  substantivas  que  surgem  a  partir 
da  perda  de  dados. 

Um  processo  de  quatro  etapas  para 
identificar  dados  perdidos  e 
aplicar  ações  corretivas 

Como  visto  nas  discussões  anteriores,  dados  perdidos 
podem  ter  impactos  significantes  sobre  qualquer  análise, 
particularmente  aquelas  de  natureza  multivariada.  Além 
disso,  à  medida  que  as  relações  sob  investigação  se  tor¬ 
nam  mais  complexas,  também  aumenta  a  possibilidade 
de  não  se  detectarem  dados  perdidos  e  seus  efeitos.  Esses 
fatores  se  combinam  para  que  seja  essencial  que  qualquer 


TABELA  2-1  Exemplo  hipotético  de  dados  perdidos 


Identificação  do  caso 

V, 

V2 

V, 

V, 

1^5 

Dados  perdidos  por  caso 

Número  Percentuai 

1 

1,3 

9,9 

6,7 

3,0 

2,6 

0 

0 

2 

4,1 

5,7 

2,9 

2 

40 

3 

9,9 

3,0 

3 

60 

4 

0,9 

8,6 

2,1 

1,8 

1 

20 

5 

0,4 

8,3 

1,2 

1,7 

1 

20 

6 

1,5 

6,7 

4,8 

2,5 

1 

20 

7 

0,2 

8,8 

4,5 

3,0 

2,4 

0 

0 

8 

2,1 

8,0 

3,0 

3,8 

1,4 

0 

0 

9 

1,8 

7,6 

3,2 

2,5 

1 

20 

10 

4,5 

8,0 

3,3 

2,2 

1 

20 

11 

2,5 

9,2 

3,3 

3,9 

1 

20 

12 

4,5 

6,4 

5,3 

3,0 

2,5 

0 

9 

13 

2,7 

4 

80 

14 

2,8 

6,1 

6,4 

3,8 

1 

20 

15 

3,7 

3,0 

3 

60 

16 

1.6 

6,4 

5,0 

2,1 

1 

20 

17 

0,5 

9,2 

3,3 

2,8 

1 

20 

18 

2,8 

5,2 

5,0 

2,7 

1 

20 

19 

2,2 

6,7 

2,6 

2,9 

1 

20 

20 

1.8 

9,0 

5,0 

2,2 

3,0 

0 

0 

Dados  perdidos  por  variável 

Valores  perdidos  totais 

Número 

2 

2 

11 

6 

2 

Número:  23 

Percentual 

10 

10 

55 

30 

10 

Percentual:  23 
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análise  multivariada  comece  com  um  exame  dos  proces¬ 
sos  de  perda  de  dados.  Para  este  fim,  um  processo  de  qua¬ 
tro  etapas  (ver  Figura  2-6)  é  apresentado,  o  qual  aborda 
os  tipos  e  extensão  dos  dados  perdidos,  a  identificação  de 
processos  de  perda  de  dados,  e  ações  corretivas  dispo¬ 
níveis  para  a  acomodação  de  dados  perdidos  em  análise 
multivariada. 

Passo  1:  Determinar  o  tipo  de  dados  perdidos 

O  primeiro  passo  em  qualquer  exame  de  dados  perdidos 
é  determinar  o  tipo  de  dados  perdidos  envolvidos.  Aqui 
o  pesquisador  está  preocupado  se  os  dados  perdidos  são 
parte  do  planejamento  da  pesquisa  e  estão  sob  controle  do 
pesquisador,  ou  se  as  “causas”  e  impactos  são  verdadeira¬ 
mente  desconhecidos.  Comecemos  com  os  dados  perdidos 
que  fazem  parte  do  planejamento  da  pesquisa  e  que  po¬ 
dem  ser  manuseados  diretamente  pelo  pesquisador. 

Dados  perdidos  ignoráveis.  Muitas  vezes,  dados  perdi¬ 
dos  são  esperados  e  fazem  parte  do  planejamento  da  pes¬ 
quisa.  Nesses  casos,  os  dados  perdidos  são  chamados  de 
dados  perdidos  ignoráveis,  o  que  significa  que  ações  corre¬ 
tivas  específicas  para  perda  de  dados  não  são  necessárias, 
pois  os  mesmos  são  inerentemente  permitidos  na  técnica 
usada  [18,22].  A  justificativa  para  a  designação  de  dados 
perdidos  como  ignoráveis  é  que  o  processo  de  perda  de 
dados  opera  aleatoriamente  (i.e.,  os  valores  observados 
são  uma  amostra  aleatória  do  conjunto  total  de  valores, 
observados  e  perdidos)  ou  explicitamente  se  acomoda  na 
técnica  utilizada.  Há  três  casos  nos  quais  um  pesquisador 
mais  freqüentemente  encontra  casos  perdidos  ignoráveis. 

•  O  primeiro  exemplo  encontrado  em  quase  todos  os  levanta¬ 
mentos  e  na  maioria  dos  outros  conjuntos  de  dados  é  o  pro¬ 
cesso  de  dados  perdidos  ignoráveis  resultante  da  considera¬ 
ção  de  uma  amostra  da  população  em  vez  de  dados  reunidos 
da  população  inteira.  Nessas  situações,  os  dados  perdidos 
são  aquelas  observações  em  uma  população  que  não  estão 
incluídas  quando  se  considera  a  amostra.  O  propósito  de  téc¬ 
nicas  multivariadas  é  generalizar  a  partir  de  observações  de 
amostras  para  a  população  inteira,  o  que  é  realmente  uma 
tentativa  de  superar  os  dados  perdidos  de  observações  que 
não  estão  na  amostra.  O  pesquisador  torna  esses  dados  per¬ 
didos  ignoráveis  usando  amostragem  probabilística  para  se¬ 
lecionar  respondentes.  A  amostragem  probabilística  permite 
ao  pesquisador  especificar  que  o  processo  de  perda  de  dados 
que  leva  a  observações  omitidas  é  aleatório  e  que  os  dados 
perdidos  podem  ser  considerados  como  erro  de  amostra  nos 
procedimentos  estatísticos.  Assim,  os  dados  perdidos  das  ob¬ 
servações  não  constantes  na  amostra  são  ignoráveis. 

•  Um  segundo  caso  de  dados  perdidos  ignoráveis  é  devido 
ao  delineamento  específico  do  processo  de  coleta  de  dados. 
Certos  planos  de  amostragem  não-probabilística  são  deli¬ 
neados  para  tipos  específicos  de  análise  que  acomodam  a 
natureza  não-aleatória  da  amostra.  Muito  mais  comuns  são 
os  dados  perdidos  devido  ao  delineamento  do  instrumento 
de  coleta  de  dados,  como  aqueles  referentes  aos  padrões  de 
salto  nos  quais  respondentes  passam  por  cima  de  seções  de 
questões  que  não  são  aplicáveis. 


Por  exemplo,  no  exame  da  resolução  de  reclamações  de 
clientes,  pode  ser  adequado  exigir  que  indivíduos  façam 
uma  reclamação  antes  de  se  fazerem  perguntas  sobre 
como  se  lida  com  reclamações.  Para  os  respondentes  que 
não  estão  reclamando,  não  há  necessidade  de  responder 
questões  sobre  o  processo,  e  assim  criam-se  dados  per¬ 
didos.  O  pesquisador  não  está  preocupado  com  esses 
dados  perdidos,  pois  eles  são  parte  do  delineamento  da 
pesquisa  e  seria  inadequado  tentar  consertá-los. 


•  Um  terceiro  tipo  de  dados  perdidos  ignoráveis  acontece 
quando  os  dados  são  censurados.  Dados  censurados  são 
observações  incompletas  devido  a  seu  estágio  no  processo 
de  perda  de  dados.  Um  exemplo  típico  é  uma  análise  das 
causas  de  morte.  Respondentes  que  ainda  vivem  não  po¬ 
dem  dar  informação  completa  (ou  seja,  causa  ou  hora  da 
morte)  e  são,  portanto,  censurados.  Outro  exemplo  interes¬ 
sante  ocorre  na  tentativa  de  se  estimar  a  altura  da  popula¬ 
ção  geral  de  um  país  com  base  nas  alturas  dos  recrutas  das 
forças  armadas  do  mesmo  (como  citado  em  [18]).  Os  dados 
são  censurados  porque  ocasionalmente  as  forças  armadas 
podem  impor  restrições  de  altura  que  variam  em  nível  e 
aplicação.  Logo,  os  pesquisadores  se  defrontam  com  a  tare¬ 
fa  de  estimar  a  altura  da  população  inteira  quando  sabe-se 
que  certos  indivíduos  (os  que  estão  abaixo  das  restrições 
de  altura)  não  estão  incluídos  na  amostra.  Em  ambos  os 
casos,  o  conhecimento  do  pesquisador  sobre  o  processo  de 
dados  perdidos  permite  o  emprego  de  métodos  especializa¬ 
dos,  como  a  análise  de  história  de  eventos,  para  acomodar 
dados  censurados  [18]. 

Em  cada  caso  de  processo  de  dados  perdidos  ignorá¬ 
veis,  o  pesquisador  tem  um  meio  explícito  de  acomodar  os 
dados  perdidos  na  análise.  Deve  ser  notado  que  é  possível 
ter  tanto  dados  perdidos  ignoráveis  quanto  não-ignoráveis 
no  mesmo  conjunto  de  dados  quando  dois  processos  dis¬ 
tintos  estão  em  jogo. 

Processos  de  dados  perdidos  que  são  não-ignoráveis  Da¬ 
dos  perdidos  que  não  podem  ser  classificados  como  igno¬ 
ráveis  acontecem  por  muitas  razões  e  em  muitas  situações. 
Em  geral,  esses  dados  perdidos  se  encaixam  em  duas  clas¬ 
ses:  processos  conhecidos  versus  desconhecidos  baseados 
em  suas  fontes. 

•  Muitos  processos  de  dados  perdidos  são  conhecidos  pelo 
pesquisador  no  sentido  de  que  podem  ser  identificados  de¬ 
vido  a  fatores  de  procedimento,  como  entrada  de  dados  que 
criam  códigos  inválidos,  restrições  de  desfecho  (p.  ex.,  pe¬ 
quenas  contagens  em  dados  de  censo  de  uma  nação),  falha 
para  completar  o  questionário  inteiro,  ou  mesmo  a  morte 
do  respondente.  Nessas  situações,  o  pesquisador  tem  pouco 
controle  sobre  os  processos  de  perda  de  dados,  mas  algumas 
ações  corretivas  podem  ser  aplicáveis  se  os  dados  perdidos 
forem  percebidos  como  aleatórios. 

•  Processos  desconhecidos  de  perda  de  dados  são  menos  fa¬ 
cilmente  identificados  e  acomodados.  Mais  freqüentemente, 
esses  casos  estão  diretamente  relacionados  com  o  responden¬ 
te.  Um  exemplo  é  a  recusa  para  responder  certas  questões, 
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Sim 


Aplicar  técnicas 
especializadas 
para  dados 
perdidos 
ignoráveis 


Eliminar  casos 
e/ou  variáveis 
com  elevados 
dados  perdidos. 


-Sim  - 


/Passo  2:  Determinar  a  extensãdy 
dos  dados  perdidos. 

É  substancial  o  bastante 
para  garantir  ação? 


Sim 


Analisar  casos  e  variáveis. 

Deveriam  casos  e/ou 
variáveis  ser  eliminados 
devido  a  elevados  níveis 
de  dados  perdidos? 


Não 


Não 


Passo  3:  Diagnosticar  a 
aleatoriedade  dos  processos 
de  perda  de  dados. 

Os  processo  são  MAR 
(não-aleatórios)  ou 
MCAR  (aleatórios)? 


MAR 


Não 


MCAR 

í 


Passo  4:  Selecionar  o 
método  de  atribuição. 

Deseja  substituir  os  dados 
perdidos  por  valores? 


Sim 


Selecionar  o  método  de 
aplicação  de  dados. 

Deseja  usar  apenas  casos 
com  dados  completos  ou  todos 
os  dados  vãlidos  possíveis? 


Selecionar  o  método  de 
aplicação  de  dados. 

Deseja  usar  valores  conhecidos 
ou  calcular  valores  de 
substituição  a  partir  de 
dados  vãlidos? 


Apenas  dados  completos  Todos  os  dados  possíveis  pValores  conhecidos 


-  Calcular  valores 


Abordagens 
baseadas  em 
modelagem 


Abordagem 
de  caso 
completo 


Abordagem 
de  todos  os 
subconjuntos 
disponíveis 


Substituição 
de  caso 


Atribuição 
de  carta 
marcada 


Substituição 
pela  média 


Abordagem 
baseada  em 
regressão 


FIGURA  2-6  Um  processo  de  quatro  etapas  para  identificar  dados  perdidos  e  aplicar  ações  corretivas. 


o  que  é  comum  em  perguntas  de  natureza  sensível  (como 
renda  ou  questões  controversas)  ou  quando  o  respondente 
não  tem  opinião  ou  conhecimento  suficiente  para  respon¬ 
der.  O  pesquisador  deveria  antecipar  tais  problemas  e  tentar 
minimizá-los  no  planejamento  da  pesquisa  e  nos  estágios  de 
coleta  de  dados.  No  entanto,  eles  ainda  podem  ocorrer,  e  o 
pesquisador  deve  agora  lidar  com  os  dados  perdidos  resul¬ 


tantes.  Entretanto,  nem  tudo  está  perdido.Quando  os  dados 
perdidos  ocorrem  em  um  padrão  aleatório,  ações  corretivas 
podem  estar  disponíveis  para  diminuir  seus  efeitos. 

Na  maioria  dos  casos  o  pesquisador  encara  um  proces¬ 
so  de  perda  de  dados  que  não  pode  ser  classificado  como 
ignorável.  Seja  a  fonte  desse  processo  de  dados  perdidos 
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não  ignoráveis  conhecida  ou  não,  o  pesquisador  ainda 
deve  proceder  para  o  próximo  passo  do  processo  e  avaliar 
a  extensão  e  impacto  dos  dados  perdidos. 

Passo  2:  Determinar  a  extensão  de  dados  perdidos 

Sabendo-se  que  alguns  dos  dados  perdidos  não  são  igno¬ 
ráveis,  o  pesquisador  deve  examinar  os  padrões  dos  da¬ 
dos  perdidos  e  determinar  a  extensão  dos  mesmos  para 
variáveis  e  casos  individuais,  e  mesmo  genericamente.  O 
aspecto  primário  neste  passo  do  processo  é  determinar 
se  a  extensão  ou  quantia  de  dados  perdidos  é  baixa  o  su¬ 
ficiente  para  não  afetar  os  resultados,  mesmo  que  opere 
de  maneira  não-aleatória.  Se  for  suficientemente  baixa, 
então  qualquer  das  abordagens  para  remediar  perda  de 
dados  pode  ser  aplicada.  Se  o  nível  de  perda  de  dados  não 
é  baixo  o  suficiente,  então  devemos  primeiramente  de¬ 
terminar  a  aleatoriedade  do  processo  de  perda  de  dados 
antes  de  escolher  uma  ação  corretiva  (passo  3).  A  questão 
não  resolvida  neste  passo  é  a  seguinte:  o  que  significa  bai¬ 
xo  o  suficiente?  Ao  se  fazer  a  avaliação  sobre  a  extensão 
da  perda  de  dados,  o  pesquisador  pode  descobrir  que  a 
eliminação  de  casos  e/ou  variáveis  reduzirá  os  dados  per¬ 
didos  a  níveis  baixos  o  suficiente  para  permitir  correções 
sem  se  preocupar  com  a  criação  de  vieses  nos  resultados. 

Avaliação  da  extensão  e  padrões  de  perda  de  dados.  A 

maneira  mais  direta  para  avaliar  a  extensão  de  dados  per¬ 
didos  é  por  tabulação  (1)  do  percentual  de  variáveis  com 
dados  perdidos  para  cada  caso  e  (2)  do  número  de  casos 
com  dados  perdidos  para  cada  variável.  Este  simples  pro¬ 
cesso  identifica  não  somente  a  extensão  dos  dados  per¬ 
didos,  mas  qualquer  nível  excepcionalmente  elevado  de 
perda  de  dados  que  acontece  por  casos  ou  observações 
individuais.  O  pesquisador  deveria  procurar  por  padrões 
não-aleatórios  nos  dados,  como  concentração  de  dados 
perdidos  em  um  conjunto  específico  de  questões,  falhas 
que  impedem  completar  o  questionário  e  assim  por  diante. 
Finalmente,  o  pesquisador  deveria  determinar  o  número 
de  casos  sem  perdas  de  dados  em  qualquer  uma  das  va¬ 
riáveis,  o  que  fornecerá  o  tamanho  de  amostra  disponível 
para  análise  se  ações  corretivas  não  são  aplicadas. 

Com  esta  informação  em  mãos,  a  questão  importante 
é:  são  tantos  os  dados  perdidos  para  garantir  diagnóstico 
adicional?  A  questão  é  a  possibilidade  de  que  ignorar  os 
dados  perdidos  ou  usar  alguma  ação  corretiva  para  subs¬ 
tituir  valores  para  os  mesmos  pode  criar  um  viés  nos  da¬ 
dos  que  afetará  sensivelmente  os  resultados.  Ainda  que  a 
maioria  das  discussões  sobre  isso  requeira  julgamento  do 
pesquisador,  as  duas  diretrizes  nas  Regras  Práticas  2-1  se 
aplicam. 

Se  for  determinado  que  a  extensão  é  razoavelmente 
baixa  e  nenhum  padrão  não-aleatório  apareça,  então  o 
pesquisador  pode  empregar  qualquer  uma  das  técnicas  de 
atribuição  (passo  4)  sem  criar  viés  nos  resultados  de  qual¬ 
quer  maneira  apreciável.  Se  o  nível  de  perda  de  dados  é 
muito  elevado,  então  o  pesquisador  deve  considerar  abor¬ 


dagens  específicas  para  diagnosticar  a  aleatoriedade  dos 
processos  de  perda  de  dados  (passo  3)  antes  de  proceder  à 
aplicação  de  uma  ação  corretiva. 

Eliminação  de  casos  e/ou  variáveis  individuais.  Antes  de 
proceder  com  os  métodos  formalizados  para  diagnóstico 
de  aleatoriedade  no  passo  3,  o  pesquisador  deveria  consi¬ 
derar  a  simples  ação  de  eliminar  caso(s)  e/ou  variável(eis) 
com  excessivo(s)  nível(eis)  de  perda  de  dados.  O  pesqui¬ 
sador  pode  descobrir  que  os  dados  perdidos  estão  con¬ 
centrados  em  um  pequeno  subconjunto  de  casos  e/ou 
variáveis,  com  sua  exclusão  substancialmente  reduzindo 
a  extensão  dos  dados  perdidos.  Além  disso,  em  muitos  ca¬ 
sos  nos  quais  um  padrão  não-aleatório  de  perda  de  dados 
está  presente,  esta  solução  pode  ser  a  mais  eficiente.  No¬ 
vamente,  não  existem  diretrizes  sobre  o  necessário  nível 
para  exclusão  (além  da  sugestão  geral  de  que  a  extensão 
deva  ser  “grande”),  mas  qualquer  decisão  deveria  ser  ba¬ 
seada  em  considerações  empíricas  e  teóricas,  como  listado 
nas  Regras  Práticas  2-2. 

Em  última  instância  o  pesquisador  deve  conciliar  os 
ganhos  da  eliminação  de  variáveis  e/ou  casos  com  dados 
perdidos  versus  a  redução  no  tamanho  da  amostra  e  variá¬ 
veis  para  representar  os  conceitos  no  estudo.  Obviamen¬ 
te,  variáveis  ou  casos  com  50%  ou  mais  de  dados  perdidos 
deveriam  ser  eliminados,  mas,  à  medida  que  o  nível  de  da¬ 
dos  perdidos  diminui,  o  pesquisador  deve  empregar  mais 
julgamentos  e  “tentativas  e  erros”.  Como  veremos  na 
discussão  sobre  métodos  de  atribuição,  avaliar  múltiplas 
abordagens  para  lidar  com  dados  perdidos  é  preferível. 

-  REGRAS  PRÁTICAS  2-1  - 

Qual  quantia  de  dados  perdidos  é  excessiva? 

•  Dados  perdidos  abaixo  de  10%  para  um  caso  ou 
observação  individual  podem  geralmente  ser  ignorados, 
exceto  quando  os  dados  perdidos  acontecem  de 
maneira  não-aleatória  (p.  ex.,  concentração  em  um 
conjunto  específico  de  questões,  falhas  para  finalizar  o 
questionário  etc.)  [19,20] 

•  O  número  de  casos  sem  dados  perdidos  deve  ser 
suficiente  para  a  técnica  de  análise  selecionada  se 
valores  de  substituição  não  forem  atribuídos  para  os 
dados  perdidos. 


Passo  3:  Diagnosticar  a  aleatoriedade 
dos  processos  de  perda  de  dados 

Tendo  determinado  que  a  extensão  de  dados  perdidos  é 
suficientemente  substancial  para  garantir  ação,  o  próximo 
passo  é  determinar  o  grau  de  aleatoriedade  presente  nos 
dados  perdidos,  o  que  então  determina  as  ações  corretivas 
apropriadas  e  disponíveis.  Considere  para  fins  de  ilustra¬ 
ção  que  informação  sobre  duas  variáveis  (X  e  Y)  é  cole¬ 
tada.  X  não  tem  dados  perdidos,  mas  Y  tem  alguns.  Um 
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-  REGRAS  PRÁTICAS  2-2  - 

Eliminações  baseadas  em  dados  perdidos 

•  Variáveis  com  15%  de  dados  perdidos  ou  menos  são 
candidatas  para  eliminação  [15],  mas  níveis  mais  elevados 
(20%  a  30%)  muitas  vezes  podem  ser  remediados. 

•  Certifique-se  de  que  a  diminuição  nos  dados  perdidos 
é  grande  o  bastante  para  justificar  a  eliminação  de  uma 
variável  ou  caso  individual. 

•  Casos  com  dados  perdidos  para  variáveis  dependentes 
tipicamente  são  eliminados  para  evitar  qualquer 
aumento  artificial  em  relações  com  variáveis 
independentes. 

•  Quando  eliminar  uma  variável,  garanta  que 
variáveis  alternativas,  preferencialmente  altamente 
correlacionadas,  estão  disponíveis  para  representar  a 
intenção  da  variável  original. 

•  Sempre  considere  a  possibilidade  de  executar  a  análise 
com  e  sem  os  casos  ou  variáveis  eliminados  para 
identificar  diferenças  evidentes. 


processo  não-aleatório  de  perda  de  dados  está  presente 
entre  X  e  Y  quando  diferenças  significantes  nos  valores 
de  X  acontecem  entre  casos  que  têm  dados  válidos  para  Y 
versus  aqueles  casos  com  dados  perdidos  em  Y.  Qualquer 
análise  deve  explicitamente  acomodar  qualquer  processo 
não-aleatório  de  perda  de  dados  entre  XeY,  senão  vieses 
serão  introduzidos  nos  resultados. 

Níveis  de  aleatoríedade  do  processo  de  perda  de  da¬ 
dos.  Dos  dois  níveis  de  aleatoriedade  quando  se  avaliam 
dados  perdidos,  um  requer  métodos  especiais  para  acomo¬ 
dar  uma  componente  não-aleatória  (perdidos  ao  acaso,  ou 
MAR).  Um  segundo  nível  (completamente  perdidos  ao 
acaso,  ou  MCAR)  é  suficientemente  aleatório  para  aco¬ 
modar  qualquer  tipo  de  ação  corretiva  para  dados  perdi¬ 
dos  [18].  Apesar  de  os  nomes  de  ambos  os  níveis  parece¬ 
rem  indicar  que  eles  refletem  padrões  aleatórios  de  perda 
de  dados,  apenas  MCAR  permite  o  uso  da  ação  corretiva 
que  se  desejar.  A  diferença  entre  esses  dois  níveis  está  na 
capacidade  de  generalização  para  a  população,  como  des¬ 
crito  aqui: 

•  Dados  perdidos  são  chamados  de  perdidos  ao  acaso  (MAR) 
se  os  valores  perdidos  de  Y  dependem  de  X,  mas  não  de  Y. 
Em  outras  palavras,  os  valores  Y  observados  representam 
uma  amostra  aleatória  dos  valores  Y  reais  para  cada  valor  de 
X,  mas  os  dados  observados  para  Y  não  representam  neces¬ 
sariamente  uma  amostra  verdadeiramente  aleatória  de  to¬ 
dos  os  valores  de  Y.  Apesar  de  o  processo  de  perda  de  dados 
ser  ao  acaso  na  amostra,  seus  valores  não  são  generalizáveis 
à  população.  Mais  freqüentemente,  os  dados  são  perdidos 
aleatoriamente  dentro  de  subgrupos,  mas  diferem  em  níveis 
entre  subgrupos.  O  pesquisador  deve  determinar  os  fatores 
que  definem  os  subgrupos  e  os  vários  níveis  entre  grupos. 


Por  exemplo,  considere  que  sabemos  o  sexo  dos  res- 
pondentes  (a  variável  X)  e  que  perguntamos  sobre  ren¬ 
da  familiar  (a  variável  Y).  Descobrimos  que  os  dados 
perdidos  são  aleatórios  tanto  para  homens  como  para 
mulheres,  mas  ocorrem  com  muito  maior  freqüência 
entre  homens  do  que  mulheres.  Ainda  que  o  processo 
de  perda  de  dados  esteja  operando  de  maneira  aleatória 
dentro  da  variável  sexo,  qualquer  correção  aplicada  aos 
dados  perdidos  ainda  refletirá  o  processo  de  perda  de 
dados  porque  sexo  afeta  a  distribuição  final  de  valores 
de  renda  familiar. 


•  Um  maior  nível  de  aleatoriedade  é  chamado  de  completa- 
mente  perdido  ao  acaso  (MCAR).  Nesses  casos  os  valores 
observados  de  Y  são  uma  amostra  verdadeiramente  ao  aca¬ 
so  de  todos  os  valores  Y,  sem  qualquer  processo  inerente 
que  conduza  a  vieses  sobre  os  dados  observados.  Em  termos 
simples,  os  casos  com  dados  perdidos  são  indistinguíveis 
daqueles  com  dados  completos. 


A  partir  de  nosso  exemplo  anterior,  essa  situação  seria 
mostrada  pelo  fato  de  que  os  dados  perdidos  para  renda 
familiar  estavam  perdidos  ao  acaso  em  iguais  propor¬ 
ções  para  ambos  os  sexos.  Nesse  processo  de  perda  de 
dados,  qualquer  uma  das  ações  corretivas  pode  ser  apli¬ 
cada  sem  fazer  concessões  para  o  impacto  de  qualquer 
outra  variável  ou  processo  de  perda  de  dados. 


Testes  diagnósticos  para  níveis  de  aleatoriedade.  Como 
observado  anteriormente,  o  pesquisador  deve  verificar 
se  o  processo  de  perda  de  dados  ocorre  de  uma  maneira 
completamente  aleatória.  Quando  o  conjunto  de  dados 
é  pequeno,  o  pesquisador  pode  ser  capaz  de  visualizar 
tais  padrões  ou  executar  um  conjunto  de  cálculos  sim¬ 
ples  (como  em  nosso  exemplo  no  início  do  capítulo).  No 
entanto,  à  medida  que  tamanho  de  amostra  e  número  de 
variáveis  aumentam,  o  mesmo  ocorre  com  a  necessidade 
de  testes  diagnósticos  empíricos.  Alguns  programas  esta¬ 
tísticos  acrescentam  técnicas  especificamente  elaboradas 
para  análise  de  dados  perdidos  (p.  ex..  Análise  de  Valores 
Perdidos  no  SPSS),  as  quais  geralmente  incluem  um  ou 
ambos  os  testes  diagnósticos. 

•  O  primeiro  diagnóstico  avalia  o  processo  de  perda  de  dados 
de  uma  única  variável  Y  formando  dois  grupos:  observações 
com  dados  perdidos  para  Y  e  aquelas  com  valores  válidos  de 
Y.  Testes  estatísticos  são  então  executados  para  determinar 
se  diferenças  significativas  existem  entre  os  dois  grupos  em 
outras  variáveis  de  interesse.  Diferenças  significativas  indi¬ 
cam  a  possibilidade  de  um  processo  não-aleatório  de  perda 
de  dados. 
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Usemos  nosso  exemplo  anterior  de  renda  familiar  e 
sexo.  Primeiro,  formaríamos  dois  grupos  de  respon- 
dentes,  aqueles  com  dados  perdidos  sobre  a  questão  de 
renda  familiar  e  aqueles  que  responderam  à  questão. 
Compararíamos  então  os  percentuais  de  sexo  para  cada 
grupo.  Se  um  gênero  (p.  ex.,  masculino)  fosse  encontra¬ 
do  em  maior  proporção  no  grupo  de  dados  perdidos, 
suspeitaríamos  de  um  processo  de  dados  perdidos  não- 
aleatório.  Se  a  variável  que  estivéssemos  comparando 
fosse  métrica  (p.  ex.,  uma  atitude  ou  percepção)  em  vez 
de  categórica  (sexo),  então  testes-t  seriam  realizados 
para  determinar  a  significância  estatística  da  diferença 
na  média  da  variável  entre  os  dois  grupos.  O  pesquisa¬ 
dor  deve  examinar  diversas  variáveis  para  ver  se  algum 
padrão  consistente  aparece.  Lembre-se  que  algumas  di¬ 
ferenças  irão  ocorrer  por  acaso,  mas  um  grande  número 
ou  um  padrão  sistemático  de  diferenças  pode  indicar  um 
padrão  não-aleatório  inerente. 


•  Um  segundo  tratamento  é  um  teste  geral  de  aleatoriedade 
que  determina  se  os  dados  perdidos  podem  ser  classificados 
como  MCAR.  Esse  teste  analisa  o  padrão  de  dados  perdidos 
em  todas  as  variáveis  e  o  compara  com  o  padrão  esperado 
para  um  processo  aleatório  de  perda  de  dados.  Se  diferenças 
significativas  não  são  encontradas,  os  dados  perdidos  podem 
ser  classificados  como  MCAR.  Porém,  se  diferenças  signifi¬ 
cativas  são  percebidas,  o  pesquisador  deve  utilizar  as  abor¬ 
dagens  descritas  previamente  para  identificar  os  processos 
específicos  de  perda  de  dados  que  são  não-aleatórios. 

Como  resultado  desses  testes,  o  processo  de  perda  de 
dados  é  classificado  como  MAR  ou  MCAR,  o  que  deter¬ 
mina  então  os  tipos  apropriados  de  potenciais  correções. 
Ainda  que  atingir  o  nível  de  MCAR  requeira  um  padrão 
completamente  aleatório  na  perda  de  dados,  ele  é  o  tipo 
preferido,  pois  permite  a  mais  vasta  gama  de  potenciais 
ações  corretivas. 

Passo  4:  Selecionar  o  método  de  atribuição 

Neste  passo  do  processo  o  pesquisador  deve  escolher  a 
abordagem  para  acomodação  de  dados  perdidos  na  aná¬ 
lise.  Essa  decisão  é  baseada  primariamente  na  avaliação 
se  os  dados  perdidos  são  MAR  ou  MCAR,  mas  em  qual¬ 
quer  caso  o  pesquisador  tem  várias  opções  para  atribui¬ 
ção  [14,18,21,22].  Atribuição  é  o  processo  de  estimação 
de  valor  perdido  baseado  em  valores  válidos  de  outras  va¬ 
riáveis  e/ou  casos  na  amostra.  O  objetivo  é  empregar  rela¬ 
ções  conhecidas  que  podem  ser  identificadas  nos  valores 
válidos  da  amostra  para  auxiliar  na  estimação  dos  valores 
perdidos.  No  entanto,  o  pesquisador  deve  considerar  cui¬ 
dadosamente  o  uso  de  atribuição  em  cada  caso  por  causa 
de  seu  potencial  impacto  sobre  a  análise  [8]: 

A  idéia  de  atribuição  é  sedutora  e  perigosa.  É  se¬ 
dutora  porque  pode  acalmar  o  usuário  e  levá-lo  ao 
estado  agradável  de  acreditar  que  os  dados  estão 
completos  no  final  das  contas,  e  é  perigosa  porque 


mistura  situações  em  que  o  problema  é  suficiente¬ 
mente  pequeno  de  modo  que  possa  ser  legitima¬ 
mente  tratado  dessa  maneira  e  situações  nas  quais 
estimadores-padrão  aplicados  aos  dados  reais  e 
atribuídos  têm  vieses  substanciais. 

Todos  os  métodos  de  atribuição  discutidos  nesta  se¬ 
ção  são  usados  prioritariamente  com  variáveis  métricas; 
variáveis  não-métricas  são  consideradas  como  perdidas 
a  menos  que  uma  técnica  de  modelagem  específica  seja 
empregada.  Variáveis  não-métricas  não  são  tratáveis  com 
atribuição,  pois  ainda  que  estimativas  dos  dados  perdi¬ 
dos  para  variáveis  métricas  possam  ser  feitas  com  valores 
como  uma  média  de  todos  os  valores  válidos,  nenhuma 
medida  comparável  está  disponível  para  variáveis  não- 
métricas.  Desse  modo,  variáveis  não-métricas  demandam 
uma  estimativa  de  um  valor  específico  em  vez  de  uma 
estimativa  sobre  uma  escala  contínua.  Estimar  um  valor 
perdido  para  uma  variável  métrica,  como  uma  atitude  ou 
percepção  -  ou  mesmo  renda  -  é  diferente  de  estimar  o 
sexo  do  respondente  quando  este  é  um  dado  perdido. 

Atribuição  de  um  processo  de  perda  de  dados  MAR.  Se 

um  processo  não-aleatório  de  perda  de  dados  ou  MAR  é 
descoberto,  o  pesquisador  deve  aplicar  apenas  uma  ação 
corretiva  -  o  tratamento  de  modelagem  especificamente 
elaborado  [18].  O  uso  de  qualquer  outro  método  intro¬ 
duz  viés  nos  resultados.  Este  conjunto  de  procedimentos 
explicitamente  incorpora  os  dados  perdidos  na  análise, 
ou  através  de  um  processo  especificamente  planejado 
para  estimação  de  dados  perdidos,  ou  como  uma  parte 
integral  da  análise  multivariada  padrão.  O  primeiro  tra¬ 
tamento  envolve  técnicas  de  estimação  de  máxima  veros¬ 
similhança  que  tentam  modelar  os  processos  inerentes 
aos  dados  perdidos  e  fazer  as  mais  precisas  e  razoáveis 
estimativas  possíveis  [12,  18j.  Um  exemplo  é  a  aborda¬ 
gem  EM[llj.  E  um  método  iterativo  de  dois  passos  (os 
passos  E  e  M)  no  qual  o  estágio  E  faz  as  melhores  es¬ 
timativas  possíveis  dos  dados  perdidos,  e  em  seguida  o 
estágio  M  promove  estimativas  dos  parâmetros  (médias, 
desvios  padrão  ou  correlações)  assumindo  que  os  dados 
perdidos  foram  substituídos.  O  processo  continua  através 
dos  dois  estágios  até  que  a  mudança  nos  valores  estima¬ 
dos  seja  insignificante  e  eles  substituam  os  dados  perdi¬ 
dos.  Essa  técnica  tem  funcionado  efetivamente  em  casos 
de  processos  não-aleatórios  de  perda  de  dados,  mas  tem 
demonstrado  limitada  aplicação  devido  à  necessidade  de 
software  especializado.  Sua  inclusão  em  versões  recentes 
dos  programas  populares  de  computador  (p.  ex.,  o  módu¬ 
lo  de  Análise  de  Valor  Perdido  do  SPSS)  pode  aumentar 
seu  uso.  Procedimentos  comparáveis  empregam  modela¬ 
gem  de  equações  estruturais  (Capítulo  10)  para  estimar 
os  dados  perdidos  [2,  4,  9],  mas  uma  discussão  detalhada 
desses  métodos  está  além  do  escopo  deste  capítulo. 

A  segunda  abordagem  envolve  a  inclusão  de  dados 
perdidos  diretamente  na  análise,  definindo  observações 
com  dados  perdidos  como  um  subconjunto  selecionado 
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da  amostra.  Essa  técnica  é  mais  aplicável  para  lidar  com 
valores  perdidos  nas  variáveis  independentes  de  uma  re¬ 
lação  de  dependência.  Sua  premissa  foi  melhor  caracteri¬ 
zada  por  Cohen  et  al.  [6]: 

Desse  modo,  percebemos  dados  perdidos  como 
um  fato  pragmático  que  deve  ser  investigado,  e 
não  um  desastre  a  ser  minimizado.  De  fato,  implí¬ 
cita  a  esta  filosofia  está  a  idéia  de  que,  como  todos 
os  outros  aspectos  da  amostra,  os  dados  perdidos 
são  uma  propriedade  da  população  que  buscamos 
generalizar. 

Quando  os  valores  perdidos  surgem  em  uma  variável 
não-métrica,  o  pesquisador  pode  facilmente  definir  aque¬ 
las  observações  como  um  grupo  separado  e  então  incluí- 
las  em  qualquer  análise.  Quando  os  dados  perdidos  estão 
presentes  em  uma  variável  métrica  independente  de  uma 
relação  de  dependência,  as  observações  são  incorporadas 
diretamente  na  análise,  enquanto  as  relações  entre  os  va¬ 
lores  válidos  são  mantidas  [6].  Esse  procedimento  é  me¬ 
lhor  ilustrado  no  contexto  da  análise  de  regressão,  apesar 
de  poder  ser  usado  também  em  outras  relações  de  depen¬ 
dência.  Q  primeiro  passo  é  codificar  todas  as  observações 
com  dados  perdidos  com  uma  variável  dicotômica  (onde 
os  casos  com  dados  perdidos  recebem  o  valor  um  para  va¬ 
riável  dicotômica,  e  os  demais  têm  o  valor  zero,  como  dis¬ 
cutido  na  última  seção  deste  capítulo).  Em  seguida,  os  va¬ 
lores  perdidos  são  atribuídos  pelo  método  de  substituição 
pela  média  (ver  a  próxima  seção  para  uma  discussão  dessa 
técnica).  Finalmente,  a  relação  é  estimada  por  meios  nor¬ 
mais.  A  variável  dicotômica  representa  a  diferença  para 
variável  dependente  entre  aquelas  observações  com  dados 
perdidos  e  as  demais  com  dados  válidos.  Q  coeficiente  da 
variável  dicotômica  avalia  a  significância  estatística  dessa 
diferença.  Q  coeficiente  da  variável  original  representa  a 
relação  para  todos  os  casos  com  dados  não-perdidos.  Este 
método  permite  ao  pesquisador  reter  todas  as  observa¬ 
ções  na  análise  para  manter  o  tamanho  da  amostra.  Ele 
também  fornece  um  teste  direto  para  as  diferenças  entre 
os  dois  grupos,  juntamente  com  a  relação  estimada  entre 
as  variáveis  dependentes  e  independentes. 

A  principal  desvantagem  de  qualquer  uma  dessas  duas 
técnicas  é  a  complexidade  envolvida  em  sua  implementa¬ 
ção  ou  interpretação  por  parte  do  pesquisador.  A  maioria 
dos  pesquisadores  não  está  familiarizada  com  tais  opções, 
e  menos  ainda  com  a  necessidade  de  diagnóstico  de  pro¬ 
cessos  de  perda  de  dados.  No  entanto,  muitas  das  ações 
corretivas  discutidas  na  próxima  seção  para  dados  perdi¬ 
dos  MCAR  estão  diretamente  disponíveis  em  programas 
estatísticos,  tornando  sua  aplicação  mais  ampla,  mesmo 
quando  inadequada.  A  esperança  é  que  com  a  crescen¬ 
te  disponibilidade  dos  programas  especializados  neces¬ 
sários,  bem  como  a  ciência  das  implicações  de  processos 
não-aleatórios  de  perda  de  dados,  permitir-se-á  que  esses 
métodos  mais  adequados  sejam  utilizados  onde  se  fizer 
necessário  para  acomodar  dados  perdidos  MAR. 


Atribuição  de  um  processo  de  perda  de  dados  MCAR.  Se 

o  pesquisador  determina  que  o  processo  de  perda  de  da¬ 
dos  pode  ser  classificado  como  MCAR,  qualquer  uma 
entre  as  duas  técnicas  básicas  será  usada:  empregando 
apenas  dados  válidos  ou  definindo  valores  de  substituição 
para  os  dados  perdidos.  Discutiremos  primeiramente  os 
dois  métodos  que  empregam  apenas  dados  válidos,  e  em 
seguida  promovemos  uma  discussão  sobre  os  métodos  ba¬ 
seados  no  uso  de  valores  de  substituição  para  os  dados 
perdidos. 

Atribuição  usando  apenas  dados  válidos.  Alguns 
pesquisadores  podem  questionar  se  o  emprego  de  somen¬ 
te  dados  válidos  é  realmente  uma  forma  de  atribuição, 
pois  nenhum  valor  de  dado  é  realmente  substituído.  Q 
objetivo  dessa  abordagem  é  representar  a  amostra  intei¬ 
ra  com  aquelas  observações  ou  casos  com  dados  válidos. 
Como  veremos  nas  duas  abordagens  a  seguir,  essa  repre¬ 
sentação  pode  ser  feita  de  diversas  maneiras.  A  suposição 
subjacente  em  ambas  é  que  os  dados  perdidos  obedecem 
a  um  padrão  aleatório  e  que  os  dados  válidos  formam  uma 
representação  adequada. 

•  Abordagem  de  caso  completo:  O  tratamento  mais  simples  e 
direto  para  lidar  com  dados  perdidos  é  incluir  apenas  aque¬ 
las  observações  com  dados  completos,  também  conhecido 
como  abordagem  de  caso  completo.  Esse  método,  também 
conhecido  como  a  técnica  LISTWISE  em  SPSS,  está  dispo¬ 
nível  em  todos  os  programas  estatísticos  e  é  o  método  pa¬ 
drão  em  muitos  programas.  Não  obstante,  a  abordagem  de 
caso  completo  tem  duas  desvantagens.  Primeiro,  ela  é  muito 
afetada  por  qualquer  processo  não-aleatório  de  perda  de 
dados,  pois  os  casos  com  dados  perdidos  são  eliminados 
da  amostra.  Assim,  ainda  que  somente  observações  válidas 
sejam  usadas,  os  resultados  não  podem  ser  generalizados 
para  a  população.  Segundo,  esse  método  também  resulta  na 
maior  redução  do  tamanho  da  amostra,  pois  dados  perdidos 
em  qualquer  variável  eliminam  um  caso  inteiro.  É  sabido 
que,  com  apenas  2%  de  dados  perdidos  aleatoriamente, 
mais  de  18%  dos  casos  terá  algum  dado  perdido.  Assim,  em 
muitas  situações,  mesmo  envolvendo  quantias  muito  peque¬ 
nas  de  dados  perdidos,  o  tamanho  resultante  da  amostra  é 
reduzido  a  algo  inadequado  quando  tal  abordagem  é  utiliza¬ 
da.  Como  resultado,  a  abordagem  de  caso  completo  é  mais 
adequada  para  casos  nos  quais  a  extensão  de  perda  de  dados 
é  pequena,  a  amostra  é  suficientemente  grande  para  permi¬ 
tir  a  eliminação  dos  casos  com  perda  de  dados,  e  as  relações 
nos  dados  são  tão  fortes  a  ponto  de  não  serem  afetadas  por 
qualquer  processo  de  perda  de  dados. 

•  Uso  de  dados  totalmente  disponíveis:  O  segundo  método 
de  atribuição  que  usa  somente  dados  válidos  também  não 
chega  propriamente  a  substituir  os  dados  perdidos:  ele 
atribui  as  características  de  distribuição  (p.  ex.,  médias  ou 
desvios  padrão)  ou  de  relação  (p.  ex.,  correlações)  a  partir 
de  cada  valor  válido.  Conhecido  como  o  método  de  dispo¬ 
nibilidade  total,  este  método  (p.  ex.,  a  opção  PAIRWISE 
em  SPSS)  é  principalmente  usado  para  estimar  correlações 
e  maximizar  a  informação  aos  pares  disponível  na  amos¬ 
tra.  A  característica  peculiar  dessa  técnica  é  que  o  perfil  de 
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uma  variável  (p.  ex.,  média,  desvio  padrão)  ou  a  correlação 
para  um  par  de  variáveis  se  baseia  em  um  conjunto  de  ob¬ 
servações  potencialmente  único.  Espera-se  que  o  número 
de  observações  usadas  nos  cálculos  varie  para  cada  correla¬ 
ção.  O  processo  de  atribuição  ocorre  não  pela  substituição 
de  dados  perdidos,  mas  pelo  uso  das  correlações  obtidas 
somente  nos  casos  com  dados  válidos  como  representati¬ 
vos  da  amostra  inteira. 

Ainda  que  o  método  de  disponibilidade  total  maximize 
os  dados  utilizados  e  supere  o  problema  de  dados  perdidos 
em  uma  única  variável,  eliminando  um  caso  da  análise  como 
um  todo,  vários  problemas  podem  surgir.  Primeiro,  pode-se 
calcular  correlações  que  estejam  “fora  do  intervalo”  e  sejam 
inconsistentes  com  as  outras  correlações  na  matriz  de  cor¬ 
relação  [17].  Qualquer  correlação  entre  XeYé  vinculada  à 
sua  correlação  com  uma  terceira  variável  Z,  como  mostrado 
na  seguinte  fórmula: 


Intervalo  de  r 

xr 


r  r  ± 

rz 


í-r^  )ií-r^  ) 

zz  rz 


A  correlação  entre  XeY  pode  variar  apenas  entre  -1  e  +1  se 
XeY tiverem  correlação  zero  com  todas  as  outras  variáveis 
na  matriz  de  correlação.  Porém,  raramente  as  correlações 
com  outras  variáveis  são  zero.  A  medida  que  as  correlações 
com  outras  variáveis  aumentam,  o  intervalo  da  correlação 
entre  XeY  diminui,  o  que  aumenta  o  potencial  de  a  corre¬ 
lação  em  um  único  conjunto  de  casos  ser  inconsistente  com 
correlações  obtidas  de  outros  conjuntos  de  casos.  Por  exem¬ 
plo,  se  X  e  y  têm  correlações  de  0,6  e  0,4,  respectivamente, 
com  Z,  então  o  possível  intervalo  de  correlação  entre  XeY 
é  0,24  ±  0,73,  ou  seja,  de  -0,49  a  0,97.  Qualquer  valor  fora 
desse  intervalo  é  matematicamente  inconsistente,  ainda  que 
possa  ocorrer  se  a  correlação  for  obtida  com  um  número  e 
um  conjunto  de  casos  diferentes  para  as  duas  correlações  na 
abordagem  de  disponibilidade  total. 

Um  problema  associado  é  que  os  autovalores  na  matriz 
de  correlação  podem  se  tornar  negativos,  alterando  assim  as 
propriedades  de  variância  da  matriz  de  correlação.  Apesar 
de  a  matriz  de  correlação  poder  ser  ajustada  para  eliminar 
esse  problema  (p.  ex.,  a  opção  ALLVALUE  em  BMDP), 
muitos  procedimentos  não  incluem  esse  processo  de  ajuste. 
Em  casos  extremos,  a  matriz  de  variância/covariância  es¬ 
timada  não  é  positiva  definida  [17].  Esses  dois  problemas 
devem  ser  considerados  quando  se  escolhe  a  abordagem  de 
disponibilidade  total. 


Atribuição  usando  valores  de  substituição  A  se¬ 
gunda  forma  de  atribuição  envolve  a  substituição  de  va¬ 
lores  perdidos  por  valores  estimados  com  base  em  outras 
informações  disponíveis  na  amostra.  A  principal  vanta¬ 
gem  é  que,  uma  vez  que  os  valores  de  substituição  são  in¬ 
corporados,  todas  as  observações  estão  disponíveis  para 
uso  na  análise.  Há  muitas  opções,  que  variam  da  substi¬ 
tuição  direta  de  valores  a  processos  de  estimação  basea¬ 
dos  em  relações  entre  as  variáveis.  A  discussão  que  se 
segue  se  concentra  nos  quatro  métodos  mais  amplamente 
usados,  apesar  de  existirem  muitas  outras  formas  de  atri¬ 
buição  [18,21,22].  Esses  métodos  podem  ser  classificados 
quanto  a  usarem  valores  conhecidos  para  a  substituição 


ou  calcularem  o  valor  de  substituição  a  partir  de  outras 
observações. 

•  Uso  de  valores  conhecidos  de  substituição:  A  caracterís¬ 
tica  comum  em  tais  métodos  é  identificar  um  valor  conhe¬ 
cido,  geralmente  de  uma  única  observação,  que  é  usado 
para  substituir  os  dados  perdidos.  A  observação  pode  ser 
da  amostra  ou  mesmo  externa  à  mesma.  Uma  consideração 
fundamental  é  identificar  a  observação  adequada  através  de 
alguma  medida  de  similaridade.  A  observação  com  dados 
perdidos  é  “casada”  com  um  caso  semelhante,  o  que  for¬ 
nece  os  valores  de  substituição  para  os  dados  perdidos.  As 
opções  na  avaliação  de  similaridade  estão  entre  o  uso  de 
mais  variáveis  para  obter  um  melhor  “casamento”  versus  a 
complexidade  no  cálculo  de  similaridade. 

•  Atribuição  por  carta  marcada.  Neste  método,  o  pes¬ 
quisador  substitui  um  valor  a  partir  de  outra  fonte  para 
os  valores  perdidos.  No  método  por  “carta  marcada”,  o 
valor  vem  de  outra  observação  na  amostra  que  é  conside¬ 
rada  semelhante.  Cada  observação  com  dados  perdidos 
é  ladeada  com  outro  caso  que  é  semelhante  em  uma  va¬ 
riável  (ou  variáveis)  especificada  pelo  pesquisador.  Em 
seguida,  dados  perdidos  são  substituídos  por  valores  váli¬ 
dos  a  partir  de  observação  similar.  A  atribuição  por  “car¬ 
ta  marcada”  obtém  o  valor  de  substituição  de  uma  fonte 
externa  (p.  ex.,  estudos  anteriores,  outras  amostras  etc.). 
Aqui  o  pesquisador  deve  estar  certo  de  que  o  valor  de 
substituição  de  uma  fonte  externa  é  mais  válido  do  que 
um  valor  gerado  internamente.  Ambas  as  variantes  deste 
método  fornecem  ao  pesquisador  a  opção  de  substituir 
os  dados  perdidos  por  valores  reais  de  observações  seme¬ 
lhantes  que  podem  ser  consideradas  mais  válidas  do  que 
algum  valor  calculado  a  partir  de  todos  os  casos,  como  a 
média  da  amostra. 

•  Substituição  por  um  caso.  Neste  método,  observações 
inteiras  com  dados  perdidos  são  substituídas  por  uma 
outra  observação  escolhida  fora  da  amostra.  Um  exem¬ 
plo  comum  é  substituir  uma  família  da  amostra,  que  não 
pode  ser  contactada  ou  que  tem  extensos  dados  perdidos, 
por  outra  família  que  não  esteja  na  amostra,  de  prefe¬ 
rência  que  seja  muito  semelhante  à  observação  original. 
Esse  método  é  mais  comumente  usado  para  substituir 
observações  com  dados  completamente  perdidos,  apesar 
de  também  poder  ser  empregado  para  substituir  observa¬ 
ções  com  menores  quantias  de  dados  perdidos.  Um  pon¬ 
to  importante  é  a  habilidade  de  obter  essas  observações 
adicionais  não  incluídas  na  amostra  original. 

•  Cálculo  de  valores  de  substituição:  A  segunda  aborda¬ 
gem  básica  envolve  o  cálculo  do  valor  de  substituição  a 
partir  de  um  conjunto  de  observações  com  dados  válidos 
na  amostra.  A  premissa  é  que  um  valor  obtido  de  todas 
as  outras  observações  na  amostra  é  o  mais  representativo 
valor  de  substituição.  Esses  métodos,  particularmente  a 
substituição  pela  média,  são  mais  amplamente  emprega¬ 
dos  devido  à  sua  facilidade  na  implementação  em  com¬ 
paração  com  o  uso  de  valores  conhecidos,  como  discutido 
anteriormente. 

•  Substituição  pela  média.  Um  dos  métodos  mais  am¬ 
plamente  utilizados,  a  substituição  pela  média,  troca  os 
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valores  perdidos  para  uma  variável  pelo  valor  médio  da¬ 
quela  variável,  com  base  em  todas  as  respostas  válidas. 
O  raciocínio  desse  tratamento  é  que  a  média  é  o  melhor 
valor  único  para  substituição.  Essa  abordagem,  apesar  de 
muito  usada,  tem  diversas  desvantagens.  Primeiro,  subes¬ 
tima  o  valor  de  variância,  pelo  emprego  do  valor  médio 
para  todos  os  dados  perdidos.  Segundo,  a  real  distribui¬ 
ção  de  valores  fica  distorcida,  substituindo-se  os  valores 
perdidos  pela  média.  Terceiro,  esse  método  comprime  a 
correlação  observada,  pois  todos  os  dados  perdidos  têm 
um  único  valor  constante.  Não  obstante,  tem  a  vantagem 
de  ser  fácil  de  implementar  e  fornecer  todos  os  casos  com 
informação  completa.  Uma  variante  desta  técnica  é  a 
substituição  pela  média  do  grupo,  quando  observações 
com  dados  perdidos  são  agrupadas  em  uma  segunda  va¬ 
riável  e  então  valores  médios  para  cada  grupo  são  atri¬ 
buídos  para  os  valores  perdidos  dentro  do  grupo. 

•  Atribuição  por  regressão.  Neste  método,  a  análise  de 
regressão  (descrita  no  Capítulo  4)  é  usada  para  prever  os 
valores  perdidos  de  uma  variável  com  base  em  sua  rela¬ 
ção  com  outras  variáveis  no  conjunto  de  dados.  Primeira¬ 
mente,  uma  equação  preditiva  é  formada  para  cada  variá¬ 
vel  com  dados  perdidos  e  estimados  a  partir  de  todos  os 
casos  com  dados  válidos.  Em  seguida,  os  valores  de  subs¬ 
tituição  para  dado  perdido  são  calculados  a  partir  dos  va¬ 
lores  da  observação  sobre  variáveis  na  equação  preditiva. 
Assim,  o  valor  de  substituição  é  obtido  com  base  naque¬ 
les  valores  da  observação  sobre  outras  variáveis  que  se 
evidenciam  relacionadas  com  o  valor  perdido. 

Apesar  do  apelo  de  usar  relações  já  existentes  na 
amostra  como  a  base  de  previsão,  esse  método  também 
tem  várias  desvantagens.  Primeiro,  reforça  as  relações  já 
presentes  nos  dados.  A  medida  que  o  emprego  desse  mé¬ 
todo  aumenta,  os  dados  resultantes  se  tornam  mais  carac¬ 
terísticos  da  amostra  e  menos  generalizáveis.  Segundo,  a 
menos  que  termos  estocásticos  sejam  acrescentados  aos 
valores  estimados,  a  variância  da  distribuição  é  subesti¬ 
mada.  Terceiro,  esse  método  pressupõe  que  a  variável 
com  dados  perdidos  tem  correlações  substanciais  com  as 
outras  variáveis.  Se  essas  correlações  não  são  suficientes 
para  produzir  uma  estimativa  significativa,  então  outros 
métodos,  como  a  substituição  pela  média,  são  preferíveis. 
Quarto,  a  amostra  deve  ser  grande  o  bastante  para  viabi¬ 
lizar  um  número  suficiente  de  observações  a  serem  usa¬ 
das  na  realização  de  cada  previsão.  Finalmente,  o  proce¬ 
dimento  de  regressão  não  é  vinculado  às  estimativas  que 
faz.  Logo,  os  valores  previstos  podem  não  estar  incluídos 
nos  intervalos  válidos  para  variáveis  (p.  ex.,  um  valor  de 
11  pode  ser  previsto  em  uma  escala  de  10  pontos),  exigin¬ 
do  assim  alguma  forma  de  ajuste  adicional. 

Mesmo  com  todos  esses  problemas  potenciais,  o 
método  de  regressão  para  atribuições  se  mantém  promis¬ 
sor  naqueles  casos  em  que  níveis  moderados  de  dados 
perdidos,  amplamente  dispersos,  estão  presentes,  e  nos 
quais  as  relações  entre  variáveis  são  suficientemente  es¬ 
tabelecidas,  de  modo  que  o  pesquisador  está  confiante 
que  o  uso  desse  método  não  influenciará  a  generalidade 
dos  resultados. 

Os  possíveis  métodos  de  atribuição  variam  dos  con¬ 
servadores  (método  de  dados  completos)  àqueles  que 


tentam  replicar  os  dados  perdidos  tanto  quanto  possível 
(p.  ex.,  métodos  de  atribuição  por  regressão  ou  baseados 
em  modelos).  O  que  deveria  ser  reconhecido  é  que  cada 
método  tem  vantagens  e  desvantagens,  de  modo  que  o 
pesquisador  deve  examinar  cada  situação  de  perda  de 
dados  e  escolher  o  método  de  atribuição  mais  adequa¬ 
do.  A  Tabela  2-2  fornece  uma  breve  comparação  entre 
os  métodos  de  atribuição,  mas  um  rápido  exame  mostra 
que  nenhum  método  particular  é  o  melhor  em  todas  as 
situações.  Contudo,  algumas  sugestões  gerais  (ver  Regras 
Práticas  2-3)  podem  ser  dadas  baseadas  na  extensão  dos 
dados  perdidos. 

Dados  os  muitos  métodos  disponíveis  de  atribuição, 
o  pesquisador  deve  também  considerar  fortemente  uma 
estratégia  de  atribuição  múltipla,  na  qual  uma  combina¬ 
ção  de  vários  métodos  é  empregada.  Nesse  tratamento, 
dois  ou  mais  métodos  de  atribuição  são  usados  para  de¬ 
rivar  uma  estimativa  composta  -  geralmente  a  média  das 
várias  estimativas  -  para  o  valor  perdido.  O  raciocínio 
dessa  abordagem  é  que  o  uso  de  múltiplos  tratamentos 
minimiza  as  preocupações  específicas  com  qualquer  mé¬ 
todo  particular  e  que  a  composição  será  a  melhor  esti¬ 
mativa  possível.  A  escolha  desse  tratamento  é  baseada 
principalmente  no  balanço  entre  a  percepção  do  pesqui¬ 
sador  dos  benefícios  potenciais  versus  o  esforço  subs¬ 
tancialmente  maior  exigido  para  aplicar  e  combinar  as 
múltiplas  estimativas. 

Resumo 

Sabendo-se  que  a  perda  de  dados  é  um  fato  da  vida  na 
maioria  das  pesquisas,  pesquisadores  devem  estar  cientes 
das  conseqüências  e  ações  corretivas  disponíveis.  Como  se 
mostrou  na  discussão  anterior,  está  disponível  um  proces¬ 
so  estruturado  para  auxiliar  o  pesquisador  na  compreen¬ 
são  dos  padrões  inerentes  da  perda  de  dados  e  na  aplica¬ 
ção  de  alguma  entre  as  diversas  ações  corretivas  possíveis. 
Não  obstante,  o  que  não  pode  ser  explicitamente  definido 
é  uma  única  série  de  ações  que  são  mais  apropriadas  em 
todas  as  situações.  Logo,  o  pesquisador  deve  fazer  uma 
série  de  escolhas  embasadas  a  fim  de  evitar  muitos  dos 
problemas  ocultos  associados  com  dados  perdidos. 

Uma  ilustração  de  diagnóstico  de  dados 
perdidos  com  o  processo  de  quatro  etapas 

Para  ilustrar  o  processo  de  diagnóstico  de  padrões  de  da¬ 
dos  perdidos  e  a  aplicação  de  possíveis  ações  corretivas, 
um  novo  conjunto  de  dados  é  introduzido.  Esse  conjunto 
de  dados  foi  coletado  durante  o  pré -teste  de  um  questio¬ 
nário  usado  para  coletar  os  dados  descritos  no  Capítulo 
1.  O  pré-teste  envolveu  70  indivíduos  e  coletou  respostas 
sobre  14  variáveis  (9  métricas,  a  Ug,  e  5  não-métricas, 
Uio  a  Uj4).  As  variáveis  neste  pré-teste  não  coincidem  di¬ 
retamente  com  aquelas  no  conjunto  de  dados  HBAT,  e 
por  isso  elas  serão  chamadas  apenas  pelas  suas  designa¬ 
ções  (p.  ex.,  V3). 
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TABELA  2-2  Comparação  entre  técnicas  de  atribuição  para  dados  perdidos 


Método  de  atribuição 

Vantagens 

Desvantagens 

Meihor  a  ser  usado  quando  ocorrem: 

Atribuição  usando  apenas  dados  válidos 

Dados  compietos 

•  0  mais  simples  para 
implementação 

•  Padrão  em  muitos  programas 
estatísticos 

•  Mais  afetado  por  processos 
não-aleatórios 

•  Maior  redução  no  tamanho  da 
amostra 

•  Menor  poder  estatístico 

•  Grandes  amostras 

•  Fortes  relações  entre  variáveis 

•  Baixos  níveis  de  perda  de  dados 

Dados  totaimente  disponíveis 

•  Maximiza  o  uso  de  dados 
válidos 

•  Resulta  no  maior  tamanho 
possível  de  amostra  sem 
substituir  valores 

•  Variam  os  tamanhos  de 
amostras  para  cada  atribuição 

•  Pode  gerar  valores  para  cor¬ 
relação  e  autovalores  fora  do 
escopo 

•  Níveis  relativamente  baixos  de  dados 
perdidos 

•  Relações  moderadas  entre 
variáveis 

Atribuição  usando  valores  de  substituição  conhecidos 

Substituição  por  um  caso 

•  Oferece  valores  realistas  de 
substituição  (i.e.,  outra 
observação  real)  no  lugar  de 
valores  calculados. 

•  Deve  ter  casos  adicionais  fora 
da  amostra  original 

•  Deve  definir  medida  de 
similaridade  para  identificar  o 
caso  de  substituição 

•  Casos  adicionais  disponíveis 

•  Oportunidades  para  identificar  casos 
de  substituição 

Atribuição  por  carta  marcada 

•  Substitui  dados  perdidos  por 
valores  reais  a  partir  do  caso 
mais  parecido  ou  do  melhor 
valor  conhecido 

•  Deve  definir  casos 
adequadamente  semelhantes 
ou  valores  externos 
apropriados 

•  Valores  de  substituição 
conhecidos,  ou 

•  Indicações  de  variáveis  no 
processo  de  perda  de  dados 
sobre  as  quais  se  possa  basear 
a  similaridade 

Atribuição  por  cálculo  de  valores  de  substituição 

Substituição  peia  média 

•  Facilmente  implementado 

•  Fornece  todos  os  casos  com 
informação  completa 

•  Reduz  variância  da 
distribuição 

•  Distorce  distribuição  dos 
dados 

•  Comprime  correlações 
observadas 

•  Níveis  relativamente  baixos  de  perda 
de  dados 

•  Relações  relativamente  fortes  entre 
variáveis 

Atribuição  por  regressão 

•  Emprega  relações  reais  entre  as 
variáveis 

•  Valores  de  substituição 
calculados  com  base  em  valores 
de  uma  observação  em  outras 
variáveis 

•  Conjunto  único  de  preditores 
pode  ser  usado  para  cada 
variável  com  dados  perdidos 

•  Reforça  relações  existentes  e 
reduz  generalidade 

•  Deve  ter  suficientes  relações 
entre  variáveis  para  gerar 
valores  previstos  válidos 

•  Subestima  variância  a  menos 
que  termo  de  erro  seja 
adicionado  ao  valor  de 
substituição 

•  Valores  de  substituição  podem 
estar  “fora  de  escopo” 

•  Níveis  moderados  ou  altos  de  dados 
perdidos 

•  Relações  suficientemente 
estabelecidas  para  não 
impactarem  generalidade 

•  Disponibilidade  de  softrware 

Métodos  baseados  em  modelos  para  processos  de  perda  de  dados  MAR 

Métodos  baseados  em  mo¬ 
delos 

•  Acomodam  tanto  processos  de 
dados  perdidos  aleatórios 
quanto  não-aleatórios 

•  Melhor  representação  da 
distribuição  original  de  valores 
com  menor  viés 

•  Complexa  especificação  de 
modelo  pelo  pesquisador 

•  Requer  programa 
especializado 

•  Tipicamente  indisponível  de 
forma  direta  em  programas 
(exceto  0  método  EM 

em  SPSS) 

•  É  0  único  método  que  pode  acomo¬ 
dar  processos  não- 

aleatórios  de  perda  de  dados 

•  Elevados  níveis  de  perda  de  dados 
que  demandam  método  menos  ten¬ 
dencioso  para  garantir  generalidade 
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No  entanto,  durante  o  pré-teste,  ocorreram  dados  per¬ 
didos.  As  seções  a  seguir  detalham  o  diagnóstico  dos  da¬ 
dos  perdidos  através  do  processo  de  quatro  etapas.  Diver¬ 
sos  programas  de  computador  incluem  análises  de  dados 
perdidos,  entre  eles  o  BMDP  e  o  SPSS.  As  análises  des¬ 
critas  nas  seções  que  se  seguem  foram  executadas  com  o 
módulo  de  Análise  de  Valor  Perdido  em  SPSS,  mas  todas 
as  análises  podem  ser  repetidas  por  manipulação  de  da¬ 
dos  e  análise  convencional.  Exemplos  são  dados  em  www. 
prenhall.com/hair. 

Passo  1:  Determinação  do  tipo  de  dados  perdidos 

Todos  os  dados  perdidos  neste  exemplo  são  não  ignorá¬ 
veis  e  desconhecidos.  Os  dados  perdidos  aconteceram 
devido  a  motivos  não  explicados  no  planejamento  da  pes¬ 
quisa  -  respondentes  que  simplesmente  não  responderam. 
Como  tal,  o  pesquisador  é  obrigado  a  proceder  ao  exame 
dos  processos  de  perda  de  dados. 

-  REGRAS  PRÁTICAS  2-3  - 

Atribuição  de  dados  perdidos 

•  Menos  que  10%  Qualquer  um  dos  métodos  de 
atribuição  pode  ser  aplicado  quando  dados  perdidos 
são  tão  poucos,  apesar  de  o  método  de  caso  completo 
ser  considerado  o  menos  preferido. 

•  Entre  10%  e  20%  Essa  maior  presença  de  dados 
perdidos  torna  os  métodos  de  disponibilidade  total, 
carta  marcada  e  regressão,  os  preferenciais  para  dados 
MCAR,  enquanto  métodos  baseados  em  modelos  são 
necessários  com  processos  de  perda  de  dados  MAR. 

•  Acima  de  20%  Se  se  considerar  necessário  atribuir 
dados  perdidos  quando  o  nível  estiver  acima  de  20%,  os 
métodos  preferenciais  são: 

•  O  método  de  regressão  para  situações  MCAR 

•  Métodos  baseados  em  modelos  quando  dados 
perdidos  MAR  ocorrem 


Passo  2:  Determinação  a  extensão  de  dados  perdidos 

O  objetivo  neste  passo  é  determinar  se  a  extensão  dos  da¬ 
dos  perdidos  é  suficientemente  elevada  para  garantir  um 
diagnóstico  de  aleatoriedade  da  perda  de  dados  (passo  3), 
ou  se  ela  está  em  um  nível  suficientemente  baixo  para  que 
se  proceda  diretamente  à  ação  corretiva  (passo  4).  O  pes¬ 
quisador  está  interessado  no  nível  de  perda  de  dados  com 
base  em  um  caso  e  variável,  mais  a  extensão  geral  de  perda 
de  dados  ao  longo  de  todos  os  casos. 


A  Tabela  2-3  contém  a  estatística  descritiva  para  as  obser¬ 
vações  com  valores  válidos,  incluindo  a  porcentagem  de 
casos  com  dados  perdidos  em  cada  variável.  Examinando 
as  variáveis  métricas  (Vj  a  Vg),  percebemos  que  a  menor 


quantia  de  dados  perdidos  é  de  seis  casos  para  (9%  da 
amostra),  subindo  para  até  30%  (21  casos)  para  V^.  Essa 
freqüência  torna  e  possíveis  candidatos  para  elimi¬ 
nação  em  uma  tentativa  de  reduzir  a  quantia  geral  de  da¬ 
dos  perdidos.  Todas  as  variáveis  não-métricas  (Ejo  a 
têm  baixos  níveis  de  dados  perdidos  e  são  aceitáveis. 

Além  disso,  a  quantia  de  dados  perdidos  por  caso 
também  é  tabulada.  Apesar  de  26  casos  não  terem  dados 
perdidos,  é  também  aparente  que  6  casos  têm  50%  dos 
dados  perdidos,  o  que  os  torna  prováveis  de  eliminação 
devido  a  um  número  excessivo  de  valores  perdidos.  A 
Tabela  2-4  mostra  os  padrões  de  perda  de  dados  para 
todos  os  casos  nos  quais  isso  acontece,  e  esses  seis  casos 
são  listados  na  parte  inferior  da  tabela.  Conforme  ve¬ 
mos  os  padrões  de  dados  perdidos,  percebemos  que  os 
mesmos  ocorrem  ao  longo  de  variáveis  tanto  métricas 
quanto  não-métricas,  de  modo  que  deveriam  ajudar  na 
diminuição  da  amplitude  de  dados  perdidos  se  elimina¬ 
dos.  Outro  benefício  é  que  todos  os  dados  perdidos  para 
as  variáveis  não-métricas  acontecem  nesses  seis  casos, 
de  modo  que  após  sua  eliminação  haverá  somente  dados 
válidos  para  essas  variáveis. 

Ainda  que  seja  óbvio  que  a  eliminação  dos  seis  casos 
irá  melhorar  a  amplitude  de  dados  perdidos,  o  pesqui¬ 
sador  deve  também  considerar  a  possibilidade  de  elimi¬ 
nar  uma  variável  (ou  mais  de  uma)  se  o  nível  de  dados 
perdidos  for  elevado.  As  duas  variáveis  mais  indicadas 
para  uma  eliminação  são  e  V^,  com  30%  e  24%  de 
dados  perdidos,  respectivamente.  A  Tabela  2-5  forne¬ 
ce  uma  visão  sobre  o  impacto  da  eliminação  de  uma 
ou  ambas,  examinando  os  padrões  de  dados  perdidos 
e  avaliando  a  extensão  em  que  a  perda  de  dados  dimi¬ 
nuirá.  Por  exemplo,  o  primeiro  padrão  (primeira  linha) 
mostra  que  não  há  dados  perdidos  para  os  26  casos.  O 
padrão  da  segunda  linha  mostra  dados  perdidos  somen¬ 
te  para  e  indica  que  apenas  1  caso  tem  este  padrão. 
A  coluna  no  extremo  direito  indica  o  número  de  casos 
com  informação  completa  se  esse  padrão  for  eliminado 
(i.e.,  essas  variáveis  são  eliminadas  ou  valores  de  subs¬ 
tituição  são  atribuídos).  No  caso  deste  primeiro  padrão, 
vemos  que  o  número  de  casos  com  dados  completos  au¬ 
mentaria  em  uma  unidade,  para  27,  atuando  sobre  V^, 
pois  somente  um  caso  era  dado  perdido  sobre  apenas 
Ej.  Se  olharmos  para  a  quarta  linha,  percebemos  que 
6  casos  são  dados  perdidos  sobre  apenas  V^,  de  forma 
que  se  eliminarmos  V^,  32  casos  terão  dados  completos. 
Finalmente,  a  terceira  linha  denota  o  padrão  de  perda 
de  dados  em  ambas  e  V^,  e  se  eliminarmos  as  duas 
variáveis,  o  número  de  casos  com  dados  completos  au¬ 
mentará  para  37.  Logo,  eliminar  apenas  acrescenta  1 
caso  com  dados  completos,  eliminar  apenas  aumenta 
o  total  com  mais  6  casos,  e  eliminar  ambas  as  variáveis 
acrescenta  mais  11  casos  com  dados  completos,  perfa¬ 
zendo  um  total  de  37. 

{Continua) 
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Para  fins  de  ilustração,  eliminaremos  somente  V-^, 
deixando  Pj  com  uma  quantia  razoavelmente  alta  de  da¬ 
dos  perdidos  para  demonstrar  seu  impacto  no  processo 
de  atribuição.  O  resultado  é  uma  amostra  de  64  casos 
que  agora  conta  com  apenas  oito  variáveis  métricas.  A 
Tabela  2-6  contém  estatísticas-resumo  sobre  essa  amos¬ 
tra  reduzida.  A  extensão  de  perda  de  dados  diminuiu 
consideravelmente  graças  à  eliminação  de  6  casos  (me¬ 
nos  que  10%  da  amostra)  e  uma  variável.  Agora,  metade 
da  amostra  tem  dados  completos,  apenas  duas  variáveis 
têm  mais  de  10%  de  dados  perdidos,  e  as  variáveis  não- 
métricas  contam  todas  com  dados  completos.  Além  dis¬ 
so,  o  maior  número  de  valores  perdidos  para  qualquer 
caso  é  dois,  o  que  indica  que  a  atribuição  não  deve  afetar 
qualquer  caso  de  maneira  substancial. 


Tendo  eliminado  seis  casos  e  uma  variável,  a  extensão 
de  dados  perdidos  é  ainda  grande  o  bastante  para  justi¬ 
ficar  a  ida  para  o  passo  3  e  diagnosticar  a  aleatoriedade 
dos  padrões  de  perda  de  dados.  Essa  análise  será  limitada 
às  variáveis  métricas,  pois  as  não-métricas  agora  não  têm 
perda  de  dados. 


Passo  3:  Diagnóstico  da  aleatoriedade 
do  processo  de  perda  de  dados 

O  próximo  passo  é  um  exame  empírico  dos  padrões  de  da¬ 
dos  perdidos,  para  determinar  se  estes  estão  distribuídos 
ao  acaso  pelos  casos  e  pelas  variáveis.  É  melhor  se  os  dados 
perdidos  forem  considerados  MCAR,  permitindo  assim 
uma  gama  maior  de  ações  corretivas  no  processo  de  atri¬ 
buição.  Empregaremos  primeiramente  um  teste  de  com¬ 
paração  entre  grupos  de  casos  perdidos  e  não-perdidos,  e 
então  conduziremos  um  teste  geral  de  aleatoriedade. 

O  primeiro  teste  para  avaliar  aleatoriedade  é  compa¬ 
rar  as  observações  com  e  sem  dados  perdidos  para  cada 
variável  com  relação  às  outras  variáveis.  Por  exemplo,  as 
observações  com  dados  perdidos  em  são  colocadas  em 
um  grupo,  e  as  observações  com  respostas  válidas  para 
V2  são  dispostas  em  um  outro  grupo.  Em  seguida,  esses 
dois  grupos  são  comparados  para  identificar  diferenças 
nas  demais  variáveis  métricas  (Ej  a  E,).  Elma  vez  que 
tenham  sido  feitas  comparações  em  todas  as  variáveis, 
novos  grupos  são  formados  com  base  nos  dados  perdidos 
da  variável  seguinte  (Ej),  e  as  comparações  são  nova¬ 
mente  feitas  nas  variáveis  restantes.  Esse  processo  conti¬ 
nua  até  que  cada  variável  (Ej  a  E,;  lembre-se  que  Ej  foi 


TABELA  2-3  Estatísticas-resumo  de  dados  perdidos  para  a  amostra  originai 


Variável 

Número  de 

casos 

Média 

Desvio 

padrão 

Dados  perdidos 

Número  Percentual 

49 

4,0 

0,93 

21 

30 

14 

57 

1,9 

0,93 

13 

19 

14 

53 

8,1 

1,41 

17 

24 

1/4 

63 

5,2 

1,17 

7 

10 

61 

2,9 

0,78 

9 

13 

14 

64 

2,6 

0,72 

6 

9 

14 

61 

6,8 

1,68 

9 

13 

1/8 

61 

46,0 

9,36 

9 

13 

63 

4,8 

0,83 

7 

10 

68 

NA 

NA 

2 

3 

1/1, 

68 

NA 

NA 

2 

3 

68 

NA 

NA 

2 

3 

1^13 

69 

NA 

NA 

1 

1 

1^,4 

68 

NA 

NA 

2 

3 

NA  =  Não  aplicável  a  variáveis  não-métricas 

Resumo  de  casos 

Número  de  dados 

perdidos  por  caso 

Número  de  casos 

Percentual  da  amostra 

0 

26 

37 

1 

15 

21 

2 

19 

27 

3 

4 

e 

7 

6 

C 

) 

Total 
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100% 
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TABELA  2-4  Padrões  de  perda  de  dados  por  caso 


Caso 

Quantia 

perdida 

Padrões  de  dados  perdidos 

Percentuai 

perdido 

V, 

1^2 

V, 

1^5 

14 

1^9 

1^1, 

205 

1 

7,1 

s 

202 

2 

14,3 

S 

s 

250 

2 

14,3 

s 

s 

255 

2 

14,3 

s 

s 

269 

2 

14,3 

s 

s 

238 

1 

7,1 

s 

240 

1 

7,1 

s 

253 

1 

7,1 

s 

256 

1 

7,1 

s 

259 

1 

7,1 

s 

260 

1 

7,1 

s 

228 

2 

14,3 

s 

s 

246 

1 

7,1 

s 

225 

2 

14,3 

s 

s 

267 

2 

14,3 

s 

s 

222 

2 

14,3 

s 

s 

241 

2 

14,3 

s 

s 

229 

1 

7,1 

s 

216 

2 

14,3 

s 

s 

218 

2 

14,3 

s 

s 

232 

2 

14,3 

s 

s 

248 

2 

14,3 

s 

s 

237 

1 

7,1 

s 

249 

1 

7,1 

s 

220 

1 

7,1 

s 

213 

2 

14,3 

s 

s 

257 

2 

14,3 

s 

s 

203 

2 

14,3 

s 

s 

231 

1 

7,1 

s 

219 

2 

14,3 

s 

s 

244 

1 

7,1 

s 

227 

2 

14,3 

s 

s 

224 

3 

21,4 

s 

s 

s 

268 

1 

7,1 

s 

235 

2 

14,3 

s 

s 

204 

3 

21,4 

s 

s 

s 

207 

3 

21,4 

s 

s 

s 

221 

3 

21,4 

s 

s 

s 

245 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

233 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

261 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

210 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

263 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

s 

214 

7 

50,0 

s 

s 

s 

s 

s 

s 

s 

Nota:  Somente  casos  com  dados  perdidos  são  mostrados. 
S  =  dados  perdidos 
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TABELA  2-5  Padrões  de  perda  de  dados 


Padrões  de  perda  de  dados 

Número 
de  casos 

V, 

1^3 

<^4 

1^7 

<^8 

Número  de  casos 
completos  se 
variáveis  com  0 
padrão  de  dados 
perdidos  não 

Vg  i/io  1^12  *^13  *^14  usadas 

26 

26 

1 

X 

27 

4  X 

X 

37 

6  X 

32 

1  X 

X 

34 

1 

X 

27 

2 

X 

X 

30 

2 

X 

X 

30 

1 

X 

27 

2  X 

X 

35 

2  X 

X 

37 

3 

X 

29 

2 

X 

X 

X 

32 

1 

X 

X 

31 

1 

X 

X 

27 

1 

X 

29 

1 

X 

27 

1 

X 

X 

31 

1  X 

X 

X  40 

1 

X  27 

1 

X 

28 

2  X 

X 

X 

40 

1  X 

X 

X 

39 

1  X 

X 

X 

X 

X  X  47 

1 

X 

X 

X  X 

X  X  X  38 

1 

X 

X 

X 

X 

X 

XX  40 

1 

X 

X  X 

X 

X 

XX  34 

1 

X 

X 

X  X 

X 

X 

X  37 

1  X 

X 

X 

X 

X 

XX  38 

Notas:  Representa  o  número  de  casos  com  cada  padrão  de  dados  perdidos.  Por  exemplo,  lendo  de  cima  para  baixo  a  coluna  para  os  primeiros  três  valores  (26,  1  e 
4),  26  casos  não  são  dados  perdidos  sobre  qualquer  variãvel.  Então,  1  caso  é  de  dado  perdido  em  I4.  Em  seguida,  4  casos  são  de  dados  perdidos  sobre  duas  variá¬ 
veis  (l/,  e  14). 

excluída)  tenha  sido  examinada  para  qualquer  diferença 
0  objetivo  é  identificar  qualquer  processo  sistemático  de 
dados  perdidos  que  apareceria  em  padrões  de  diferenças 
significantes. 

uma  outra  instância  (grupos  formados  sobre  e  com¬ 
parados  sobre  V^)  mostrou  uma  diferença  significativa. 
Essa  análise  indica  que,  apesar  de  diferenças  significan¬ 
tes  poderem  ser  encontradas  devido  aos  dados  perdidos 
em  uma  variável  {V2),  os  efeitos  são  limitados  somente 
a  essa  variável,  tornando-a  de  interesse  marginal.  Se 
testes  posteriores  de  aleatoriedade  indicassem  um  pa¬ 
drão  não-aleatório  de  dados  perdidos,  esses  resultados 
forneceriam  um  ponto  de  partida  para  possíveis  ações 
corretivas. 

A  Tabela  2-7  contém  os  resultados  para  essa  análise  das 
64  observações  restantes.  O  único  padrão  observável  de 
valores  t  significantes  ocorre  em  V2,  na  qual  três  das  oito 
comparações  (V^,  e  apontaram  para  diferenças 

significantes  entre  os  dois  grupos.  Além  disso,  apenas 
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TABELA  2-6  Estatísticas-resumo  para  amostra  reduzida  (seis  casos  e  P,  eliminada) 


Número 
de  casos 

Média 

Desvio 

padrão 

Dados  perdidos 

Número  Percentual 

V2 

54 

1,9 

0,86 

10 

16 

Vs 

50 

8,1 

1,32 

14 

22 

V, 

60 

5,1 

1,19 

4 

6 

Vs 

59 

2,8 

0,75 

5 

8 

Ve 

63 

2,6 

0,72 

1 

2 

Vr 

60 

6,8 

1,68 

4 

6 

Ve 

60 

46,0 

9,42 

4 

6 

Ve 

60 

4,8 

0,82 

4 

6 

V,o 

64 

0 

0 

Vu 

64 

0 

0 

V,e 

64 

0 

0 

V,e 

64 

0 

0 

^4 

64 

0 

0 

HA  =  Não  aplicável  a  variáveis  não-métricas 

Resumo  de  casos 

Número  de  dados 

perdidos  por  caso 

Número  de  casos 

Percentual  da  amostra 

0 

32 

50 

1 

18 

28 

2 

14 

22 

Total 

64 

100 

O  teste  final  é  um  teste  geral  dos  dados  perdidos  para 
detectar  MCAR.  O  teste  faz  uma  comparação  do  real  pa¬ 
drão  de  dados  perdidos  com  o  que  se  esperaria  se  os  da¬ 
dos  perdidos  fossem  distribuídos  totalmente  ao  acaso.  O 
processo  MCAR  de  perda  de  dados  é  indicado  por  um  ní¬ 
vel  estatístico  não-significante  (p.  ex.,  maior  do  que  0,05), 
revelando  que  o  padrão  observado  não  difere  de  um  ale¬ 
atório.  Tal  teste  é  executado  no  módulo  Análise  de  Valor 
Perdido  do  SPSS,  bem  como  em  outros  pacotes  computa¬ 
cionais  que  lidam  com  análise  de  perda  de  valores. 


Neste  caso,  o  teste  MCAR  de  Little  tem  um  nível  de 
significância  de  0,583,  indicando  uma  diferença  não- 
significante  entre  o  padrão  de  dados  perdidos  observa¬ 
dos  na  amostra  reduzida  e  um  padrão  aleatório.  Este 
resultado,  acoplado  com  a  análise  anterior  mostrando 
diferenças  mínimas  em  um  padrão  não-aleatório,  per¬ 
mite  que  o  processo  de  perda  de  dados  seja  considerado 
MCAR.  Como  resultado,  o  pesquisador  pode  empregar 
qualquer  uma  das  ações  corretivas  para  perda  de  dados, 
pois  não  existe  qualquer  viés  potencial  nos  padrões  de 
dados  perdidos. 


Passo  4:  Seleção  de  um  método  de  atribuição 

Como  discutido  anteriormente,  diversos  métodos  de  atri¬ 
buição  estão  disponíveis  tanto  para  processos  MCAR  quan¬ 
to  MAR.  Neste  caso,  o  processo  MCAR  de  perda  de  dados 
viabiliza  o  uso  de  qualquer  um  dos  métodos  de  atribuição. 
O  outro  fator  a  ser  considerado  é  a  extensão  de  dados  per¬ 
didos.  A  medida  que  o  nível  de  perda  de  dados  aumenta, 
métodos  como  o  de  informação  completa  se  tornam  menos 
interessantes,  devido  a  restrições  no  tamanho  da  amostra, 
enquanto  os  métodos  de  disponibilidade  total,  de  regressão 
e  baseados  em  modelos  se  mostram  preferíveis. 


A  primeira  opção  é  usar  apenas  observações  com  dados 
completos.  A  vantagem  dessa  abordagem  de  manter 
consistência  na  matriz  de  correlação  é,  porém,  compen¬ 
sada  neste  caso  por  sua  redução  da  amostra  para  um 
tamanho  tão  pequeno  (32  casos)  que  se  torna  inútil  em 
análises  posteriores.  As  próximas  opções  ainda  são  o  uso 
de  somente  dados  válidos,  através  do  método  de  dispo¬ 
nibilidade  total,  ou  calcular  valores  de  substituição  por 
meio  de  métodos  como  a  substituição  pela  média,  a  téc- 

(Continua) 
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TABELA  2-7  Avaliação  da  aleatoriedade  dos  dados  perdidos  através  de  comparações  de  grupos  de  observações 
com  dados  perdidos  versus  válidos 


Grupos  formados  por  dados 
perdidos  em: 

14 

K 

K 

1^8 

14 

1/2 

Valor  f 

0,7 

-2,2 

-4,2 

-2,4 

-1 ,2 

-1,1 

-1,2 

Significância 

, 

0,528 

0,044 

0,001 

0,034 

0,260 

0,318 

0,233 

Número  de  casos  (dados  válidos) 

54 

42 

50 

49 

53 

51 

52 

50 

Número  de  casos  (dados  perdidos) 

0 

8 

10 

10 

10 

9 

8 

10 

Média  de  casos  (dados  válidos) 

1,9 

8,2 

5,0 

2,7 

2,5 

6,7 

45,5 

4,8 

Média  de  casos  (dados  perdidos) 

. 

7,9 

5,9 

3,5 

3,1 

7,4 

49,2 

5,0 

Valor  f 

1,4 

1,1 

2,0 

0,2 

0,0 

1,9 

0,9 

Significância 

0,180 

, 

0,286 

0,066 

0,818 

0,965 

0,073 

0,399 

Número  de  casos  (dados  válidos) 

42 

50 

48 

47 

49 

47 

46 

48 

Número  de  casos  (dados  perdidos) 

12 

0 

12 

12 

14 

13 

14 

12 

Média  de  casos  (dados  válidos) 

2,0 

8,1 

5,2 

2,9 

2,6 

6,8 

47,0 

4,8 

Média  de  casos  (dados  perdidos) 

1,6 

. 

4,8 

2,4 

2,6 

6,8 

42,5 

4,6 

K 

Valor  f 

2,6 

-0,3 

0,2 

1,4 

1,5 

0,2 

-2,4 

Significância 

0,046 

0,785 

, 

0,888 

0,249 

0,197 

0,830 

0,064 

Número  de  casos  (dados  válidos) 

50 

48 

60 

55 

59 

56 

56 

56 

Número  de  casos  (dados  perdidos) 

4 

2 

0 

4 

4 

4 

4 

4 

Média  de  casos  (dados  válidos) 

1,9 

8,1 

5,1 

2,8 

2,6 

6,8 

46,0 

4,8 

Média  de  casos  (dados  perdidos) 

1,3 

8,4 

. 

2,8 

2,3 

6,2 

45,2 

5,4 

K 

Valor  f 

-0,3 

0,8 

0,4 

-0,9 

-0,4 

0,5 

0,6 

Significância 

0,749 

0,502 

0,734 

, 

0,423 

0,696 

0,669 

0,605 

Número  de  casos  (dados  válidos) 

49 

47 

55 

59 

58 

55 

55 

55 

Número  de  casos  (dados  perdidos) 

5 

3 

5 

0 

5 

5 

5 

5 

Média  de  casos  (dados  válidos) 

1,9 

8,2 

5,2 

2,8 

2,6 

6,8 

46,2 

4,8 

Média  de  casos  (dados  perdidos) 

2,0 

7,1 

5,0 

2,9 

7,1 

43,6 

4,6 

K 

Valor  t 

0,9 

0,2 

-2,1 

0,9 

-1,5 

0,5 

0,4 

Significância 

0,440 

0,864 

0,118 

0,441 

0,193 

, 

0,658 

0,704 

Número  de  casos  (dados  válidos) 

51 

47 

56 

55 

59 

60 

57 

56 

Número  de  casos  (dados  perdidos) 

3 

3 

4 

4 

4 

0 

3 

4 

Média  de  casos  (dados  válidos) 

1,9 

8,1 

5,1 

2,9 

2,6 

6,8 

46,1 

4,8 

Média  de  casos  (dados  perdidos) 

1,5 

8,0 

6,2 

2,5 

2,9 

42,7 

4,7 

K 

Valor  f 

-1,4 

2,2 

-1,1 

-,9 

-1,8 

1,7 

1,6 

Significância 

0,384 

0,101 

0,326 

0,401 

0,149 

0,128 

, 

0,155 

Número  de  casos  (dados  válidos) 

52 

46 

56 

55 

59 

57 

60 

56 

Número  de  casos  (dados  perdidos) 

2 

4 

4 

4 

4 

3 

0 

4 

Média  de  casos  (dados  válidos) 

1,9 

8,3 

5,1 

2,8 

2,6 

6,8 

46,0 

4,8 

Média  de  casos  (dados  perdidos) 

3,0 

6,6 

5,6 

3,1 

3,0 

6,3 

. 

4,5 

K 

Valor  f 

0,8 

-2,1 

2,5 

2,7 

1,3 

0,9 

2,4 

Significância 

0,463 

0,235 

0,076 

0,056 

0,302 

0,409 

0,066 

, 

Número  de  casos  (dados  válidos) 

50 

48 

56 

55 

60 

56 

56 

60 

Número  de  casos  (dados  perdidos) 

4 

2 

4 

4 

3 

4 

4 

0 

Média  de  casos  (dados  válidos) 

1,9 

8,1 

5,2 

2,9 

2,6 

6,8 

46,4 

4,8 

Média  de  casos  (dados  perdidos) 

1,6 

9,2 

3,9 

2,1 

2,2 

6,3 

39,5 

Notas:  Cada  célula  contém  seis  valores:  (1 )  Valor  t  para  a  comparação  das  médias  da  variável  coluna  ao  longo  dos  grupos  formados  entre 
0  grupo  a  (casos  com  dados  válidos  na  variável  linha)  e  grupo  b  (observações  com  dados  perdidos  na  variável  linha);  (2)  significância  do 
valor  f  para  comparações  de  grupos;  (3)  e  (4)  número  de  casos  para  o  grupo  a  (dados  válidos)  e  para  o  grupo  b  (dados  perdidos);  (5)  e  (6) 
média  da  variável  coluna  para  o  grupo  a  (dados  válidos  na  variável  linha)  e  para  o  grupo  b  (dados  perdidos  na  variável  linha) 

Interpretação  da  tabela;  A  célula  no  canto  superior  direito  indica  que  um  valor  t  para  a  comparação  de  Vg  entre  o  grupo  a  (dados  válidos 
sobre  Vg)  e  o  grupo  b  (dados  perdidos  em  Vg)  é  -1 ,2,  o  que  tem  um  nível  de  significância  de  0,233.  Os  tamanhos  das  amostras  dos  grupos 
a  e  b  são,  respectivamente,  50  e  10.  Finalmente,  a  média  do  grupo  a  (dados  válidos  em  V^)  é  4,8,  enquanto  a  média  do  grupo  b  (dados 
perdidos  em  V^)  é  5,0. 
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(Continuação) 

nica  baseada  em  regressão,  ou  mesmo  uma  abordagem 
de  construção  de  modelo  (p.  ex.,  método  EM).  Pelo  fato 
de  os  dados  perdidos  serem  MCAR,  todos  esses  méto¬ 
dos  serão  empregados  e  então  comparados  para  avaliar 
as  diferenças  que  surgem  entre  técnicas.  Eles  poderiam 
também  formar  a  base  para  uma  estratégia  de  atribuição 
múltipla  na  qual  todos  os  resultados  são  combinados  em 
um  único  resultado  geral. 

A  Tabela  2-8  detalha  os  resultados  da  estimativa  de 
médias  e  desvios  padrão  por  quatro  métodos  de  atribui¬ 
ção  (substituição  pela  média,  disponibilidade  total,  re¬ 
gressão  e  EM).  Ao  comparar  médias,  descobrimos  uma 
consistência  geral  entre  as  abordagens,  sem  padrões 
perceptíveis.  Para  os  desvios  padrão,  contudo,  podemos 
ver  a  redução  de  variância  associada  com  o  método  de 
substituição  pela  média.  Por  todas  as  variáveis,  ele  con¬ 
sistentemente  fornece  o  menor  desvio  padrão,  o  que  é 
atribuído  à  substituição  por  um  valor  constante.  Os  ou¬ 
tros  três  métodos  novamente  exibem  uma  consistência 
nos  resultados,  indicativa  da  falta  de  viés  em  qualquer 
uma  das  metodologias,  uma  vez  que  o  processo  de  perda 
de  dados  foi  considerado  MCAR. 

Finalmente,  a  Tabela  2-9  contém  as  correlações  ob¬ 
tidas  das  abordagens  de  atribuição  de  caso  completo, 
disponibilidade  total,  substituição  pela  média  e  EM.  Na 
maioria  dos  casos,  as  correlações  são  parecidas,  mas  há 
várias  diferenças  substanciais.  Primeiro,  há  uma  consis¬ 
tência  entre  as  correlações  obtidas  com  as  abordagens  de 
disponibilidade  total,  da  substituição  pela  média  e  EM. 
No  entanto,  diferenças  consistentes  ocorrem  entre  esses 
valores  e  aqueles  do  método  de  caso  completo.  Segundo, 
as  diferenças  notáveis  estão  concentradas  nas  correlações 
de  V2  e  Vj,  as  duas  variáveis  com  a  maior  quantia  de  da¬ 
dos  perdidos  na  amostra  reduzida  (olhe  novamente  a  Ta¬ 
bela  2-6).  Essas  diferenças  podem  indicar  o  impacto  de 
um  processo  de  dados  perdidos,  ainda  que  o  teste  geral 
de  aleatoriedade  não  tenha  mostrado  qualquer  padrão 
significante.  Apesar  de  o  pesquisador  não  possuir  qual¬ 
quer  prova  de  maior  validade  para  qualquer  tratamento, 
esses  resultados  demonstram  as  diferenças  marcantes 
que  às  vezes  ocorrem  entre  as  abordagens.  Qualquer  que 
seja  a  metodologia  escolhida,  o  pesquisador  deve  exami¬ 
nar  as  correlações  obtidas  por  métodos  alternativos  para 
compreender  a  amplitude  de  possíveis  valores. 


A  tarefa  do  pesquisador  é  fundir  os  padrões  de  perda 
de  dados  com  os  pontos  fortes  e  fracos  de  cada  abordagem, 
e  então  selecionar  o  método  mais  apropriado.  No  caso  de 
diferentes  estimativas,  a  abordagem  mais  conservadora  de 
combinar  as  estimativas  em  uma  só  (a  técnica  de  atribuição 
múltipla)  pode  ser  a  melhor  escolha.  Qualquer  que  seja  o 
método  empregado,  o  conjunto  de  dados  com  valores  de 
substituição  deve  ser  armazenado  para  análise  posterior. 


Uma  recapitulação  da  análise  de  valores  perdidos 

Nossa  avaliação  das  questões  que  envolvem  dados  perdi¬ 
dos  no  conjunto  de  dados  pode  ser  resumida  em  quatro 
conclusões: 


•  O  processo  de  dados  perdidos  é  MCAR.  Todas  as  téc¬ 
nicas  diagnósticas  apoiam  a  conclusão  de  que  nenhum 
processo  sistemático  de  dados  perdidos  existe,  o  que 
torna  os  dados  perdidos  MCAR  (perdidos  completa¬ 
mente  ao  acaso).  Tal  descoberta  dá  duas  vantagens  ao 
pesquisador.  Primeiro,  não  deve  haver  qualquer  impac¬ 
to  “oculto”  sobre  os  resultados  que  precise  ser  consi¬ 
derado  quando  interpretamos  os  resultados.  Segundo, 
qualquer  método  de  atribuição  pode  ser  aplicado  como 
ação  corretiva  nos  dados  perdidos.  A  seleção  dos  mes¬ 
mos  não  precisa  ser  baseada  em  suas  habilidades  para 
lidar  com  processos  não-aleatórios,  mas  sim  na  aplicabi¬ 
lidade  do  processo  e  seu  impacto  sobre  os  resultados. 

•  A  atribuição  é  o  curso  de  ação  mais  lógico.  Mesmo 
quando  é  dado  o  benefício  de  eliminar  casos  e  variá¬ 
veis,  o  pesquisador  está  prevenido  contra  a  solução 
simples  de  usar  o  método  de  caso  completo,  pois  isso 
resulta  em  um  tamanho  de  amostra  inadequado.  Por¬ 
tanto,  alguma  forma  de  atribuição  se  faz  necessária 
para  manter  um  tamanho  de  amostra  adequado  para 
qualquer  análise  multivariada. 

•  Ai  correlações  atribuídas  diferem  de  acordo  com  as 
técnicas.  Ao  estimar  as  correlações  entre  as  variáveis 
na  presença  de  dados  perdidos,  o  pesquisador  pode 
escolher  entre  quatro  técnicas  mais  comumente  em¬ 
pregadas:  o  método  de  caso  completo,  a  técnica  de 
disponibilidade  total,  a  abordagem  de  substituição 
pela  média  e  EM.  No  entanto,  essa  situação  o  pesqui¬ 
sador  se  depara  com  diferenças  nos  resultados  entre 
esses  métodos.  As  abordagens  de  disponibilidade  to¬ 
tal,  substituição  pela  média  e  EM  conduzem  a  resulta¬ 
dos  geralmente  consistentes.  Não  obstante,  diferenças 
notáveis  são  encontradas  entre  essas  abordagens  e 
o  método  de  disponibilidade  completa.  Apesar  de  o 
método  de  disponibilidade  completa  parecer  mais  “se¬ 
guro”  e  conservador,  não  é  recomendado  neste  caso 
devido  à  pequena  amostra  empregada  (apenas  26  ob¬ 
servações)  e  às  suas  grandes  diferenças  em  relação  aos 
outros  dois  métodos.  Q  pesquisador  deve  escolher,  se 
necessário,  entre  os  outros  tratamentos. 

•  Múltiplos  métodos  para  substituir  os  dados  perdidos  estão 
disponíveis  e  são  apropriados.  Como  mencionado  acima, 
a  substituição  pela  média  é  um  meio  aceitável  para  gerar 
valores  de  substituição  para  os  dados  perdidos.  Q  pes¬ 
quisador  também  tem  à  sua  disposição  os  métodos  de 
regressão  e  de  atribuição  EM,  cada  um  dos  quais  gera 
estimativas  razoavelmente  consistentes  para  a  maioria 
das  variáveis.  A  presença  de  diversos  métodos  aceitáveis 
também  permite  ao  pesquisador  combinar  as  estimativas 
em  uma  única  composição,  na  esperança  de  minimizar 
qualquer  efeito  decorrente  de  um  dos  métodos. 
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TABELA  2-8  Comparação  das  estimativas  da  média  e  do  desvio  padrão  nos  quatro  métodos  de 
atribuição 


Método  de  atribuição 

Médias  estimadas 

V, 

Vs 

''e 

V, 

<^8 

1^9 

Substituição  pela  média 

1,90 

8,13 

5,15 

2,84 

2,60 

6,79 

45,97 

4,80 

Disponibilidade  total 

1,90 

8,13 

5,15 

2,84 

2,60 

6,79 

45,97 

4,80 

Regressão 

1,99 

8,11 

5,14 

2,83 

2,58 

6,84 

45,81 

4,77 

EM 

2,00 

8,34 

5,17 

2,88 

2,54 

6,72 

47,72 

4,85 

Desvios  padrão  estimados 

Método  de  atribuição 

V, 

Vs 

''e 

V, 

<^8 

<^9 

Substituição  pela  média 

0,79 

1,16 

1,15 

0,72 

0,71 

1,62 

9,12 

0,79 

Disponibilidade  total 

0,86 

1,32 

1,19 

0,75 

0,72 

1,67 

9,42 

0,82 

Regressão 

0,87 

1,26 

1,16 

0,75 

0,73 

1,67 

9,28 

0,81 

EM 

0,84 

1,21 

1,11 

0,69 

0,72 

1,69 

9,67 

0,88 

TABELA  2-9  Comparação  de  correlações  obtidas  com  os  métodos  de  atribuição  de  caso 
completo  (LISTWISE),  disponibilidade  total  (PAIRWISE),  substituição  pela  média  e  EM 

V, 

''4 

<^5 

>^8 

Vr 

14 

V, 

1,00 

1,00 

1,00 

1,00 

Vs 

-0,29 

1,00 

-0,36 

1,00 

-0,29 

1,00 

-0,32 

1,00 

K 

0,28 

-0,07 

1,00 

0,30 

-0,07 

1,00 

0,24 

-0,06 

1,00 

0,30 

-0,09 

1,00 

V, 

0,29 

0,25 

0,26 

1,00 

0,44 

0,05 

0,43 

1,00 

0,38 

0,04 

0,42 

1,00 

0,48 

0,07 

0,41 

1,00 

K 

0,35 

-0,09 

0,82 

0,31 

1,00 

0,26 

-0,06 

0,81 

0,34 

1,00 

0,22 

-0,03 

0,77 

0,32 

1,00 

0,30 

-0,07 

0,80 

0,38 

1,00 

V, 

0,34 

-0,41 

0,42 

-0,03 

0,54 

1,00 

0,35 

-0,36 

0,40 

0,07 

0,40 

1,00 

0,31 

-0,29 

0,37 

0,06 

0,40 

1,00 

0,35 

-0,30 

0,40 

0,03 

0,41 

1,00 

K 

0,01 

0,72 

0,20 

0,71 

0,26 

-0,27 

1,00 

0,15 

0,60 

0,22 

0,71 

0,27 

-0,20 

1,00 

0,13 

0,50 

0,21 

0,66 

0,26 

-0,20 

1,00 

0,17 

0,54 

0,20 

0,68 

0,27 

-0,19 

1,00 

V, 

-0,27 

0,77 

0,21 

0,46 

0,09 

-0,43 

0,71 

1,00 

-0,18 

0,70 

0,38 

0,53 

0,23 

-0,26 

0,67 

1,00 

-0,17 

0,63 

0,34 

0,48 

0,23 

-0,25 

0,65 

1,00 

-0,08 

0,61 

0,36 

0,55 

0,24 

-0,24 

0,67 

1,00 

Interpretação:  O  valor  no  topo  é  a  correlação  obtida  com  o  método  de  caso  completo,  o  segundo  valor  é  conse¬ 
guido  com  a  abordagem  de  disponibilidade  total,  o  terceiro  valor  é  derivado  da  substituição  pela  média,  e  a  quarta 
correlação  resulta  do  método  EM. 
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Concluindo,  as  ferramentas  analíticas  e  os  processos 
diagnósticos  apresentados  na  seção  anterior  fornecem 
uma  base  adequada  para  a  compreensão  e  acomodação 
dos  dados  perdidos  encontrados  nos  dados  pré -examina¬ 
dos.  Como  este  exemplo  demonstra,  o  pesquisador  não 
precisa  temer  que  os  dados  perdidos  sempre  impedirão 
uma  análise  multivariada  ou  que  sempre  limitarão  a  ge¬ 
neralidade  dos  resultados.  O  possível  impacto  “oculto” 
de  dados  perdidos  pode  ser  identificado,  e  ações  podem 
ser  tomadas  para  minimizar  o  efeito  de  dados  perdidos  na 
análise  executada. 

Resumo 

Os  procedimentos  disponíveis  para  lidar  com  dados  per¬ 
didos  variam  em  forma,  complexidade  e  propósito.  O 
pesquisador  sempre  deve  estar  preparado  para  avaliar  e 
lidar  com  dados  perdidos,  já  que  estes  freqüentemente 
são  encontrados  em  análise  multivariada.  A  decisão  de 
usar  apenas  observações  com  dados  completos  pode  pa¬ 
recer  conservadora  e  “segura”,  mas,  como  foi  ilustrado  na 
discussão  anterior,  há  limitações  inerentes  e  vieses  nesses 
tratamentos.  Nenhum  método  único  é  adequado  para  to¬ 
das  as  situações;  o  pesquisador  deve  fazer  um  julgamento 
racional  da  situação,  considerando  todos  os  fatores  des¬ 
critos  nesta  seção.  O  processo  de  quatro  passos  fornece 
ao  pesquisador,  esperamos,  uma  metodologia  estruturada 
para  identificação  e  correção  de  padrões  de  perda  de  da¬ 
dos  da  forma  mais  adequada. 


OBSERVAÇÕES  ATÍPICAS 

Observações  atípicas  são  observações  com  uma  combi¬ 
nação  única  de  características  identificáveis  como  sendo 
notavelmente  diferentes  das  outras  observações.  O  que 
constitui  uma  característica  única?  Tipicamente  consi- 
dera-se  como  um  valor  incomum  em  uma  variável  por 
ser  alto  ou  baixo,  ou  uma  combinação  ímpar  de  valores 
ao  longo  de  diversas  variáveis  que  tornam  a  observação 
marginal  em  relação  às  outras.  Ao  se  avaliar  o  impacto 
de  observações  atípicas,  devemos  considerar  aspectos 
práticos  e  substantivos: 

•  De  um  ponto  de  vista  prático,  observações  atípicas  podem 
ter  um  efeito  sensível  sobre  qualquer  tipo  de  análise  empíri¬ 
ca.  Por  exemplo,  considere  uma  amostra  de  20  indivíduos  na 
qual  queremos  determinar  a  renda  média  familiar.  Em  nossa 
amostra  reunimos  respostas  que  variam  entre  R$20.000,00  e 
R$100.000,00  ao  ano,  de  modo  que  a  média  é  de  R$45.000,00 
por  ano.  Mas  considere  que  a  21^  pessoa  tem  uma  renda  de 
R$1  milhão  ao  ano.  Se  incluirmos  esse  valor  na  análise,  a 
renda  média  aumenta  para  mais  de  R$90.000,00.  Natural¬ 
mente  que  a  observação  atípica  é  um  caso  válido,  mas  qual 
é  a  melhor  estimativa  de  renda  familiar  média:  R$45.000,00 
ou  R$90.000,00?  O  pesquisador  deve  avaliar  se  o  valor  mar¬ 
ginal  deve  ser  mantido  ou  eliminado,  devido  à  sua  influência 
indevida  sobre  os  resultados. 


•  Em  termos  substantivos,  a  observação  atípica  deve  ser  vista 
sob  a  óptica  do  quão  representativa  ela  é  na  população.  No¬ 
vamente,  usando  nosso  exemplo  de  renda  familiar,  qual  é  a 
representatividade  do  milionário  no  segmento  mais  abasta¬ 
do?  Se  o  pesquisador  percebe  que  é  um  segmento  peque¬ 
no  mas  viável  na  população,  então  talvez  o  valor  deva  ser 
mantido.  Se,  porém,  esse  milionário  é  o  único  na  população 
inteira  e  verdadeiramente  representa  um  valor  extremo  aci¬ 
ma  de  todos  (i.e.,  é  um  caso  ímpar),  então  o  mesmo  deve  ser 
eliminado. 

Observações  atípicas  não  podem  ser  categoricamen¬ 
te  caracterizadas  como  benéficas  ou  problemáticas,  mas 
devem  ser  vistas  no  contexto  da  análise  e  avaliadas  pelos 
tipos  de  informação  que  possam  fornecer.  Caso  sejam  be¬ 
néficas,  as  observações  atípicas  -  apesar  de  diferentes  da 
maioria  da  amostra  -  podem  ser  indicativas  de  caracterís¬ 
ticas  da  população  que  não  seriam  descobertas  no  curso 
normal  da  análise.  Em  contraste,  as  problemáticas  não 
são  representativas  da  população,  são  contrárias  aos  ob¬ 
jetivos  da  análise  e  podem  distorcer  seriamente  os  testes 
estatísticos.  Devido  à  variabilidade  no  impacto  de  obser¬ 
vações  atípicas,  é  imperativo  que  o  pesquisador  examine 
os  dados,  buscando  observações  atípicas  para  averiguar 
seu  tipo  de  influência.  O  leitor  também  deve  consultar  as 
discussões  do  Capítulo  4,  que  se  refere  ao  tópico  de  obser¬ 
vações  influentes.  Nessas  discussões,  as  observações  atípi¬ 
cas  são  colocadas  em  uma  estrutura  particularmente  ade¬ 
quada  para  avaliar  a  influência  de  observações  individuais 
e  para  determinar  se  essa  influência  é  útil  ou  prejudicial. 

Por  que  ocorrem  observações  atípicas?  Elas  podem 
ser  divididas  em  quatro  classes  baseadas  na  fonte  de  suas 
peculiaridades. 

•  A  primeira  classe  surge  de  um  erro  de  procedimento,  como 
erro  na  entrada  de  dados  ou  uma  falha  na  codificação.  Essas 
observações  atípicas  devem  ser  identificadas  no  estágio  de 
limpeza  de  dados,  mas  se  permanecerem  algumas,  elas  de¬ 
vem  ser  eliminadas  ou  registradas  como  valores  perdidos. 

•  A  segunda  classe  de  observação  atípica  é  aquela  que  ocorre 
como  o  resultado  de  um  evento  extraordinário,  o  que  então 
explica  a  peculiaridade  da  observação.  Por  exemplo,  consi¬ 
dere  que  estamos  acompanhando  a  média  de  chuvas  diárias, 
quando  temos  um  furacão  que  dura  por  vários  dias  e  regis¬ 
tra  níveis  de  queda  de  água  extremamente  elevados.  Esses 
níveis  de  chuva  não  são  comparáveis  com  qualquer  outro 
período  com  padrões  meteorológicos  normais.  Se  forem  in¬ 
cluídos,  eles  mudarão  drasticamente  o  padrão  dos  resulta¬ 
dos.  O  pesquisador  deve  decidir  se  o  evento  extraordinário 
se  ajusta  aos  propósitos  da  pesquisa.  Se  for  o  caso,  a  obser¬ 
vação  atípica  deve  ser  mantida  na  análise.  Caso  contrário, 
deve  ser  eliminada. 

•  A  terceira  classe  refere-se  a  observações  extraordinárias 
para  as  quais  o  pesquisador  não  tem  explicação.  Em  tais  ca¬ 
sos,  um  padrão  único  e  muito  diferente  emerge.  Apesar  de 
essas  observações  atípicas  serem  as  que  têm  mais  probabi¬ 
lidade  de  serem  eliminadas,  poderão  ser  mantidas  se  o  pes¬ 
quisador  sentir  que  elas  representam  um  segmento  válido 
da  população.  Talvez  elas  representem  um  elemento  emer- 
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gente,  ou  um  elemento  novo  previamente  não-identificado. 
Aqui  o  pesquisador  deve  usar  seu  discernimento  no  proces¬ 
so  de  decisão  sobre  eliminação  ou  manutenção. 

•  A  quarta  e  última  classe  de  observações  atípicas  contém  ob¬ 
servações  que  estão  no  intervalo  usual  de  valores  para  cada 
variável.  Essas  observações  não  são  particularmente  altas  ou 
baixas  nas  variáveis,  mas  são  únicas  em  sua  combinação  de 
valores  entre  as  variáveis.  Em  tais  situações,  o  pesquisador 
deve  reter  a  observação,  a  não  ser  que  exista  uma  evidência 
específica  que  desconsidere  a  observação  atípica  como  um 
membro  válido  da  população. 

Detecção  e  procedimento 
com  observações  atípicas 

As  seções  a  seguir  detalham  os  métodos  usados  para  de¬ 
tectar  observações  atípicas  em  situações  univariadas,  biva- 
riadas  e  multivariadas.  Uma  vez  identificadas,  elas  podem 
ser  caracterizadas  para  ajudar  a  colocá-las  em  uma  entre 
as  quatro  classes  descritas.  Finalmente,  o  pesquisador 
deve  decidir  sobre  a  retenção  ou  exclusão  de  cada  obser¬ 
vação  atípica,  julgando  não  apenas  a  partir  das  suas  carac¬ 
terísticas,  mas  também  a  partir  dos  objetivos  da  análise. 

Métodos  para  detecção  de  observações  atípicas 

As  observações  atípicas  podem  ser  identificadas  sob  uma 
perspectiva  univariada,  bivariada  ou  multivariada  com 
base  no  número  de  variáveis  (características)  considera¬ 
das.  O  pesquisador  deve  utilizar  tantas  perspectivas  quan¬ 
to  possível,  procurando  por  um  padrão  consistente  nos 
métodos  para  identificar  observações  atípicas.  A  discus¬ 
são  que  se  segue  detalha  os  processos  envolvidos  em  cada 
uma  das  três  perspectivas. 

Detecção  univariada.  A  identificação  univariada  de  ob¬ 
servações  atípicas  examina  a  distribuição  de  observações 
para  cada  variável  na  análise  e  seleciona  como  atípicos 
aqueles  casos  que  estão  nos  extremos  (altos  e  baixos)  dos 
intervalos  da  distribuição.  A  questão  principal  é  estabele¬ 
cer  a  base  para  designação  de  uma  observação  atípica.  A 
abordagem  usual  primeiro  converte  os  valores  dos  dados 
em  escores  padrão,  que  têm  uma  média  de  0  e  um  desvio 
padrão  de  1.  Como  os  valores  são  expressos  em  um  formato 
padronizado,  é  fácil  fazer  comparações  entre  as  variáveis. 

Em  qualquer  caso,  o  pesquisador  deve  reconhecer 
que  um  certo  número  de  observações  pode  ocorrer  nor¬ 
malmente  nesses  externos  da  distribuição.  O  pesquisador 
deve  tentar  identificar  apenas  as  observações  verdadeira¬ 
mente  diferentes  e  designá-las  como  atípicas. 

Detecção  bivariada.  Além  da  avaliação  univariada,  pa¬ 
res  de  variáveis  podem  ser  avaliados  conjuntamente  por 
meio  de  um  diagrama  de  dispersão.  Casos  que  notoria¬ 
mente  estão  fora  do  intervalo  das  outras  observações 
serão  percebidos  como  pontos  isolados  no  diagrama  de 
dispersão.  Para  auxiliar  na  determinação  do  intervalo  es¬ 
perado  de  observações  neste  retrato  bidimensional,  uma 


elipse  representando  um  intervalo  especificado  de  con¬ 
fiança  (tipicamente  marcado  em  um  nível  de  90  ou  95%) 
para  uma  distribuição  normal  bivariada  é  sobreposta  ao 
diagrama  de  dispersão.  Isso  fornece  uma  descrição  grá¬ 
fica  dos  limites  de  confiança  e  facilita  a  identificação  das 
observações  atípicas.  Uma  variante  do  diagrama  de  dis¬ 
persão  chama-se  gráfico  de  influência,  com  cada  ponto 
variando  de  tamanho  em  relação  a  sua  influência  sobre 
a  relação. 

Cada  um  desses  métodos  fornece  uma  avaliação  da 
unicidade  de  cada  observação  em  relação  à  outra  obser¬ 
vação  com  base  em  um  par  específico  de  variáveis.  Uma 
desvantagem  do  método  bivariado  em  geral  é  o  número 
potencialmente  grande  de  diagramas  de  dispersão  que 
aparecem  quando  o  número  de  variáveis  aumenta.  Para 
três  variáveis,  são  apenas  três  gráficos  para  todas  as  com¬ 
parações  dois  a  dois.  Mas  para  cinco  variáveis,  exigem- 
se  10  gráficos;  e  para  10  variáveis,  são  45  diagramas  de 
dispersão.  Como  resultado,  o  pesquisador  deve  limitar  o 
uso  geral  de  métodos  bivariados  para  relações  específicas 
entre  variáveis,  tais  como  a  relação  de  variáveis  depen¬ 
dentes  versus  independentes  em  regressão.  O  pesquisador 
pode  então  examinar  o  conjunto  de  gráficos  de  dispersão 
e  identificar  qualquer  padrão  de  uma  ou  mais  observações 
que  resultaria  em  sua  designação  como  atípica. 

Detecção  multivariada.  Pelo  fato  de  a  maioria  das  análi¬ 
ses  multivariadas  envolver  mais  do  que  duas  variáveis,  os 
métodos  bivariados  rapidamente  se  tornam  inadequados 
por  diversas  razões.  Primeiro,  eles  requerem  um  grande 
número  de  gráficos,  como  discutido  anteriormente,  quando 
o  número  de  variáveis  atinge  até  mesmo  um  tamanho  mo¬ 
derado.  Segundo,  eles  são  limitados  a  duas  dimensões  (va¬ 
riáveis)  por  vez.  No  entanto,  quando  mais  de  duas  variáveis 
são  consideradas,  o  pesquisador  precisa  de  uma  maneira  de 
objetivamente  medir  a  posição  multidimensional  de  cada 
observação  relativamente  a  algum  ponto  comum.  Este  pro¬ 
blema  é  abordado  pela  medida  de  Mahalanobis,  uma 
avaliação  multivariada  de  cada  observação  ao  longo  de  um 
conjunto  de  variáveis.  Este  método  mede  a  distância  de 
cada  observação  em  um  espaço  multidimensional  a  partir 
do  centro  médio  de  todas  as  observações,  fornecendo  um 
único  valor  para  cada  observação,  independentemente  do 
número  de  variáveis  em  questão.  Valores  mais  elevados  de 

representam  observações  muito  afastadas  da  distribui¬ 
ção  geral  de  observações  neste  espaço  multidimensional. 
Tal  técnica,  porém,  tem  também  a  desvantagem  de  forne¬ 
cer  somente  uma  avaliação  geral,  de  modo  que  ela  não  ofe¬ 
rece  qualquer  visão  pormenorizada  sobre  quais  variáveis 
poderiam  conduzir  a  um  elevado  valor  de  D^. 

Para  fins  de  interpretação,  a  medida  de  Mahalano¬ 
bis  tem  propriedades  estatísticas  que  viabilizam  teste  de 
significância.  A  medida  dividida  pelo  número  de  va¬ 
riáveis  envolvidas  (D^ldf)  é  aproximadamente  distribuída 
como  um  valor  t.  Dada  a  natureza  dos  testes  estatísticos, 
sugere-se  o  uso  de  níveis  conservadores  de  significância  (p. 
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ex.,  0,005  OU  0,001)  como  valores  de  referência  para  desig¬ 
nação  como  valor  atípico.  Assim,  observações  que  têm  um 
valor  excedendo  2,5  em  pequenas  amostras  e  3  ou  4 
em  grandes  amostras  podem  ser  designadas  como  possí¬ 
veis  observações  atípicas.  Uma  vez  identificada  como  um 
potencial  caso  atípico  com  a  medida  D^,  uma  observação 
pode  ser  reexaminada  em  termos  dos  métodos  univaria- 
dos  e  bivariados  discutidos  anteriormente,  para  uma  com¬ 
preensão  mais  completa  da  natureza  de  sua  peculiaridade. 

Designação  de  observação  atípica 

Com  esses  métodos  diagnósticos  univariados,  bivariados 
e  multivariados,  o  pesquisador  tem  um  conjunto  comple¬ 
mentar  de  perspectivas  com  o  qual  examinar  observações 
quanto  ao  seu  status  como  atípicas.  Cada  um  desses  méto¬ 
dos  pode  fornecer  uma  perspectiva  única  sobre  as  obser¬ 
vações  e  pode  ser  utilizado  de  uma  maneira  combinada 
para  identificar  casos  atípicos  (ver  Regras  Práticas  2-4). 

-  REGRAS  PRÁTICAS  2-4  - 

Detecção  de  observações  atípicas 

•  Métodos  univariados:  Examine  todas  as  variáveis  para 
identificar  observações  únicas  ou  extremas. 

•  Para  pequenas  amostras  (80  observações  ou  menos), 
observações  atípicas  geralmente  são  definidas  como 
casos  com  escores  padrão  de  2,5  ou  mais. 

•  Para  amostras  maiores,  aumente  o  valor  de 
referência  de  escores  padrão  para  até  4. 

•  Se  escores  padrão  não  são  usados,  identifique  casos 
que  recaiam  fora  dos  intervalos  de  desvio  padrão  de 
2,5  versus  4,  dependendo  do  tamanho  da  amostra. 

•  Métodos  bivariados:  Concentre  seu  uso  em  relações 
específicas  de  variáveis,  como  o  caso  independente 
versus  dependente. 

•  Use  diagramas  de  dispersão  com  intervalos  de 
confiança  em  um  nível  alfa  especificado. 

•  Métodos  multivariados:  Mais  adequados  para  examinar 
uma  variável  estatística  completa,  como  as  variáveis 
independentes  na  regressão  ou  as  variáveis  na  análise 
fatorial. 

•  Níveis  de  referência  para  as  medidas  D^/d/ devem 
ser  conservadores  (0,005  ou  0,001),  resultando  em 
valores  de  2,5  (amostras  pequenas)  versus  3  ou  4  em 
amostras  maiores. 


Quando  observações  são  identificadas  pelos  métodos 
univariados,  bivariados  e  multivariados  como  possíveis 
casos  atípicos,  o  pesquisador  deve  então  escolher  apenas 
observações  que  demonstrem  real  notoriedade  em  com¬ 
paração  com  o  restante  da  população  ao  longo  de  tantas 
perspectivas  quanto  seja  possível.  O  pesquisador  deve 
evitar  a  designação  de  muitas  observações  como  atípicas 
e  não  pode  sucumbir  à  tentação  de  eliminar  aqueles  casos 
inconsistentes  com  os  demais  casos  simplesmente  por  se¬ 
rem  diferentes. 


Descrição  e  peifil  de  observações  atípicas 

Uma  vez  que  observações  atípicas  potenciais  tenham  sido 
identificadas,  o  pesquisador  deve  gerar  perfis  sobre  cada 
uma  delas  e  identificar  a(s)  variável(eis)  responsável(eis) 
por  sua  condição  de  atipicidade.  Além  desse  exame  visual, 
o  pesquisador  também  pode  empregar  técnicas  multiva- 
riadas,  como  análise  discriminante  (Capítulo  5)  ou  regres¬ 
são  múltipla  (Capítulo  4),  para  identificar  as  diferenças 
entre  as  observações  atípicas  e  as  demais.  Se  possível,  ele 
deve  designar  a  observação  atípica  a  uma  entre  as  quatro 
classes  descritas  anteriormente  para  ajudar  na  decisão  de 
retenção  ou  eliminação  a  ser  feita  a  seguir.  O  pesquisador 
deve  continuar  essa  análise  até  estar  satisfeito  com  a  com¬ 
preensão  dos  aspectos  do  caso  que  diferenciam  a  observa¬ 
ção  atípica  das  demais. 

Retenção  ou  eliminação  da  observação  atípica 

Depois  que  as  observações  atípicas  foram  identificadas, 
descritas  e  classificadas,  o  pesquisador  deve  decidir  sobre 
a  retenção  ou  eliminação  de  cada  uma.  Entre  os  pesqui¬ 
sadores  há  muitas  filosofias  sobre  como  lidar  com  as  ob¬ 
servações  atípicas.  Nossa  visão  é  de  que  elas  devem  ser 
mantidas,  a  menos  que  exista  prova  demonstrável  de  que 
estão  verdadeiramente  fora  do  normal  e  que  não  são  re¬ 
presentativas  de  quaisquer  observações  na  população.  No 
entanto,  se  elas  representam  um  elemento  ou  segmento  da 
população,  devem  ser  mantidas  para  garantir  generalida¬ 
de  à  população  como  um  todo.  Se  as  observações  atípicas 
são  eliminadas,  o  pesquisador  corre  o  risco  de  melhorar 
a  análise  multivariada,  mas  limitar  sua  generalidade.  Se 
as  observações  atípicas  são  problemáticas  em  uma  técnica 
particular,  muitas  vezes  podem  ser  acomodadas  na  análise 
de  uma  maneira  que  não  a  distorçam  seriamente. 

Um  exemplo  ilustrativo  de  análise 
de  observações  atípicas 

Como  exemplo  de  detecção  de  observação  atípica,  as  ob¬ 
servações  da  base  de  dados  HBAT  introduzida  no  Capí¬ 
tulo  1  são  examinadas  aqui  no  que  se  refere  a  observações 
atípicas.  As  variáveis  consideradas  na  análise  são  as  va¬ 
riáveis  métricas  a  com  o  contexto  de  nosso  exa¬ 
me  sendo  uma  análise  de  regressão,  onde  X^g  é  a  variável 
dependente  e  Ag  a  A^g  são  as  variáveis  independentes.  A 
análise  de  observação  atípica  inclui  diagnósticos  univaria- 
do,  bivariado  e  multivariado.  Se  candidatos  a  observações 
atípicas  são  encontrados,  eles  são  examinados  e  uma  deci¬ 
são  sobre  retenção  ou  eliminação  é  tomada. 

Detecção  de  observação  atípica 

O  primeiro  passo  é  examinar  todas  as  variáveis  sob  uma 
perspectiva  univariada.  Métodos  bivariados  serão  então 
empregados  para  examinar  as  relações  entre  a  variável 
dependente  (A^,)  e  cada  uma  das  independentes.  A  partir 
de  cada  um  desses  diagramas  de  dispersão,  observações 
que  ficam  fora  da  distribuição  típica  podem  ser  identifi- 
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cadas,  e  então  seu  impacto  sobre  aquela  relação  pode  ser 
avaliado.  Finalmente,  uma  avaliação  multivariada  será  fei¬ 
ta  sobre  todas  as  variáveis  independentes  coletivamente. 
Comparações  de  observações  pelos  três  métodos  devem, 
espera-se,  fornecer  a  base  para  a  decisão  sobre  elimina¬ 
ção/retenção. 


Detecção  unívariada.  O  primeiro  passo  é  examinar  as 
observações  em  cada  variável  individualmente.  A  Tabe¬ 
la  2-10  contém  as  observações  com  valores  padronizados 
que  excedem  ±2,5  em  cada  uma  das  variáveis  (dQ  a  X^g). 
Dessa  perspectiva  univariada,  somente  as  observações 
7,  22  e  90  excedem  o  valor  referência  em  mais  de  uma 
variável.  Além  disso,  nenhuma  dessas  observações  tem 
valores  tão  extremos  a  ponto  de  afetar  qualquer  uma  das 
medidas  gerais  das  variáveis,  como  a  média  ou  o  desvio 
padrão.  Devemos  observar  que  a  variável  dependente 
tinha  uma  observação  atípica  (22),  a  qual  pode  afetar  os 
diagramas  de  dispersão  bivariados,  pois  a  variável  de¬ 
pendente  aparece  em  cada  diagrama.  As  três  observa¬ 
ções  serão  notadas  para  ver  se  elas  aparecem  nas  avalia¬ 
ções  bivariadas  e  multivariadas  subseqüentes. 

Detecção  bivariada.  Para  uma  perspectiva  bivariada, 
13  diagramas  de  dispersão  são  formados  para  cada  uma 
das  variáveis  independentes  {X^  a  Ajg)  com  a  variável 
dependente  (Aj,).  Uma  elipse  representando  o  intervalo 
de  confiança  de  95%  de  uma  distribuição  normal  biva¬ 
riada  é  então  sobreposta  ao  diagrama  de  dispersão.  A 
Figura  2-7  contém  exemplos  de  tais  diagramas  de  disper¬ 
são  envolvendo  X^  e  X,.  Como  podemos  ver  no  diagra¬ 
ma  de  dispersão  para  X^  com  Xjg,  as  duas  observações 
atípicas  ficam  logo  fora  da  elipse  e  não  têm  os  valores 
em  qualquer  variável.  Este  resultado  está  em  contraste 
com  o  diagrama  de  dispersão  de  X,  com  Xj,,  onde  a  ob¬ 
servação  22  é  sensivelmente  diferente  das  demais  e  exi¬ 
be  os  mais  altos  valores  sobre  X,  e  Xjg  A  segunda  parte 
da  Tabela  2-10  contém  uma  compilação  das  observações 
que  estão  fora  dessa  elipse  para  cada  variável.  Uma  vez 
que  é  um  intervalo  de  confiança  de  95%,  esperam-se  al¬ 
gumas  observações  normalmente  fora  da  elipse.  Apenas 
quatro  observações  (2,  22,  24  e  90)  estão  fora  da  elipse 
mais  de  duas  vezes.  A  observação  22  está  fora  em  12  dos 
13  diagramas  de  dispersão,  principalmente  por  ser  uma 
observação  atípica  sobre  a  variável  dependente.  Das  três 
observações  restantes,  apenas  a  90  foi  notada  na  detec¬ 
ção  univariada. 

Detecção  multivariada.  O  método  de  diagnóstico  final  é 
avaliar  observações  atípicas  multivariadas  com  a  medida 
de  Mahalanobis  (ver  Tabela  2-10).  Essa  análise  avalia 
a  posição  de  cada  observação  comparativamente  com  o 
centro  de  todas  as  observações  sobre  um  conjunto  de  va¬ 
riáveis.  Neste  caso,  todas  as  variáveis  independentes  mé¬ 
tricas  foram  empregadas.  O  cálculo  do  valor  D^ldf  {df  = 


13)  permite  a  identificação  de  observações  atípicas  através 
de  um  teste  aproximado  de  significância  estatística.  Como 
a  amostra  tem  apenas  100  observações,  um  valor  de  refe¬ 
rência  de  2,5  será  usado  no  lugar  do  valor  de  3,5  ou  4,0 
utilizado  em  grandes  amostras.  Com  essa  base,  duas  obser¬ 
vações  (98  e  36)  são  identificadas  como  significativamente 
diferentes.  E  interessante  que  essas  observações  não  foram 
percebidas  em  análises  univariadas  e  bivariadas  anteriores, 
mas  aparecem  apenas  nos  testes  multivariados.  Este  resul¬ 
tado  indica  que  elas  não  são  únicas  em  uma  variável  isola¬ 
da,  mas  são  únicas  em  combinação  de  variáveis. 


Retenção  ou  eliminação  das  observações  atípicas 

Como  resultado  desses  testes  diagnósticos,  nenhuma  ob¬ 
servação  demonstra  as  características  de  observações  atípi¬ 
cas  que  deviam  ser  eliminadas.  Cada  variável  tem  algumas 
observações  que  são  extremas  e  devem  ser  consideradas 
se  aquela  variável  é  usada  em  uma  análise.  Nenhuma  ob¬ 
servação  é  extrema  em  um  número  suficiente  de  variáveis 
para  ser  considerada  não-representativa  da  população.  Em 
todos  os  casos,  as  observações  designadas  como  atípicas, 
mesmo  com  os  testes  multivariados,  parecem  semelhantes 
o  suficiente  com  as  demais  observações  para  serem  retidas 
na  análise  multivariada.  No  entanto,  o  pesquisador  sempre 
deve  examinar  os  resultados  de  cada  técnica  multivariada 
específica  para  identificar  observações  que  possam  vir  a  ser 
atípicas  naquela  aplicação  em  particular.  No  caso  da  análi¬ 
se  de  regressão,  o  Capítulo  4  fornecerá  métodos  adicionais 
para  avaliar  a  influência  relativa  de  cada  observação  e  ga¬ 
rantir  uma  visão  aprimorada  sobre  a  possível  eliminação 
de  uma  observação  como  atípica. 


TESTE  DAS  SUPOSIÇÕES  DA 
ANÁLISE  MULTIVARIADA 

O  último  passo  no  exame  de  dados  envolve  o  teste  das  su¬ 
posições  inerentes  às  bases  estatísticas  da  análise  multiva¬ 
riada.  Os  primeiros  passos  da  análise  de  perda  de  dados  e 
de  detecção  de  observações  atípicas  tentaram  limpar  os  da¬ 
dos  para  um  formato  mais  adequado  para  análise  multiva¬ 
riada.  Testar  os  dados  quanto  à  concordância  com  as  supo¬ 
sições  estatísticas  inerentes  às  técnicas  multivariadas  agora 
lida  com  a  fundamentação  sobre  a  qual  as  técnicas  fazem 
inferências  estatísticas  e  obtêm  resultados.  Algumas  técni¬ 
cas  são  menos  afetadas  pela  violação  de  certas  suposições,  o 
que  se  chama  de  robustez,  mas,  em  todos  os  casos,  atender 
algumas  das  suposições  será  crítico  para  uma  análise  bem- 
sucedida.  Logo,  é  necessário  entender  o  papel  desempenha¬ 
do  pelas  suposições  para  cada  técnica  multivariada. 

A  necessidade  de  testar  as  suposições  estatísticas  au¬ 
menta  em  aplicações  multivariadas  por  duas  características 
da  análise  multivariada.  Primeiro,  a  complexidade  das  re- 
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TABELA  2-10  Resultados  de  detecção  de  observação  atípica  univariada,  bivariada  e  multivariada 


ATÍPICAS  UNIVARIADAS 

ATÍPICAS  BIVARIADAS 

ATÍPICAS  MULTIVARIADAS 

Casos  com  valores 

Casos  fora  da  elipse 

Casos  com  um  valor 

padronizados 

do  intervalo  de 

de  íf/df  maior  do 

excedendo  ±2,5 

confiança  de  95% 

que2,5(df=  13f 

com: 

Caso  ff  Ifidf 

Sem  casos 

44,  90 

98  40,0  3,08 

13,  22,  90 

^7 

13,  22,  24,  53,  90 

36  36,9  2,84 

8,7 

^3 

22,  87 

Sem  casos 

2,  22,  45,  52 

Sem  casos 

22,  24,  85 

7 

2,  7,  22,  45 

90 

X„ 

22,  44,  90 

^,3 

Sem  casos 

>^,3 

22,  57 

77 

22,  77,  84 

6,53 

6,  22,  53 

^,3 

24 

>^,3 

22,  24,  48,  62,  92 

^,7 

Sem  casos 

>^,7 

22 

>^,3 

7,  84 

>^,3 

2,  7,  22,  84 

22 


“Valor  de  Mahalanobis  baseado  nas  13  percepções  HBAT  (Xj  a  X,j). 


■^19 

FIGURA  2-7  Diagramas  de  dispersão  selecionados  para  detecção  bivariada  de 
observações  atípicas:  Xg  (Qualidade  do  produto)  e  (Atividades  de  comércio 
eletrônico)  com  X,9  (Satisfação  do  cliente). 
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lações,  devido  ao  uso  costumeiro  de  um  grande  número  de 
variáveis,  torna  as  distorções  potenciais  e  vieses  mais  signi¬ 
ficativos  quando  as  suposições  são  violadas,  particularmen¬ 
te  quando  as  violações  se  compõem  para  se  tornarem  mais 
prejudiciais  do  que  se  consideradas  separadamente.  Se¬ 
gundo,  a  complexidade  das  análises  e  dos  resultados  pode 
mascarar  os  “sinais”  de  violações  de  suposições,  aparentes 
nas  análises  univariadas  mais  simples.  Em  quase  todos  os 
casos,  os  procedimentos  multivariados  estimam  o  modelo 
multivariado  e  produzem  resultados  mesmo  quando  as  su¬ 
posições  são  severamente  violadas.  Assim,  o  pesquisador 
deve  estar  ciente  de  qualquer  violação  de  suposições  e  das 
implicações  que  elas  possam  ter  no  processo  de  estimação 
ou  na  interpretação  dos  resultados. 

Avaliação  de  variáveis  individuais 
versus  a  variável  estatística 

A  análise  multivariada  requer  que  as  suposições  subjacen¬ 
tes  às  técnicas  estatísticas  sejam  testadas  duas  vezes:  pri¬ 
meiro,  para  as  variáveis  separadas,  de  modo  semelhante 
aos  testes  para  uma  análise  univariada  e,  segundo,  para  a 
variável  estatística  do  modelo  multivariado,  a  qual  atua 
coletivamente  para  as  variáveis  na  análise,  e,  assim,  deve 
atender  às  mesmas  suposições  das  variáveis  individuais. 
Este  capítulo  se  concentra  no  exame  de  variáveis  indivi¬ 
duais  para  atendimento  das  suposições  subjacentes  aos 
procedimentos  multivariados.  Discussões  em  cada  capítulo 
abordam  os  métodos  usados  para  avaliar  as  suposições  ine¬ 
rentes  à  variável  estatística  em  cada  técnica  multivariada. 

Quatro  suposições  estatísticas  importantes 

Técnicas  multivariadas  e  suas  contrapartes  univariadas 
são  todas  baseadas  em  um  conjunto  fundamental  de  su¬ 
posições  representando  as  exigências  da  teoria  estatística 
inerente.  Apesar  de  muitas  premissas  ou  exigências  sur¬ 
girem  em  uma  ou  mais  técnicas  multivariadas  que  discu¬ 
timos  no  texto,  quatro  delas  potencialmente  afetam  toda 
técnica  estatística  univariada  e  multivariada. 

Normalidade 

A  suposição  mais  fundamental  em  análise  multivariada  é 
a  normalidade,  a  qual  se  refere  à  forma  da  distribuição  de 
dados  para  uma  variável  métrica  individual  e  sua  corres¬ 
pondência  com  a  distribuição  normal,  o  padrão  de  refe¬ 
rência  para  métodos  estatísticos.  Se  a  variação  em  relação 
à  distribuição  normal  é  suficientemente  grande,  todos  os 
testes  estatísticos  resultantes  são  inválidos,  uma  vez  que  a 
normalidade  é  exigida  no  emprego  das  estatísticas  F  et.  Os 
métodos  estatísticos  univariado  e  multivariado  discutidos 
neste  texto  baseiam-se  na  suposição  de  normalidade  uni¬ 
variada,  com  os  métodos  multivariados  também  assumin¬ 
do  normalidade  multivariada. 

A  normalidade  univariada  para  uma  única  variável 
é  facilmente  testada,  e  várias  medidas  corretivas  são  vi¬ 


áveis,  como  será  demonstrado  posteriormente.  Em  um 
sentido  simples,  normalidade  multivariada  (a  combinação 
de  duas  ou  mais  variáveis)  significa  que  as  variáveis  indi¬ 
viduais  são  normais  em  um  sentido  univariado  e  que  suas 
combinações  também  são  normais.  Logo,  se  uma  variá¬ 
vel  é  normal  multivariada,  também  é  normal  univariada. 
No  entanto,  a  recíproca  não  é  necessariamente  verdadeira 
(duas  ou  mais  variáveis  normais  univariadas  não  são  ne¬ 
cessariamente  normais  multivariadas).  Assim,  uma  situa¬ 
ção  em  que  todas  as  variáveis  exibem  uma  normalidade 
univariada  ajuda  a  obter,  apesar  de  não  garantir,  a  nor¬ 
malidade  multivariada.  Normalidade  multivariada  é  mais 
difícil  de  testar  [13,23],  mas  há  testes  especializados  dis¬ 
poníveis  para  situações  nas  quais  a  técnica  multivariada 
é  particularmente  afetada  por  uma  violação  dessa  suposi¬ 
ção.  Na  maioria  dos  casos  avaliar  e  conseguir  normalidade 
univariada  para  todas  as  variáveis  é  suficiente,  e  aborda¬ 
remos  normalidade  multivariada  somente  quando  ela  for 
especialmente  crítica.  Mesmo  quando  grandes  amostras 
tendem  a  diminuir  os  efeitos  nocivos  da  não-normalidade, 
o  pesquisador  deve  sempre  avaliar  a  normalidade  em  to¬ 
das  as  variáveis  métricas  incluídas  na  análise. 

Avaliação  do  impacto  da  violação  da  suposição  de  norma¬ 
lidade.  A  severidade  da  não-normalidade  se  baseia  em 
duas  dimensões:  a  forma  da  distribuição  transgressora  e 
o  tamanho  da  amostra.  Como  veremos  na  discussão  que 
se  segue,  o  pesquisador  não  deve  apenas  julgar  a  extensão 
sobre  a  qual  a  distribuição  da  variável  é  não-normal,  mas 
também  os  tamanhos  de  amostra  envolvidos.  O  que  po¬ 
deria  ser  considerado  inaceitável  com  amostras  pequenas 
terá  um  efeito  pífio  em  amostras  maiores. 

Impactos  decorrentes  da  forma  de  distribuição. 

Como  podemos  descrever  a  distribuição  se  ela  difere  da 
normal?  A  forma  de  qualquer  distribuição  pode  ser  des¬ 
crita  por  duas  medidas:  curtose  e  assimetria.  Curtose  se 
refere  à  “elevação”  ou  “achatamento”  da  distribuição 
comparada  com  a  normal.  Distribuições  que  são  mais  al¬ 
tas  ou  mais  pontiagudas  do  que  o  normal  são  chamadas 
de  leptocúrticas,  enquanto  uma  distribuição  que  seja  mais 
achatada  é  denominada  de  platicúrtica.  Enquanto  a  curto¬ 
se  se  refere  à  altura  da  distribuição,  a  assimetria  é  empre¬ 
gada  para  descrever  o  equilíbrio  da  distribuição;  ou  seja, 
ela  é  desequilibrada  ou  deslocada  para  um  lado  (direita 
ou  esquerda),  ou  é  centrada  e  simétrica  com  aproxima¬ 
damente  o  mesmo  formato  em  ambos  os  lados?  Se  uma 
distribuição  é  desequilibrada,  ela  é  assimétrica.  Uma  as¬ 
simetria  positiva  denota  uma  distribuição  deslocada  para 
a  esquerda,  enquanto  uma  assimetria  negativa  reflete  um 
desvio  para  a  direita. 

Saber  como  descrever  a  distribuição  é  seguido  pela 
questão  de  como  determinar  a  extensão  ou  quantia  em 
relação  à  qual  ela  difere  nessas  características.  Tanto  as¬ 
simetria  quanto  curtose  têm  medidas  empíricas  que  estão 
disponíveis  em  todos  os  programas  estatísticos.  Na  maio- 
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ria  dos  programas  de  computador,  à  assimetria  e  à  curtose 
de  uma  distribuição  normal  são  dados  os  valores  zero.  Em 
seguida,  valores  acima  ou  abaixo  de  zero  denotam  desvios 
da  normalidade.  Por  exemplo,  valores  negativos  de  curto¬ 
se  indicam  uma  distribuição  platicúrtica  (mais  achatada), 
enquanto  valores  positivos  denotam  uma  distribuição  lep- 
tocúrtica  (pontiaguda).  Analogamente,  valores  positivos 
de  assimetria  indicam  a  distribuição  deslocada  à  esquer¬ 
da,  e  valores  negativos  correspondem  a  um  desvio  à  direi¬ 
ta.  Para  julgar  a  questão  “São  grandes  o  bastante  para  me 
preocupar?”  sobre  os  valores,  a  discussão  a  seguir  sobre 
testes  estatísticos  mostra  como  os  valores  de  curtose  e  as¬ 
simetria  podem  ser  transformados  para  refletirem  a  signi- 
flcância  estatística  das  diferenças  e  oferecerem  diretrizes 
quanto  à  sua  severidade. 

Impactos  causados  pelo  tamanho  da  amostra.  Ain¬ 
da  que  seja  importante  compreender  como  a  distribuição 
se  desvia  da  normalidade  em  termos  de  formato  e  se  esses 
valores  são  grandes  o  bastante  para  garantir  atenção,  o 
pesquisador  deve  também  considerar  os  efeitos  do  tama¬ 
nho  da  amostra.  Como  discutido  no  Capítulo  1,  o  tama¬ 
nho  da  amostra  tem  o  efeito  de  aumentar  poder  estatís¬ 
tico  por  redução  de  erro  de  amostragem.  Isso  resulta  em 
um  efeito  semelhante  aqui,  no  sentido  de  que  amostras 
maiores  reduzem  os  efeitos  nocivos  da  não-normalidade. 
Em  amostras  pequenas  de  50  ou  menos  observações,  e  es¬ 
pecialmente  se  o  tamanho  da  amostra  é  menor  do  que  30, 
desvios  signiflcantes  da  normalidade  podem  ter  um  im¬ 
pacto  substancial  sobre  os  resultados.  Para  amostras  com 
200  ou  mais  observações,  porém,  esses  mesmos  efeitos 
podem  ser  negligenciados.  Além  disso,  quando  compara¬ 
ções  de  grupos  são  feitas,  como  na  ANOVA,  os  diferentes 
tamanhos  de  amostras  entre  grupos,  se  forem  grandes  o 
suficiente,  podem  até  mesmo  cancelar  os  efeitos  nocivos. 
Assim,  na  maioria  dos  casos,  à  medida  que  tamanhos  de 
amostras  se  tornam  grandes,  o  pesquisador  pode  ficar 
menos  preocupado  com  variáveis  não-normais,  exceto  no 
caso  em  que  elas  possam  conduzir  a  outras  violações  de 
suposições  que  tenham  impacto  de  outras  maneiras  (p.ex., 
ver  a  discussão  a  seguir  sobre  homocedasticidade). 

Análises  gráficas  de  normalidade.  O  teste  diagnóstico 
de  normalidade  mais  simples  é  uma  verificação  visual  do 
histograma  que  compara  os  valores  de  dados  observados 
com  uma  distribuição  aproximadamente  normal  (ver  Fi¬ 
gura  2-1).  Apesar  de  atraente  por  causa  de  sua  simplicida¬ 
de,  este  método  é  problemático  para  amostras  menores, 
nas  quais  a  construção  do  histograma  (p.  ex.,  o  número  de 
categorias  ou  a  extensão  de  categorias)  pode  distorcer  a 
descrição  visual  a  ponto  de  a  análise  ser  inútil.  Uma  abor¬ 
dagem  mais  confiável  é  o  gráfico  de  probabilidade  normal, 
que  compara  a  distribuição  cumulativa  de  valores  de  dados 
reais  com  a  distribuição  cumulativa  de  uma  distribuição 
normal.  A  distribuição  normal  forma  uma  reta  diagonal, 
e  os  dados  do  gráfico  são  comparados  com  a  diagonal.  Se 


uma  distribuição  é  normal,  a  linha  que  representa  a  distri¬ 
buição  real  dos  dados  segue  muito  próxima  à  diagonal. 

A  Figura  2-8  exibe  diversos  desvios  da  normalidade 
e  sua  representação  na  probabilidade  normal  em  termos 
de  curtose  e  assimetria.  Primeiro,  desvios  da  distribuição 
normal  em  termos  de  curtose  são  facilmente  percebidos 
nos  gráficos  de  probabilidade  normal.  Quando  a  linha 
reta  fica  abaixo  da  diagonal,  a  distribuição  é  mais  acha¬ 
tada  do  que  o  esperado.  Quando  está  acima  da  diagonal, 
a  distribuição  é  mais  elevada  do  que  a  curva  normal.  Por 
exemplo,  no  gráfico  de  probabilidade  normal  de  uma  dis¬ 
tribuição  elevada  (Figura  2-8d),  percebemos  uma  curva 
com  um  formato  nítido  de  S.  Inicialmente,  a  distribuição  é 
mais  achatada  e  a  linha  no  gráfico  fica  abaixo  da  diagonal. 
Em  seguida,  a  parte  elevada  da  distribuição  rapidamente 
move  a  linha  acima  da  diagonal,  e  por  fim  a  linha  nova¬ 
mente  desvia  para  abaixo  da  diagonal  conforme  a  distri¬ 
buição  se  achata.  Uma  distribuição  sem  elevação  tem  o 
padrão  oposto  (Figura  2-8c).  Assimetria  é  também  facil¬ 
mente  percebida,  mais  freqüentemente  representada  por 
um  arco  simples,  ou  acima  ou  abaixo  da  diagonal.  Uma 
assimetria  negativa  (Figura  2-8e)  é  indicada  por  um  arco 
abaixo  da  diagonal,  enquanto  um  arco  acima  da  diagonal 
representa  uma  distribuição  positivamente  assimétrica 
(Figura  2-8f).  Uma  excelente  fonte  para  interpretar  grá¬ 
ficos  de  probabilidade  normal,  que  mostra  os  vários  pa¬ 
drões  e  as  interpretações,  é  o  livro  de  Daniel  e  Wood  [7]. 
Esses  padrões  específicos  não  apenas  identificam  não-nor- 
malidade,  mas  também  nos  dizem  a  forma  da  distribuição 
original  e  a  ação  corretiva  apropriada  a  aplicar. 

Testes  estatísticos  de  normalidade.  Além  de  examinar 
o  gráfico  de  probabilidade  normal,  pode-se  usar  testes 
estatísticos  para  avaliar  a  normalidade.  Um  teste  simples 
é  uma  regra  prática  baseada  nos  valores  de  assimetria  e 
curtose  (disponíveis  como  parte  das  estatísticas  descriti¬ 
vas  básicas  para  uma  variável  e  computadas  por  todos  os 
programas  estatísticos).  Q  valor  estatístico  (z)  para  a  assi¬ 
metria  é  calculado  como: 


assimetria 


onde  N  é  o  tamanho  da  amostra.  Um  valor  z  também 
pode  ser  calculado  para  a  curtose  usando  a  fórmula: 


curtose 


Se  o  valor  z  calculado  exceder  o  valor  crítico  especifica¬ 
do,  então  a  distribuição  é  não-normal  em  termos  daquela 
característica.  Q  valor  crítico  é  de  uma  distribuição  z,  ba¬ 
seado  no  nível  de  significância  que  desejamos.  Qs  valores 
críticos  mais  comumente  usados  são  ±  2,58  (nível  de  signi¬ 
ficância  de  0,01)  e  ±  1,96,  que  corresponde  a  um  nível  de 
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FIGURA  2-8  Gráficos  de  probabilidade  normal  e  distribuições  univariadas  correspondentes. 


erro  de  0,05.  Com  esses  testes  simples,  o  pesquisador  pode 
facilmente  avaliar  o  grau  em  que  a  assimetria  e  curtose  da 
distribuição  variam  em  relação  à  distribuição  normal. 

Testes  estatísticos  específicos  também  estão  dispo¬ 
níveis  em  todos  os  programas  estatísticos.  Os  dois  mais 
comuns  são  o  teste  Shapiro-Wilks  e  uma  modificação  do 
teste  de  Kolmogorov-Smirnov.  Cada  um  calcula  o  nível 
de  significância  para  as  diferenças  em  relação  a  uma  dis¬ 
tribuição  normal.  O  pesquisador  sempre  deve  lembrar 
que  os  testes  de  significância  são  menos  úteis  em  amostras 
pequenas  (menos  que  30)  e  muito  sensíveis  em  amostras 
grandes  (que  excedem  1000  observações).  Logo,  o  pesqui¬ 
sador  sempre  deve  usar  testes  gráficos  e  testes  estatísticos 
para  avaliar  o  grau  real  de  desvio  da  normalidade. 

Ações  corretivas  para  não-normalidade.  Diversas  trans¬ 
formações  de  dados  disponíveis  para  acomodar  distri¬ 
buições  não-normais  são  discutidas  posteriormente  no 
capítulo.  Este  capítulo  restringe  a  discussão  para  testes 
de  normalidade  univariada  e  transformações.  No  entan¬ 


to,  quando  examinamos  outros  métodos  multivariados, 
como  a  regressão  multivariada  ou  a  análise  multivariada 
de  variância,  também  discutimos  testes  para  normalidade 
multivariada.  Além  disso,  muitas  vezes,  quando  a  não- 
normalidade  é  apontada,  ela  também  contribui  para  ou¬ 
tras  violações  de  suposições;  portanto,  remediar  norma¬ 
lidade  pode  auxiliar  no  atendimento  a  outras  suposições. 
(Para  os  interessados  em  normalidade  multivariada,  ver 
[13,16,25].) 

Hom  ocedasticidade 

A  próxima  suposição  refere-se  a  relações  de  dependên¬ 
cia  entre  variáveis.  Homocedasticidade  se  refere  à  su¬ 
posição  de  que  as  variáveis  dependentes  exibem  níveis 
iguais  de  variância  ao  longo  do  domínio  da(s)  variável(is) 
preditora(s).  A  homocedasticidade  é  desejável  porque  a 
variância  da  variável  dependente  sendo  explicada  na  re¬ 
lação  de  dependência  não  deveria  se  concentrar  apenas 
em  um  domínio  limitado  dos  valores  independentes.  Na 
maioria  das  situações,  temos  muitos  valores  diferentes  da 
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variável  dependente  em  cada  valor  da  variável  indepen¬ 
dente.  Para  que  essa  relação  seja  completamente  captura¬ 
da,  a  dispersão  (variância)  dos  valores  da  variável  depen¬ 
dente  deve  ser  relativamente  semelhante  em  cada  valor  da 
variável  preditora.  Se  essa  dispersão  for  desigual  ao  longo 
de  valores  da  variável  independente,  a  relação  é  dita  hete- 
roscedástica.  Apesar  de  as  variáveis  dependentes  deverem 
ser  métricas,  esse  conceito  de  igual  extensão  de  variância 
entre  as  variáveis  independentes  pode  ser  aplicado  quan¬ 
do  as  variáveis  independentes  são  métricas  ou  não. 

•  Variáveis  independentes  métricas.  O  conceito  de  homoce- 
dasticidade  se  baseia  na  extensão  da  variância  da  variável 
dependente  no  domínio  dos  valores  das  variáveis  indepen¬ 
dentes,  o  que  se  encontra  em  técnicas  como  a  regressão 
múltipla.  A  dispersão  de  valores  para  a  variável  dependente 
deve  ser  tão  grande  para  pequenos  valores  das  variáveis  in¬ 
dependentes  quanto  o  é  para  variáveis  com  valores  modera¬ 
dos  ou  grandes.  Em  um  diagrama  de  dispersão,  isso  é  visto 
como  uma  distribuição  elíptica  de  pontos. 

•  Variáveis  independentes  não-métricas.  Nessas  análises  (p. 
ex.,  ANOVA  e  MANOVA)  o  foco  agora  se  torna  a  igual¬ 
dade  da  variância  (uma  só  variável  dependente)  ou  das  ma¬ 
trizes  de  variância/covariância  (múltiplas  variáveis  depen¬ 
dentes)  nos  grupos  formados  pelas  variáveis  independentes 
não-métricas.  A  igualdade  das  matrizes  de  variância/cova¬ 
riância  também  é  vista  na  análise  discriminante,  mas  nessa 
técnica  a  ênfase  é  na  dispersão  das  variáveis  independentes 
nos  grupos  formados  pela  medida  dependente  não-métrica. 

Em  todos  esses  casos,  o  objetivo  é  o  mesmo:  garantir  que 
a  variância  usada  na  explicação  e  previsão  esteja  distri¬ 
buída  no  domínio  de  valores,  permitindo  assim  um  “teste 
justo”  da  relação  entre  todos  os  valores  das  variáveis  não- 
métricas.  As  duas  fontes  mais  comuns  de  heteroscedasti- 
cidade  são  as  seguintes: 

•  Tipo  de  variável.  Muitos  tipos  de  variáveis  têm  uma  tendên¬ 
cia  natural  a  diferenças  na  dispersão.  Por  exemplo,  quando 
uma  variável  aumenta  em  valor  (p.  ex.,  unidades  que  variam 


(a)  Homoscedasticidade 


de  algo  próximo  a  zero  até  milhões),  há  um  intervalo  natu¬ 
ralmente  maior  de  possíveis  respostas  para  os  valores  maio¬ 
res.  Também,  quando  porcentuais  são  usados,  a  tendência 
natural  é  para  muitos  valores  estarem  no  meio  do  domínio, 
com  poucos  casos  nos  valores  menores  ou  maiores. 

•  Distribuição  assimétrica  de  uma  ou  mais  variáveis.  Na  Figu¬ 
ra  2-9a,  os  diagramas  de  dispersão  de  pontos  de  dados  para 
duas  variáveis  (Ej  e  Ej),  com  distribuições  normais,  exibem 
igual  dispersão  em  todos  os  valores  dos  dados  (ou  seja,  ho- 
mocedasticidade).  No  entanto,  na  Figura  2-9b,  percebemos 
dispersão  desigual  (heteroscedasticidade)  provocada  por 
assimetria  de  uma  das  variáveis  (E3).  Para  os  diferentes  va¬ 
lores  de  Ej,  há  diferentes  padrões  de  dispersão  para  Ej. 

O  resultado  da  heteroscedasticidade  é  causar  melho¬ 
res  previsões  em  alguns  níveis  da  variável  independente 
do  que  em  outros.  Essa  variabilidade  afeta  os  erros  pa¬ 
drões  e  torna  os  testes  de  hipóteses  muito  restritos  ou  in¬ 
sensíveis.  O  efeito  da  heteroscedasticidade  também  está 
freqüentemente  relacionado  ao  tamanho  da  amostra,  es¬ 
pecialmente  quando  se  examina  a  dispersão  de  variância 
em  grupos.  Por  exemplo,  em  ANOVA  ou  MANOVA,  o 
impacto  da  heteroscedasticidade  sobre  o  teste  estatístico 
depende  dos  tamanhos  de  amostra  associados  com  os  gru¬ 
pos  de  menores  e  maiores  variâncias.  Em  análise  de  re¬ 
gressão  múltipla,  efeitos  semelhantes  ocorreriam  em  dis¬ 
tribuições  altamente  assimétricas  onde  houvesse  números 
desproporcionais  de  respondentes  em  certos  intervalos  da 
variável  independente. 

Testes  gráficos  de  igual  dispersão  de  variância.  O  tes¬ 
te  de  homocedasticidade  para  duas  variáveis  métricas  é 
mais  bem  examinado  graficamente.  Desvios  de  uma  igual 
dispersão  são  mostrados  por  formas  como  cones  (disper¬ 
são  pequena  em  um  lado  do  gráfico,  dispersão  grande  no 
lado  oposto)  ou  losangos  (um  grande  número  de  pontos 
no  centro  da  distribuição).  A  aplicação  mais  comum  de 
testes  gráficos  ocorre  em  regressão  múltipla,  com  base  na 
dispersão  da  variável  dependente  nos  valores  de  qualquer 


(b)  Heteroscedasticidade 


FIGURA  2-9  Diagramas  de  dispersão  de  reiações  homoscedásticas  e  heteroscedásticas. 
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uma  das  variáveis  independentes.  Vamos  adiar  nossa  dis¬ 
cussão  sobre  métodos  gráficos  até  chegarmos  ao  Capítulo 
4,  o  qual  descreve  esses  procedimentos  com  muito  mais 
detalhes. 

Os  gráficos  de  caixas  funcionam  bem  para  representar 
o  grau  de  variação  entre  grupos  formados  por  uma  va¬ 
riável  categórica.  O  comprimento  da  caixa  e  os  whiskers 
retratam,  cada  um,  a  variação  dos  dados  dentro  daque¬ 
le  grupo.  Assim,  heteroscedasticidade  seria  retratada 
por  diferenças  substanciais  no  comprimento  das  caixas  e 
whiskers  entre  grupos  que  representam  a  dispersão  de  ob¬ 
servações  em  cada  grupo. 

Testes  estatísticos  para  homocedasticidade.  Os  testes 
estatísticos  para  igual  dispersão  de  variância  avaliam  a 
igualdade  de  variâncias  dentro  de  grupos  formados  por 
variáveis  não-métricas.  O  teste  mais  comum,  teste  Leve- 
ne,  é  usado  para  avaliar  se  as  variâncias  de  uma  única  va¬ 
riável  métrica  são  iguais  em  qualquer  número  de  grupos. 
Se  mais  do  que  uma  variável  métrica  está  sendo  testada, 
de  forma  que  a  comparação  envolve  a  igualdade  de  matri¬ 
zes  de  variância/covariância,  o  teste  M  de  Box  é  aplicável. 
O  teste  M  de  Box  está  disponível  tanto  na  análise  multi¬ 
variada  de  variância  quanto  na  análise  discriminante,  e  é 
discutido  mais  detalhadamente  em  capítulos  posteriores 
que  tratam  dessas  técnicas. 

Ações  corretivas  para  heteroscedasticidade.  As  variá¬ 
veis  heteroscedásticas  podem  ser  remediadas  por  meio 
de  transformações  de  dados  semelhantes  às  empregadas 
para  atingir  a  normalidade.  Como  anteriormente  mencio¬ 
nado,  muitas  vezes  a  heteroscedasticidade  é  o  resultado 
da  não-normalidade  de  uma  das  variáveis,  e  correção  da 
não-normalidade  também  remedia  a  dispersão  desigual 
da  variância.  Uma  seção  adiante  discute  as  transforma¬ 
ções  de  dados  das  variáveis  para  “espalharem”  a  variância 
e  fazer  com  que  todos  os  valores  tenham  um  efeito  poten¬ 
cialmente  igual  na  previsão. 

Linearidade 

Uma  suposição  implícita  em  todas  as  técnicas  multivaria- 
das  baseadas  em  medidas  correlacionais  de  associação, 
incluindo  regressão  múltipla,  regressão  logística,  análise 
fatorial,  e  modelagem  de  equações  estruturais,  é  a  lineari¬ 
dade.  Como  as  correlações  representam  apenas  a  associa¬ 
ção  linear  entre  variáveis,  os  efeitos  não-lineares  não  serão 
representados  no  valor  de  correlação.  Essa  omissão  resulta 
em  uma  subestimação  da  força  real  da  relação.  É  sempre 
prudente  examinar  todas  as  relações  para  identificar  des¬ 
vios  de  linearidade  que  possam  afetar  a  correlação. 

Identificação  de  relações  não-lineares.  O  modo  mais 
comum  de  avaliar  a  linearidade  é  examinar  diagramas  de 
dispersão  das  variáveis  e  identificar  qualquer  padrão  não- 
linear  nos  dados.  Muitos  programas  de  diagramas  de  dis¬ 
persão  podem  mostrar  a  linha  reta  que  descreve  a  relação 
linear,  permitindo  ao  pesquisador  uma  melhor  identifica¬ 


ção  de  qualquer  característica  não-linear.  Um  tratamento 
alternativo  é  executar  uma  análise  de  regressão  simples 
(os  detalhes  sobre  essa  técnica  são  cobertos  no  Capítulo 
4)  e  examinar  os  resídnos.  Os  resíduos  refletem  a  parte 
inexplicada  da  variável  dependente;  logo,  qualquer  parte 
não-linear  da  relação  aparecerá  nos  resíduos.  Uma  tercei¬ 
ra  abordagem  é  explicitamente  modelar  uma  relação  não- 
linear  pelo  teste  de  especificações  de  modelo  alternativo 
(também  conhecido  como  ajuste  de  curva)  que  reflitam  os 
elementos  não-lineares.  Uma  discussão  desse  tratamento 
e  de  análise  de  resíduos  se  encontra  no  Capítulo  4. 

Ações  corretivas  para  não-linearidade.  Se  uma  relação 
não-linear  é  detectada,  a  abordagem  mais  direta  é  trans¬ 
formar  uma  ou  as  duas  variáveis  de  modo  a  obter  linea¬ 
ridade.  Várias  transformações  disponíveis  são  discutidas 
posteriormente  neste  capítulo.  Uma  alternativa  à  trans¬ 
formação  de  dados  é  a  criação  de  novas  variáveis  para  re¬ 
presentar  a  porção  não-linear  da  relação.  O  processo  de 
criação  e  interpretação  dessas  variáveis  adicionais,  que 
pode  ser  usado  em  todas  as  relações  lineares,  é  discutido 
no  Capítulo  4. 

Ausência  de  erros  correlacionados 

As  previsões  em  qualquer  técnica  de  dependência  não  são 
perfeitas,  e  raramente  encontramos  uma  situação  na  qual 
elas  sejam.  Contudo,  certamente  tentamos  garantir  que 
qualquer  erro  de  previsão  seja  não-correlacionado.  Por 
exemplo,  se  encontramos  um  padrão  que  sugere  que  todos 
os  outros  erros  são  positivos,  enquanto  os  termos  de  erro 
alternativo  são  negativos,  sabemos  que  alguma  relação 
sistemática  inexplicada  existe  na  variável  dependente.  Se 
tal  situação  ocorre,  não  podemos  confiar  na  idéia  de  que 
nossos  erros  de  previsão  são  independentes  dos  níveis  nos 
quais  estamos  tentando  prever.  Algum  outro  fator  está 
afetando  os  resultados,  mas  não  está  incluído  na  análise. 

Identificação  de  erros  correlacionados.  Uma  das  viola¬ 
ções  mais  comuns  da  suposição  de  que  os  erros  são  não- 
correlacionados  deve-se  ao  processo  de  coleta  de  dados. 
Fatores  semelhantes  que  afetam  um  grupo  podem  não 
afetar  o  outro.  Se  os  grupos  são  analisados  separadamen¬ 
te,  os  efeitos  são  constantes  dentro  de  cada  grupo  e  não 
impactam  a  estimação  da  relação.  Entretanto,  se  as  obser¬ 
vações  dos  dois  grupos  são  combinadas,  então  a  relação 
estimada  final  deve  ser  um  meio-termo  entre  as  duas  rela¬ 
ções  reais.  Isso  faz  com  que  os  resultados  sejam  viesados, 
porque  uma  causa  não-especificada  está  afetando  a  esti¬ 
mação  da  relação. 

Outra  fonte  comum  de  erros  correlacionados  são  os 
dados  em  série  temporal.  Como  é  de  se  esperar,  os  dados 
para  qualquer  período  de  tempo  estão  altamente  relacio¬ 
nados  com  os  dados  em  momentos  anteriores  e  posterio¬ 
res.  Assim,  previsões  e  erros  de  previsão  estarão  neces¬ 
sariamente  correlacionados.  Esse  tipo  de  dado  conduz  à 
criação  de  programas  especializados  em  análise  de  séries 
temporais  e  esse  padrão  de  observações  correlacionadas. 
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Para  identificar  erros  correlacionados,  o  pesquisa¬ 
dor  deve  primeiro  identificar  possíveis  causas.  Valores 
para  uma  variável  devem  ser  agrupados  ou  ordenados 
sobre  a  variável  suspeita  e  então  examinados  em  busca 
de  padrões.  Em  nosso  exemplo  anterior,  uma  vez  que  a 
causa  potencial  é  identificada,  o  pesquisador  poderia  ver 
se  diferenças  existiam  entre  os  grupos.  Encontrar  dife¬ 
renças  nos  erros  de  previsão  nos  dois  grupos  seria  então 
a  base  para  determinar  que  um  efeito  não-especificado 
estava  “provocando”  os  erros  correlacionados.  Para  ou¬ 
tros  tipos  de  dados,  como  dados  em  séries  temporais, 
podemos  ver  tendências  ou  padrões  quando  ordenamos 
os  dados  (p.  ex.,  por  período  de  tempo  para  séries  tem¬ 
porais).  Essa  variável  de  ordenação  (tempo,  neste  caso), 
se  não  incluída  na  análise  de  alguma  maneira,  causaria 
a  correlação  dos  erros  e  criaria  vieses  substanciais  nos 
resultados. 

Ações  corretivas  para  erros  correlacionados.  Os  erros 
correlacionados  devem  ser  corrigidos  pela  inclusão  do 
fator  causal  omitido  na  análise  multivariada.  Em  nosso 
exemplo  anterior,  o  pesquisador  acrescentaria  uma  variá¬ 
vel  que  indicasse  em  qual  classe  os  respondentes  estavam. 
A  correlação  mais  comum  é  o  acréscimo  de  uma  variá¬ 
vel  (ou  mais)  à  análise,  que  represente  o  fator  omitido.  A 
tarefa-chave  do  pesquisador  não  é  propriamente  a  ação 
corretiva,  mas  a  identificação  do  efeito  não-especificado  e 
um  meio  de  representá-lo  na  análise. 

Visão  geral  de  teste  para  suposições  estatísticas.  O 

pesquisador  encara  aquilo  que  pode  parecer  uma  tarefa 
impossível:  satisfazer  todas  essas  suposições  estatísti¬ 
cas  ou  correr  o  risco  de  uma  análise  falha  e  com  vieses. 
Queremos  observar  que  mesmo  que  essas  suposições 
estatísticas  sejam  importantes,  o  pesquisador  deve  usar 
seu  julgamento  na  interpretação  dos  testes  para  cada  pre¬ 
missa  e  na  decisão  sobre  quando  aplicar  ações  corretivas. 
Mesmo  análises  com  amostras  pequenas  podem  suportar 
pequenos,  mas  significantes,  desvios  da  normalidade.  O 
que  é  mais  importante  para  o  pesquisador  é  entender  as 
implicações  de  cada  premissa  em  relação  à  técnica  de  in¬ 
teresse,  tentando  algo  intermediário  entre  a  necessidade 
de  satisfazer  as  suposições  versus  a  robustez  da  técnica  e 
contexto  de  pesquisa.  As  orientações  a  seguir  nas  Regras 
Práticas  2-5  tentam  retratar  os  aspectos  mais  pragmáticos 
das  suposições  e  as  reações  que  podem  ser  tomadas  pelos 
pesquisadores. 

Transformações  de  dados 

As  transformações  de  dados  fornecem  um  meio  para  mo¬ 
dificar  variáveis  devido  a  uma  entre  duas  razões:  (1)  para 
corrigir  violações  das  suposições  estatísticas  inerentes  às 
técnicas  multivariadas,  ou  (2)  para  melhorar  a  relação 
(correlação)  entre  variáveis.  As  transformações  de  dados 
podem  ser  sustentadas  por  motivos  que  são  “teóricos” 
(transformações  cuja  justificativa  é  baseada  na  natureza 


-  REGRAS  PRÁTICAS  2-5  - 

Teste  das  suposições  estatísticas 

•  Normalidade  pode  ter  sérios  efeitos  em  pequenas 
amostras  (com  menos  de  50  casos),  mas  o  impacto 
diminui  efetivamente  quando  a  amostra  atinge  200 
casos  ou  mais. 

•  A  maioria  dos  casos  de  heteroscedasticidade  são 
um  resultado  de  não-normalidade  em  uma  ou  mais 
variáveis;  assim,  corrigir  normalidade*  pode  não  ser 
necessário  devido  ao  tamanho  de  amostra,  mas  pode 
ser  necessário  para  igualar  a  variância. 

•  Relações  não-lineares  podem  ser  bem  definidas,  mas 
seriamente  subestimadas  a  menos  que  os  dados  sejam 
transformados  em  um  padrão  linear  ou  componentes 
de  modelo  explícito  sejam  usados  para  representar  a 
porção  não-linear  da  relação. 

•  Erros  correlacionados  surgem  de  um  processo  que  deve 
ser  tratado  de  forma  muito  parecida  com  a  perda  de 
dados;  ou  seja,  o  pesquisador  deve  primeiramente  definir 
as  causas  entre  variáveis  como  internas  ou  externas 

ao  conjunto  de  dados;  se  não  forem  descobertas  e 
remediadas,  sérios  vieses  podem  acontecer  nos  resultados, 
muitas  vezes  desconhecidos  pelo  pesquisador. 


dos  dados)  ou  “derivados  dos  dados”  (onde  as  transfor¬ 
mações  são  estritamente  sugeridas  por  um  exame  dos 
dados).  Em  qualquer  caso,  o  pesquisador  deve  proceder 
muitas  vezes  por  tentativa  e  erro,  monitorando  as  melho¬ 
rias  versus  a  necessidade  de  transformações  adicionais. 

Todas  as  transformações  descritas  aqui  são  facilmente 
executáveis  por  simples  comandos  nos  pacotes  computa¬ 
cionais  estatísticos  mais  comuns.  Concentramo-nos  em 
transformações  que  podem  ser  computadas  dessa  manei¬ 
ra,  apesar  de  métodos  mais  sofisticados  e  complicados  de 
transformação  de  dados  estarem  disponíveis  (por  exem¬ 
plo,  ver  Box  e  Cox  [3]). 

Transformações  para  atingir 
normalidade  e  homocedasticidade 

As  transformações  de  dados  fornecem  os  principais  meios 
para  corrigir  a  não-normalidade  e  a  heteroscedasticida¬ 
de.  Em  ambos  os  casos,  os  padrões  das  variáveis  sugerem 
transformações  específicas.  Para  distribuições  não-normais, 
os  padrões  mais  comuns  são  distribuições  achatadas  e  assi¬ 
métricas.  Para  a  distribuição  achatada,  a  transformação  mais 
usual  é  a  inversa  (por  exemplo,  Í/Y  ou  1/X).  As  distribui¬ 
ções  assimétricas  podem  ser  transformadas  calculando-se  a 
raiz  quadrada,  logaritmos,  quadrados  ou  cubos  (X^  ou  X^), 
ou  mesmo  o  inverso  da  variável.  Geralmente,  as  distribui¬ 
ções  negativamente  assimétricas  são  melhor  transformadas 
empregando-se  uma  transformação  de  quadrado  ou  cubo, 
enquanto  o  logaritmo  ou  a  raiz  quadrada  normalmente  fun- 


*  N.  de  R.  T.:  A  frase  correta  seria  “corrigir  não-normalidade”. 
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cionam  melhor  em  assimetrias  positivas.  Em  muitos  casos,  o 
pesquisador  pode  aplicar  todas  as  transformações  possíveis 
e  então  selecionar  a  variável  transformada  mais  apropriada. 

A  heteroscedasticidade  é  um  problema  associado,  e 
em  muitos  casos  “curar”  este  problema  também  lidará 
com  questões  de  normalidade.  A  heteroscedasticidade 
também  ocorre  devido  à  distribuição  da(s)  variável(is). 
Quando  se  examina  o  diagrama  de  dispersão,  o  padrão 
mais  comum  é  a  distribuição  em  forma  de  cone.  Se  o  cone 
abre  à  direita,  considere  a  inversa;  se  o  cone  abre  para  a 
esquerda,  considere  a  raiz  quadrada.  Algumas  transfor¬ 
mações  podem  ser  associadas  com  certos  tipos  de  dados. 
Por  exemplo,  as  contagens  de  freqüência  sugerem  uma 
transformação  de  raiz  quadrada;  as  proporções  são  me¬ 
lhor  transformadas  por  arco  seno  X  =2  arcsen  Jjí  „  ; 

^  \  /tovo  V  velho  j 

e  a  mudança  proporcional  é  mais  fácil  de  manobrar  calcu- 
lando-se  o  logaritmo  da  variável.  Em  todos  os  casos,  uma 
vez  que  as  transformações  tenham  sido  efetuadas,  os  da¬ 
dos  transformados  devem  ser  testados  para  ver  se  a  ação 
corretiva  desejada  foi  conseguida. 

Transformações  para  atingir  linearidade 

Existem  muitos  procedimentos  para  conseguir  linearida¬ 
de  entre  duas  variáveis,  mas  as  relações  não-lineares  mais 
simples  podem  ser  classificadas  em  quatro  categorias 
(ver  Figura  2-10).  Em  cada  quadrante,  as  transformações 
potenciais  para  as  variáveis  dependente  e  independente 
são  mostradas.  Por  exemplo,  se  a  relação  se  parece  com 
a  da  Figura  2-lOa,  então  cada  variável  pode  ser  elevada 
ao  quadrado  para  obter  linearidade.  Quando  múltiplas 


possibilidades  de  transformações  forem  exibidas,  come¬ 
ce  com  o  método  do  topo  em  cada  quadrante  e  vá  des¬ 
cendo  até  a  linearidade  ser  conseguida.  Uma  abordagem 
alternativa  é  usar  variáveis  adicionais,  chamadas  de  po¬ 
linómios,  para  representar  as  componentes  não-lineares. 
Esse  método  é  discutido  em  mais  detalhes  no  Capítulo  4. 

Orientações  gerais  para  transformações 

Existem  muitas  possibilidades  para  transformar  os  dados 
para  atender  as  suposições  estatísticas  exigidas.  Exceto 
aspectos  técnicos  do  tipo  de  transformação,  diversos  pon¬ 
tos  são  apresentados  nas  Regras  Práticas  2-6  para  lembrar 
quando  se  deve  fazer  transformações  de  dados. 

Uma  ilustração  do  teste  das  suposições 
iuereutes  à  auálise  multivariada 

Para  ilustrar  as  técnicas  envolvidas  no  teste  dos  dados  re¬ 
ferente  ao  atendimento  das  suposições  inerentes  à  análise 
multivariada  e  fornecer  uma  fundamentação  para  o  uso 
dos  dados  em  capítulos  que  se  seguem,  o  conjunto  de  da¬ 
dos  introduzido  no  Capítulo  1  será  examinado.  No  curso 
da  análise,  as  suposições  de  normalidade,  homocedasti- 
cidade  e  linearidade  serão  cobertas.  A  quarta  suposição 
básica,  a  ausência  de  erros  correlacionados,  pode  ser  dis¬ 
cutida  apenas  no  contexto  de  um  modelo  multivariado  es¬ 
pecífico;  ela  será  abordada  em  capítulos  posteriores  para 
cada  técnica  multivariada.  Será  enfatizado  o  exame  das 
variáveis  métricas,  apesar  de  as  variáveis  não-métricas  se¬ 
rem  avaliadas  onde  for  apropriado. 


FIGURA  2-10  Seleção  de  transformações  para  atingir  linearidade. 

Fonte-,  F.  Mosteller  and  J.  W.  Tukey,  Data  Analysis  and  Regression.  Reading,  MA:  Addison-Wesley,  1 977. 
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-  REGRAS  PRÁTICAS  2-6  - 

Transformação  de  dados 

•  Para  julgar  o  impacto  potencial  de  uma  transformação, 
calcule  a  proporção  entre  a  média  da  variável  e  seu 
desvio  padrão: 

•  Efeitos  perceptíveis  devem  ocorrer  quando  a 
proporção  é  menor  do  que  4. 

•  Quando  a  transformação  puder  ser  realizada  em 
qualquer  uma  de  duas  variáveis,  escolha  a  variável 
com  a  menor  proporção. 

•  As  transformações  devem  ser  aplicadas  nas  variáveis 
independentes,  exceto  no  caso  de  heteroscedasticidade. 

•  A  heteroscedasticidade  pode  ser  remediada  apenas  pela 
transformação  da  variável  dependente  em  uma  relação 
de  dependência;  se  uma  relação  heteroscedástica  é 
também  não-linear,  a  variável  dependente,  e  talvez  as 
independentes,  deve(m)  ser  transformada(s). 

•  As  transformações  podem  mudar  a  interpretação 
das  variáveis;  por  exemplo,  transformar  variáveis 
calculando  seu  logaritmo  traduz  a  relação  em  uma 
medida  de  mudança  proporcional  (elasticidade); 
sempre  se  assegure  de  explorar  meticulosamente  as 
interpretações  possíveis  das  variáveis  transformadas. 

•  Use  variáveis  em  seu  formato  original  (não 
transformadas)  quando  caracterizar  ou  interpretar 
resultados. 


Normalidade 

A  avaliação  de  normalidade  das  variáveis  métricas  envol¬ 
ve  tanto  medidas  empíricas  das  características  da  forma 
de  uma  distribuição  (assimetria  e  curtose)  quanto  gráficos 
de  probabilidade  normal.  As  medidas  empíricas  fornecem 
uma  indicação  das  variáveis  com  desvios  significantes  da 
normalidade,  e  os  gráficos  de  probabilidade  normal  pro¬ 
duzem  um  retrato  visual  da  forma  da  distribuição.  Os  dois 
tipos  de  descrições  complementam-se  quando  são  selecio¬ 
nadas  as  transformações  apropriadas. 


A  Tabela  2-11  e  a  Figura  2-11  contêm  as  medidas  empí¬ 
ricas  e  os  gráficos  de  probabilidade  normal  para  as  variá¬ 
veis  métricas  em  nosso  conjunto  de  dados.  Nossa  primei¬ 
ra  preocupação  é  sobre  as  medidas  empíricas  refletindo 
a  forma  da  distribuição  (assimetria  e  curtose)  bem  como 
um  teste  estatístico  de  normalidade  (o  teste  de  Kolmo- 
gorov-Smirnov  modificado).  Entre  as  17  variáveis  métri¬ 
cas,  apenas  6  (JQ,  Xj,  X^2,  X^^  e  X^-^)  exibem  algum 

desvio  de  normalidade  nos  testes  gerais.  Quando  vemos 
as  características  de  formato,  desvios  significantes  foram 
encontrados  para  assimetria  (A,)  e  curtose  (Ag).  Deve- 
se  notar  que  somente  duas  variáveis  foram  encontradas 
com  características  de  formato  diferentes  da  curva  nor¬ 
mal,  enquanto  seis  variáveis  foram  identificadas  com  os 
testes  gerais.  O  teste  geral  não  fornece  qualquer  idéia 


quanto  às  transformações  que  sejam  as  melhores,  ao 
passo  que  as  características  de  formato  oferecem  dire¬ 
trizes  para  possíveis  transformações.  O  pesquisador 
pode  também  usar  os  gráficos  de  probabilidade  normal 
para  identificar  a  forma  da  distribuição.  A  Figura  2-11 
contém  os  gráficos  de  probabilidade  normal  para  as  seis 
variáveis  com  distribuições-normais.  Por  combinação  de 
informações,  dos  métodos  empírico  e  gráfico,  o  pesqui¬ 
sador  pode  caracterizar  a  distribuição  não-normal  antes 
de  selecionar  uma  transformação  (ver  Tabela  2-11  para 
uma  descrição  de  cada  distribuição  não-normal). 

A  Tabela  2-11  também  sugere  a  ação  corretiva  ade¬ 
quada  para  cada  uma  das  variáveis.  Duas  variáveis  (Ag 
e  Ajg)  foram  transformadas  via  raiz  quadrada*.  A^  foi 
transformada  por  logaritmo,  enquanto  Xj,  foi  eleva¬ 
da  ao  quadrado,  e  A^,  ao  cubo.  Apenas  Ajj  não  pôde 
ser  transformada  para  melhorar  suas  características  de 
distribuição.  Para  as  outras  cinco  variáveis,  seus  testes 
de  normalidade  foram  agora  ou  não-significantes  (A^g 
e  Ajy),  ou  sensivelmente  melhorados  para  níveis  mais 
aceitáveis  (Ag,  A,  e  A^).  A  Figura  2-12  demonstra  o  efei¬ 
to  da  transformação  sobre  Aj^  ao  atingir  normalidade.  A 
Aj7  transformada  aparece  muito  mais  normal  nas  repre¬ 
sentações  gráficas,  e  os  descritores  estatísticos  também 
foram  melhorados.  O  pesquisador  sempre  deve  exami¬ 
nar  as  variáveis  transformadas  de  maneira  tão  rigorosa 
quanto  às  variáveis  originais  no  que  se  refere  a  sua  nor¬ 
malidade  e  formato  da  distribuição. 

No  caso  da  variável  remanescente  (Ajj),  nenhuma 
das  transformações  poderia  melhorar  a  normalidade. 
Essa  variável  deverá  ser  usada  em  sua  forma  original. 
Em  situações  onde  a  normalidade  das  variáveis  é  críti¬ 
ca,  as  variáveis  transformadas  podem  ser  empregadas 
com  a  garantia  de  que  elas  atendem  as  suposições  de 
normalidade.  Mas  os  desvios  de  normalidade  não  são 
tão  extremos  em  qualquer  uma  das  variáveis  originais 
a  ponto  de  jamais  poderem  ser  usados  na  análise  em 
sua  forma  original.  Se  a  técnica  tem  uma  robustez  para 
desvios  da  normalidade,  então  as  variáveis  originais  po¬ 
dem  ser  preferenciais  para  a  comparabilidade  na  fase 
de  interpretação. 


Hom  ocedasticidade 

Todos  os  pacotes  estatísticos  têm  testes  para  avaliar  a  ho- 
mocedasticidade  em  uma  base  univariada  (p.  ex.,  o  teste 
de  Levene  em  SPSS)  onde  a  variância  de  uma  variável  mé¬ 
trica  é  comparada  em  níveis  de  uma  variável  não-métrica. 
Para  nossos  propósitos,  examinamos  cada  variável  métrica 
ao  longo  das  cinco  variáveis  não-métricas  no  conjunto  de 
dados.  Essas  são  análises  apropriadas  na  preparação  para 
análise  de  variância,  ou  análise  multivariada  de  variância. 


*  N.  de  R.  T.:  Pela  Tabela  2-11,  as  variáveis  Xg  e  Xjg  foram  elevadas 
ao  quadrado  e  a  X„  ficou  na  forma  inversa. 


TABELA  2-1 1  Características  de  distribuição,  teste  de  normaiidade  e  possíveis  ações  corretivas 
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Xq  Qualidade  do  produto  Xj  Atividades  de  comércio  eletrônico 


Xi2  Imagem  de  força  de  venda  X13  Preço  competitivo 


Xig  Encomenda  e  cobrança  X-u  Flexibilidade  de  preço 

FIGURA  2-11  Gráficos  de  probabilidade  normal  (NPP)  de  variáveis  métricas  não-normais  (Xg,  X^,  X,^,  X,3,  X,^  e  X„). 


nas  quais  as  variáveis  não-métricas  são  as  independentes, 
ou  para  análise  discriminante,  na  qual  as  variáveis  não- 
métricas  são  as  medidas  dependentes. 

Os  testes  para  homocedasticidade  de  duas  variáveis 
métricas,  encontrados  em  métodos  como  regressão  múl¬ 


tipla,  são  melhor  executados  por  meio  de  análise  gráfica, 
particularmente  uma  análise  dos  resíduos.  O  leitor  inte¬ 
ressado  deve  ler  o  Capítulo  4  para  uma  discussão  comple¬ 
ta  da  análise  de  resíduos  e  dos  padrões  de  resíduos  que 
indicam  heteroscedasticidade. 
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A  Tabela  2-12  contém  os  resultados  do  teste  Levene 
para  cada  variável  não-métrica.  Entre  os  fatores  de  de¬ 
sempenho,  apenas  X4  (Região)  tem  problemas  visíveis 
com  heteroscedasticidade.  Para  as  13  variáveis  caracte¬ 
rísticas  da  firma,  somente  e  Xj,  apresentam  padrões 
de  heteroscedasticidade  em  mais  de  uma  variável  não- 
métrica.  Além  disso,  nenhuma  variável  não-métrica  tem 
mais  de  duas  variáveis  métricas  problemáticas.  As  impli¬ 
cações  reais  desses  casos  de  heteroscedasticidade  devem 
ser  examinadas  sempre  que  diferenças  em  grupos  forem 
analisadas  com  o  uso  de  variáveis  não-métricas  como  va¬ 
riáveis  independentes,  e  essas  variáveis  métricas,  como 
dependentes.  A  relativa  falta  de  problemas  ou  de  pa¬ 
drões  consistentes  ao  longo  de  cada  variável  não-métrica 
sugere  que  os  problemas  de  heteroscedasticidade  serão 
mínimos.  Se  forem  encontradas  violações  dessa  suposi¬ 
ção,  as  transformações  de  variáveis  estarão  disponíveis 
para  ajudar  na  correção  a  dispersão  de  variância. 

A  habilidade  de  transformações  para  tratar  do  pro¬ 
blema  de  heteroscedasticidade  para  Xj^,  se  desejada, 
é  também  mostrada  na  Figura  2-12.  Antes  de  aplicar  a 
transformação  logarítmica,  as  condições  de  heterosce¬ 
dasticidade  foram  encontradas  em  três  das  cinco  variá¬ 
veis  não-métricas.  A  transformação  não  apenas  corrigiu 
o  problema  de  não-normalidade,  mas  também  eliminou 
os  problemas  de  heteroscedasticidade.  No  entanto,  deve 
ser  observado  que  diversas  transformações  “solucio¬ 
nam”  o  problema  de  normalidade*,  mas  apenas  a  trans¬ 
formação  logarítmica  também  trata  da  heteroscedasti¬ 
cidade,  o  que  demonstra  a  relação  entre  normalidade 
e  heteroscedasticidade  e  o  papel  de  transformações  na 
abordagem  de  cada  questão. 


Linearidade 

A  suposição  final  a  ser  examinada  é  a  linearidade  das  re¬ 
lações.  No  caso  de  variáveis  individuais,  ela  se  relacio¬ 
na  com  os  padrões  de  associação  entre  cada  par  de  va¬ 
riáveis  e  com  a  capacidade  do  coeficiente  de  correlação 
em  representar  adequadamente  a  relação.  Se  relações 
não-lineares  são  indicadas,  então  o  pesquisador  pode 
transformar  uma  ou  ambas  as  variáveis  para  conseguir 
linearidade,  ou  criar  variáveis  adicionais  para  represen¬ 
tar  as  componentes  não-lineares.  Para  nossos  propósitos, 
contamos  com  a  inspeção  visual  das  relações  para  deter¬ 
minar  se  relações  não-lineares  estão  presentes.  O  leitor 
pode  consultar  na  Figura  2-3  a  matriz  de  dispersão,  que 
contém  o  diagrama  de  dispersão  de  variáveis  métricas 
selecionadas  no  conjunto  de  dados.  O  exame  dos  diagra¬ 
mas  de  dispersão  não  revela  qualquer  relação  não-linear 
aparente.  Uma  revisão  dos  diagramas  de  dispersão  não 


*  N.  de  R.  T.:  A  palavra  correta  seria  “não-normalidade”. 


exibidos  na  Figura  2-3  também  não  revelou  qualquer  re¬ 
lação  não-linear  aparente.  Desse  modo,  transformações 
não  são  consideradas  necessárias.  A  suposição  de  lineari¬ 
dade  também  será  verificada  para  o  modelo  multivariado 
como  um  todo,  como  se  faz  no  exame  de  resíduos  em 
regressão  múltipla. 

Resumo 

A  série  de  testes  gráficos  e  estatísticos  usada  para  avaliar 
as  suposições  inerentes  às  técnicas  multivariadas  revelou 
relativamente  pouco  em  termos  de  violações  das  supo¬ 
sições.  Onde  as  violações  se  mostraram  presentes,  elas 
eram  relativamente  pequenas  e  não  deviam  representar 
qualquer  problema  sério  no  curso  da  análise  de  dados.  O 
pesquisador  sempre  é  encorajado  a  executar  esses  exames 
simples  dos  dados,  ainda  que  reveladores,  para  garantir 
que  problemas  potenciais  possam  ser  identificados  e  re¬ 
solvidos  antes  que  a  análise  comece. 


INCORPORAÇÃO  DE  DADOS 
NÃO-MÉTRICOS  COM 
VARIÃVEIS  DICOTÔMICAS 

Um  fator  crítico  na  escolha  e  aplicação  da  técnica  mul¬ 
tivariada  correta  é  cada  propriedade  de  medida  das  va¬ 
riáveis  dependentes  e  independentes  (ver  Capítulo  1  para 
uma  discussão  mais  detalhada  sobre  a  seleção  de  técni¬ 
cas  multivariadas).  Algumas  das  técnicas,  como  a  análi¬ 
se  discriminante  ou  a  análise  multivariada  de  variância, 
requerem  especificamente  dados  não-métricos  como  va¬ 
riáveis  dependentes  ou  independentes.  Em  muitos  casos, 
as  variáveis  métricas  devem  ser  usadas  como  variáveis 
independentes,  como  na  análise  de  regressão,  na  análi¬ 
se  discriminante  e  na  correlação  canônica.  Além  disso, 
as  técnicas  de  interdependência  de  análise  fatorial  e  de 
agrupamentos  geralmente  exigem  variáveis  métricas.  Até 
o  momento,  todas  as  discussões  têm  assumido  medidas 
métricas  para  variáveis.  O  que  podemos  fazer  quando  as 
variáveis  são  não-métricas,  com  duas  ou  mais  categorias? 
Variáveis  não-métricas,  como  sexo,  estado  civil  ou  pro¬ 
fissão,  têm  seu  uso  proibido  em  muitas  técnicas  multiva¬ 
riadas?  A  resposta  é  negativa,  e  agora  discutimos  como 
incorporar  variáveis  não-métricas  em  muitas  dessas  situa¬ 
ções  que  requerem  variáveis  métricas. 

O  pesquisador  tem  a  sua  disposição  um  método  para 
uso  de  certas  variáveis,  ditas  dicotômicas,  as  quais  atuam 
como  variáveis  de  substituição  para  a  variável  não-mé¬ 
trica.  Uma  variável  dicotômica  é  aquela  que  representa 
uma  categoria  de  uma  variável  independente  não-métrica. 
Qualquer  variável  não-métrica  com  k  categorias  pode  ser 
representada  por  k-1  variáveis  dicotômicas.  O  exemplo 
a  seguir  ajudará  a  esclarecer  esse  conceito. 


Gráfico  de  probabilidade  normal 
de  X^j  -  Flexibilidade  de  preço 
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FIGURA  2-12  Continuação. 
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Notas:  Valores  representam  a  estatística  Levene  e  a  significância  estatística  na  avaliação  da  dispersão  de  variância  de  cada  variável  métrica  ao  longo  dos  níveis  das  variáveis  não-métricas/categóricas.  Valores  em 
negrito  são  estatisticamente  significantes  no  nível  menor  ou  igual  a  0,05. 
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Primeiro,  considere  que  queremos  incluir  sexo,  que  tem 
duas  categorias,  feminino  e  masculino.  Também  medi¬ 
mos  o  nível  de  renda  familiar  por  três  categorias  (ver 
Tabela  2-13).  Para  representar  a  variável  não-métrica 
sexo,  criaríamos  duas  novas  variáveis  dicotômicas  (X^  e 
Aj),  como  mostrado  na  Tabela  2-13.  representaria  os 
indivíduos  do  sexo  feminino  com  um  valor  1  e  daria  a 
todos  os  do  sexo  masculino  o  valor  0.  Do  mesmo  modo, 
X2  representaria  todos  os  indivíduos  do  sexo  masculino 
com  o  valor  1  e  daria  aos  do  sexo  feminino  o  valor  0.  As 
duas  variáveis  {X^  e  X2)  não  são  necessárias,  contudo, 
uma  vez  que,  quando  Aj  =  0,  o  sexo  deve  ser  feminino 
por  definição.  Logo,  precisamos  incluir  apenas  uma  das 
variáveis  (Aj  ou  Aj)  para  testar  o  efeito  do  sexo. 

De  modo  semelhante,  se  também  tivéssemos  me¬ 
dido  a  renda  familiar  com  três  níveis,  como  mostrado 
na  Tabela  2-13,  definiríamos  primeiro  três  variáveis 
dicotômicas  (Aj,  A4  e  A5).  No  caso  do  sexo,  não  preci¬ 
saríamos  do  conjunto  inteiro  de  variáveis  dicotômicas, 
e,  em  vez  disso,  usaríamos  k-1  variáveis  dicotômicas, 
onde  kéo  número  de  categorias.  Logo,  usaríamos  duas 
das  variáveis  dicotômicas  para  representar  os  efeitos  da 
renda  familiar. 


Ao  construir  variáveis  dicotômicas,  duas  abordagens  po¬ 
dem  ser  usadas  para  representar  as  categorias,  e,  mais  im¬ 
portante,  a  categoria  que  é  omitida,  conhecida  como  cate¬ 
goria  de  referência  ou  grupo  de  comparação. 

•  A  primeira  abordagem,  conhecida  como  codificação  indica¬ 
dora,  usa  três  maneiras  para  representar  os  níveis  de  renda 
familiar  com  duas  variáveis  dicotômicas,  como  mostrado  na 
Tabela  2-14.  Uma  consideração  importante  é  a  categoria  de 
referência  ou  grupo  de  comparação,  a  categoria  que  recebeu 
todos  os  zeros  para  as  variáveis  dicotômicas.  Por  exemplo, 


na  análise  de  regressão,  os  coeficientes  de  regressão  para 
as  variáveis  dicotômicas  representam  desvios  do  grupo  de 
comparação  sobre  a  variável  dependente.  Os  desvios  repre¬ 
sentam  as  diferenças  entre  escores  médios  da  variável  de¬ 
pendente  para  cada  grupo  de  respondentes  (representado 
por  uma  variável  dicotômica)  e  o  grupo  de  comparação. 
Essa  forma  é  mais  apropriada  em  um  grupo  de  comparação 
lógica,  como  em  um  experimento.  Em  um  experimento  com 
um  grupo  de  controle  que  atua  como  o  grupo  de  compara¬ 
ção,  os  coeficientes  são  as  diferenças  de  médias  da  variá¬ 
vel  dependente  para  cada  grupo  de  tratamento  em  relação 
ao  grupo  de  controle.  Sempre  que  a  codificação  de  variá¬ 
vel  dicotômica  é  usada,  devemos  estar  cientes  do  grupo  de 
comparação  e  lembrar  dos  impactos  que  ele  tem  em  nossa 
interpretação  das  demais  variáveis. 

•  Um  método  alternativo  de  codificação  de  variáveis  dico¬ 
tômicas  se  chama  codificação  de  efeitos.  E  o  mesmo  que 
codificação  indicadora,  exceto  que  o  grupo  de  comparação 
(o  grupo  que  tem  todos  os  zeros  na  codificação  indicadora) 
agora  recebe  o  valor  -1  no  lugar  de  0  para  as  variáveis  dico¬ 
tômicas.  Nesse  caso,  os  coeficientes  representam  diferenças 
de  qualquer  grupo  em  relação  à  média  de  todos  os  grupos, 
e  não  em  relação  ao  grupo  omitido.  Ambas  as  formas  de 
codificação  de  variáveis  dicotômicas  fornecerão  os  mesmos 
resultados;  as  únicas  diferenças  serão  na  interpretação  dos 
coeficientes  das  variáveis  dicotômicas. 

As  variáveis  dicotômicas  são  empregadas  com  mais 
freqüência  em  análise  de  regressão  e  análise  discriminan¬ 
te,  onde  os  coeficientes  têm  interpretação  direta.  Seu  uso 
em  outras  técnicas  multivariadas  é  mais  limitado,  espe¬ 
cialmente  naquelas  que  se  sustentam  em  padrões  de  cor¬ 
relação,  como  análise  fatorial,  pois  a  correlação  de  uma 
variável  binária  não  é  bem  representada  pelo  tradicional 
coeficiente  de  correlação  de  Pearson.  No  entanto,  consi¬ 
derações  especiais  podem  ser  feitas  nesses  casos,  como  se 
discute  nos  capítulos  apropriados. 


TABELA  2-13  Representação  de  variáveis  não-métricas  com  variáveis  dicotômicas 


Variável  não-métrica  com 
duas  categorias  (sexo) 

Variável  não-métrica  com  três 
categorias  (nível  de  renda  familiar) 

Sexo 

Variáveis  dicotômicas 

Nível  de  renda  familiar 

Variáveis  dicotômicas 

Feminino 

Masculino 

0  0 

II  II 

.  .  IN 

><  >< 

3  3 

0  0 

II  II 

se  <  $  15.000 

se>$  15.000  &<$25.000 

se  >  $  25.000 

X3  =  1 ,  ou  X3  =  0 

X4  =  1 ,  ou  X4  =  0 

X5  =  1 ,  ou  X5  =  0 

TABELA  2-14 

três  categorias 

Padrões  alternativos  de  codificação  de  variável  dicotômica  para  uma  variável  não-métrica  com 

Padrão  1 

Padrão  2 

Padrão  3 

Nível  de  renda  familiar  X, 

Xj  X,  X2 

X,  X, 

se  <$15.000  1  0  1  0  0  0 

se  >$  15.000  &<$  25.000  0  1  0  0  1  0 

se  >  $  25.000  0  0  0  1  0  1 
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Resumo 

Pesquisadores  devem  examinar  e  explorar  a  natureza  dos 
dados  e  as  relações  entre  variáveis  antes  da  aplicação  de 
qualquer  técnica  multivariada.  Este  capítulo  ajuda  o  pes¬ 
quisador  a  fazer  o  seguinte: 

Selecionar  o  método  gráfico  adequado  para  examinar  as 
características  dos  dados  ou  relações  de  interesse.  O 

uso  de  técnicas  multivariadas  coloca  um  fardo  adicional 
sobre  o  pesquisador  para  entender,  avaliar  e  interpretar 
os  resultados  mais  complexos.  Ele  demanda  uma  profun¬ 
da  compreensão  das  características  básicas  dos  dados  e 
relações  inerentes.  A  primeira  tarefa  no  exame  de  dados 
é  determinar  o  caráter  dos  dados.  Elma  técnica  simples, 
mas  poderosa,  é  através  de  representações  gráficas,  que 
podem  retratar  as  qualidades  univariadas,  bivariadas  ou 
mesmo  multivariadas  dos  dados  em  um  formato  visual 
para  facilitar  representação  e  análise.  O  ponto  de  partida 
para  compreender  a  natureza  de  uma  única  variável  é 
caracterizar  o  formato  de  sua  distribuição,  o  que  se  con¬ 
segue  com  um  histograma.  O  método  mais  popular  para 
examinar  relações  bivariadas  é  o  diagrama  de  dispersão, 
um  gráfico  de  pontos  de  dados  sobre  duas  variáveis.  Pes¬ 
quisadores  também  devem  examinar  perfis  multivaria- 
dos.  Três  tipos  de  gráficos  são  usados.  O  primeiro  é  um 
retrato  direto  dos  valores  dos  dados,  ou  por  glifos  que 
representam  os  dados  em  círculos,  ou  perfis  multivaria- 
dos  que  fornecem  uma  visualização  por  barras  para  cada 
observação.  Um  segundo  tipo  de  retrato  multivariado 
envolve  uma  transformação  dos  dados  originais  em  uma 
relação  matemática,  que  pode  então  ser  retratada  grafi¬ 
camente.  A  técnica  mais  comum  deste  tipo  é  a  transfor¬ 
mação  de  Fourier.  A  terceira  técnica  gráfica  é  a  repre- 
sentatividade  iconográfica,  sendo  que  a  mais  popular  é  a 
face  de  Chernoff. 

Avaliar  o  tipo  de  potencial  impacto  de  dados  perdi¬ 
dos.  A  despeito  de  alguns  dados  perdidos  poderem  ser 
ignorados,  perda  de  dados  ainda  é  um  dos  aspectos  mais 
problemáticos  na  maioria  dos  planejamentos  de  pesquisa. 
Na  melhor  das  hipóteses,  ela  é  uma  inconveniência  que 
deve  ser  corrigida  para  viabilizar  que  a  maior  parte  pos¬ 
sível  da  amostra  seja  analisada.  Em  situações  mais  com¬ 
plicadas,  porém,  a  perda  de  dados  pode  provocar  sérios 
vieses  nos  resultados  se  não  for  corretamente  identifica¬ 
da  e  acomodada  na  análise.  O  processo  de  quatro  passos 
para  identificação  de  dados  perdidos  e  aplicação  de  ações 
corretivas  é  como  se  segue: 

1.  Determinar  o  tipo  de  dados  perdidos,  e  se  eles  podem  ou 
não  ser  ignorados. 

2.  Determinar  a  extensão  de  perda  de  dados  e  decidir  se  res- 
pondentes  ou  variáveis  devem  ser  eliminados. 

3.  Diagnosticar  a  aleatoriedade  dos  dados  perdidos. 

4.  Selecionar  o  método  de  atribuição  para  estimação  de  dados 
perdidos. 


Compreender  os  diferentes  tipos  de  processos  de  perda 
de  dados.  Um  processo  de  perda  de  dados  é  a  causa  ine¬ 
rente  aos  dados  perdidos,  se  é  algo  envolvendo  o  processo 
de  coleta  de  dados  (questões  pobremente  articuladas  etc.) 
ou  indivíduos  (relutância  ou  falta  de  habilidade  para  res¬ 
ponder  etc.).  Quando  dados  perdidos  não  são  ignoráveis, 
o  processo  de  perda  de  dados  pode  ser  classificado  em  um 
entre  dois  tipos.  O  primeiro  é  MCAR,  que  denota  que 
os  efeitos  do  processo  de  perda  de  dados  estão  distribuí¬ 
dos  ao  acaso  nos  resultados  e  podem  ser  remediados  sem 
qualquer  viés.  O  segundo  é  MAR,  o  qual  denota  o  fato  de 
que  o  processo  inerente  resulta  em  um  viés  (p.  ex.,  taxa 
de  resposta  mais  baixa  por  um  certo  tipo  de  consumidor), 
e  qualquer  ação  corretiva  deve  garantir  que  não  apenas 
“consertará”  os  dados  perdidos,  mas  também  não  incor¬ 
rerá  em  vieses  no  processo. 

Explicar  as  vantagens  e  desvantagens  das  abordagens 
disponíveis  para  lidar  com  dados  perdidos.  As  ações 
corretivas  para  dados  perdidos  seguem  uma  entre  duas 
abordagens:  usar  apenas  dados  válidos,  ou  calcular  da¬ 
dos  de  substituição  para  os  dados  perdidos.  Ainda  que  o 
emprego  de  somente  dados  válidos  pareça  uma  idéia  ra¬ 
zoável,  o  pesquisador  deve  lembrar  que  ao  fazer  isso  não 
se  protege  contra  o  efeito  completo  de  vieses  resultantes 
de  processos  não-aleatórios  de  dados  (MAR).  Logo,  tais 
abordagens  podem  ser  usadas  somente  quando  processos 
aleatórios  de  dados  (MCAR)  estão  presentes,  e  somente 
se  a  amostra  não  está  muito  esgotada  para  a  análise  em 
questão  (lembre-se  que  dados  perdidos  excluem  um  caso 
para  uso  na  análise).  O  cálculo  de  valores  de  substituição 
tenta  atribuir  um  valor  para  cada  caso  perdido,  com  base 
em  critérios  que  variam  do  escore  médio  geral  da  amostra 
para  a  variável  até  características  específicas  do  caso  usa¬ 
das  em  uma  relação  preditiva.  Novamente,  o  pesquisador 
deve  primeiramente  considerar  se  os  efeitos  são  MCAR 
ou  MAR,  e  então  selecionar  uma  ação  corretiva  que  equi¬ 
libre  a  especificidade  da  ação  versus  a  extensão  dos  dados 
perdidos  e  seu  efeito  sobre  generalidade. 

Identificar  observações  atípicas  univariadas,  bivariadas 
e  multivariadas.  Observações  atípicas  são  aquelas  com 
uma  combinação  única  de  características  indicando  que 
elas  são  distintamente  diferentes  das  demais  observações. 
Essas  diferenças  podem  ser  sobre  uma  única  variável  (ob¬ 
servação  atípica  univariada),  uma  relação  entre  duas  va¬ 
riáveis  (observação  atípica  bivariada),  ou  ao  longo  de  um 
conjunto  inteiro  de  variáveis  (caso  multivariado).  Apesar 
de  as  causas  para  observações  atípicas  serem  variadas,  a 
questão  primária  a  ser  resolvida  é  sua  representatividade 
e  se  a  observação  ou  variável  deveria  ser  eliminada  ou  in¬ 
cluída  na  amostra  a  ser  analisada. 

Testar  seus  dados  para  as  suposições  inerentes  à  maioria 
das  técnicas  multivariadas.  Como  nossas  análise  envol¬ 
vem  o  uso  de  uma  amostra  e  não  da  população,  devemos 
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nos  concentrar  no  atendimento  das  suposições  do  pro¬ 
cesso  de  inferência  estatística,  o  que  é  fundamental  para 
todas  as  técnicas  estatísticas  multivariadas.  As  suposições 
mais  importantes  incluem  normalidade,  homocedasticida- 
de,  linearidade  e  ausência  de  erros  correlacionados.  Uma 
vasta  gama  de  testes,  desde  retratos  gráficos  até  medidas 
empíricas,  está  disponível  para  determinar  se  suposições 
estão  sendo  atendidas.  Pesquisadores  se  confrontam  com 
aquilo  que  pode  parecer  uma  tarefa  impossível:  satisfa¬ 
zer  todas  essas  premissas  estatísticas  ou  correr  o  risco  de 
uma  análise  viesada  ou  errônea.  Essas  suposições  estatís¬ 
ticas  são  importantes,  mas  um  julgamento  deve  ser  feito 
para  saber  como  interpretar  os  testes  para  cada  premissa 
e  quando  aplicar  ações  corretivas.  Mesmo  análises  com 
amostras  pequenas  podem  suportar  pequenos,  mas  sig- 
nificantes,  desvios  da  normalidade.  O  que  é  mais  impor¬ 
tante  para  o  pesquisador  é  compreender  as  implicações 
de  cada  suposição  com  relação,  à  técnica  de  interesse, 
buscando  uma  opção  intermediaria  entre  a  necessidade 
de  satisfazer  as  premissas  versus  a  robustez  da  técnica  e 
do  contexto  de  pesquisa. 

Determinar  o  melhor  método  de  transformação  de  dados 
para  nm  problema  específico.  Quando  as  suposições  es¬ 
tatísticas  não  são  atendidas,  isso  não  caracteriza  necessa¬ 
riamente  um  problema  fatal  que  impede  qualquer  análise. 
O  pesquisador  pode  ser  capaz  de  aplicar  qualquer  número 
de  transformações  aos  dados  em  questão  que  resolverão 
o  problema  e  permitirão  satisfazer  as  premissas.  Trans¬ 
formações  de  dados  fornecem  uma  maneira  de  modifi¬ 
car  variáveis  por  uma  entre  duas  razões:  (1)  para  corrigir 
violações  das  suposições  estatísticas  inerentes  às  técnicas 
multivariadas  ou  (2)  para  melhorar  a  relação  (correlação) 
entre  variáveis.  A  maioria  das  transformações  envolve  a 
modificação  de  uma  ou  mais  variáveis  (p.  ex.,  calcular  a 
raiz  quadrada,  o  logaritmo  ou  o  inverso)  e  então  usar  o 
valor  transformado  na  análise.  Deve  ser  observado  que  os 
dados  inerentes  ainda  estão  intactos,  sendo  que  somente 
seu  caráter  de  distribuição  mudou  de  forma  a  atender  às 
premissas  estatísticas  necessárias. 

Entender  como  incorporar  variáveis  não-métricas  como 
métricas.  Uma  consideração  importante  na  escolha  e 
aplicação  da  técnica  multivariada  correta  se  refere  às  pro¬ 
priedades  de  medida  das  variáveis  dependentes  e  indepen¬ 
dentes.  Algumas  das  técnicas,  como  análise  discriminan¬ 
te  ou  análise  multivariada  de  variância,  especificamente 
exigem  dados  não-métricos  como  variáveis  dependentes 
ou  independentes.  Em  muitos  casos,  os  métodos  mul- 
tivariados  exigem  que  variáveis  métricas  sejam  usadas. 
No  entanto,  variáveis  não-métricas  são  freqüentemente 
de  considerável  interesse  ao  pesquisador  em  uma  análise 
particular.  Um  método  está  disponível  para  representar 
uma  variável  não-métrica  com  um  conjunto  de  variáveis 
dicotômicas,  de  modo  que  ele  pode  ser  incluído  em  mui¬ 
tas  das  análises  que  demandam  apenas  variáveis  métricas. 


Uma  variável  dicotômica  é  aquela  que  foi  convertida  para 
uma  distribuição  métrica  e  representa  uma  categoria  de 
uma  variável  independente  não-métrica. 

Tempo  e  esforço  consideráveis  podem  ser  dedicados 
nessas  atividades,  mas  o  pesquisador  prudente  sabiamente 
investe  os  recursos  necessários  para  examinar  cuidadosa¬ 
mente  os  dados  para  garantir  que  os  métodos  multivaria- 
dos  são  aplicados  em  situações  adequadas  e  para  auxiliar 
em  uma  interpretação  mais  profunda  e  esclarecedora  dos 
resultados. 

Questões 

1.  Explique  como  os  métodos  gráficos  podem  complementar 
medidas  empíricas  no  exame  de  dados. 

2.  Faça  uma  lista  das  causas  inerentes  de  observações  atípicas. 
Certifique-se  de  incluir  atribuições  ao  respondente  e  ao  pes¬ 
quisador. 

3.  Discuta  por  que  as  observações  atípicas  podem  ser  classifi¬ 
cadas  como  benéficas  e  problemáticas. 

4.  Diferencie  os  dados  que  são  perdidos  ao  acaso  (MAR)  e  os 
perdidos  completamente  ao  acaso  (MCAR).  Explique  como 
cada  tipo  causa  impacto  na  análise  de  dados  perdidos. 

5.  Descreva  as  condições  sob  as  quais  um  pesquisador  elimina¬ 
ria  um  caso  com  dados  perdidos  versus  as  condições  sob  as 
quais  ele  usaria  um  método  de  atribuição. 

6.  Avalie  a  seguinte  afirmação:  a  fim  de  executar  a  maioria  das 
análises  multivariadas,  não  é  necessário  atender  a  todas  as 
suposições  de  normalidade,  linearidade,  homocedasticidade 
e  independência. 

7.  Discuta  a  seguinte  afirmação:  A  análise  multivariada  pode 
ser  executada  em  qualquer  conjunto  de  dados,  desde  que  o 
tamanho  da  amostra  seja  adequado. 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustram  as  questões 
de  exame  de  dados  em  aplicações  específicas  está  disponí¬ 
vel  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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CAPITULO 


Análise  Fatorial 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Diferenciar  as  técnicas  de  análise  fatorial  de  outras  técnicas  multivariadas. 

■  Distinguir  entre  usos  exploratórios  e  confirmatórios  das  técnicas  analíticas  fatoriais. 

■  Entender  os  sete  estágios  da  aplicação  da  análise  fatorial. 

■  Distinguir  entre  as  análises  fatoriais  R  e  Q. 

■  Identificar  as  diferenças  entre  modelos  de  análise  de  componentes  e  análise  de  fatores  comuns. 

■  Dizer  como  determinar  o  número  de  fatores  a  serem  extraídos. 

■  Explicar  o  conceito  de  rotação  de  fatores. 

■  Descrever  como  nomear  um  fator. 

■  Explicar  os  usos  adicionais  de  análise  fatorial. 

■  Estabelecer  as  principais  limitações  de  técnicas  de  análise  fatorial. 


Apresentação  do  capítulo 

Durante  a  década  passada,  c  use  da  técnica  estatística  multivariada  de  análise  fatorial  aumentou  em 
todas  as  áreas  de  pesquisa  relacionadas  a  negócios.  À  medida  que  o  número  de  variáveis  a  serem 
consideradas  em  técnicas  multivariadas  aumenta,  há  uma  necessidade  proporcional  de  maior  conhe¬ 
cimento  da  estrutura  e  das  inter-relações  das  variáveis.  Este  capítulo  descreve  a  análise  fatorial,  uma 
técnica  particularmente  adequada  para  analisar  os  padrões  de  relações  complexas  multidimensionais 
encontradas  por  pesquisadores.  Este  capítulo  define  e  explica  em  termos  conceituais  amplos  os  aspec¬ 
tos  fundamentais  das  técnicas  analíticas  fatoriais.  A  análise  fatorial  pode  ser  utilizada  para  examinar  os 
padrões  ou  relações  latentes  para  um  grande  número  de  variáveis  e  determinar  se  a  informação  pode 
ser  condensada  ou  resumida  a  um  conjunto  menor  de  fatores  ou  componentes.  Para  melhor  esclarecer 
os  conceitos  metodológicos,  também  foram  incluídas  orientações  básicas  para  apresentar  e  interpretar 
os  resultados  dessas  técnicas. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque,  além  das  referências  cruza¬ 
das  nos  termos-chave,  estão  em  itálico.  Exemplos  ilustrativos 
estão  em  quadros. 

Alfa  de  Cronbach  Medida  de  confiabilidade  que  varia  de  0  a  1 , 
sendo  os  valores  de  0,60  a  0,70  considerados  o  limite  inferior 
de  aceitabilidade. 


Análise  de  agrupamentos  Técnica  multivariada  com  o  objetivo 
de  agrupar  respondentes  ou  casos  com  perfis  similares  em 
um  dado  conjunto  de  características.  Semelhante  ã  análise 
fatorial  Q. 

Análise  de  componentes  Modelo  fatorial  no  qual  os  fatores  são 
baseados  na  variância  total.  Na  análise  de  componentes,  uni¬ 
dades  (Is)  são  usadas  na  diagonal  da  matriz  de  correlação-, 
esse  procedimento  implica  computacionalmente  que  toda  a 
variância  é  comum  ou  compartilhada. 

Análise  de  fatores  comuns  Modelo  fatorial  no  qual  os  fatores 
são  baseados  em  uma  matriz  de  correlação  reduzida.  Ou  seja. 
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comunalidades  são  inseridas  na  diagonai  da  matriz  de  corre¬ 
lação  e  os  fatores  extraídos  são  baseados  apenas  na  variância 
comum,  com  as  variâncias  específicas  e  de  erro  exciuídas. 

Análise  fatorial  Q  Forma  grupos  de  respondentes  ou  casos 
com  base  em  sua  simiiaridade  em  um  conjunto  de  caracterís¬ 
ticas  (ver  também  a  discussão  sobre  anáiise  de  agrupamen¬ 
tos  no  Capítuio  9). 

Análise  fatorial  R  Anaiisa  relações  entre  variáveis  para  iden¬ 
tificar  grupos  de  variáveis  que  formam  dimensões  iatentes 
{fatores). 

Autovalor  Soma  em  coiuna  de  cargas  fatoriais  ao  quadrado 
para  um  fator;  também  conhecido  oomo  raiz  latente.  Repre¬ 
senta  a  quantia  de  variância  explicada  por  um  fator. 

Carga  cruzada  Uma  variável  tem  duas  ou  mais  cargas  fatoriais 
excedendo  o  valor  de  referência  considerado  necessário  para 
inclusão  no  processo  de  interpretação  do  fator. 

Cargas  fatoriais  Correlação  entre  as  variáveis  originais  e  os  fa¬ 
tores,  bem  como  a  chave  para  o  entendimento  da  natureza 
de  um  fator  em  particular.  As  cargas  fatoriais  ao  quadrado 
indicam  qual  percentual  da  variância  em  uma  variável  original 
é  explicado  por  um  fator. 

Comunalidade  Quantia  total  de  variância  que  uma  variável  ori¬ 
ginal  compartilha  com  todas  as  outras  variáveis  incluídas  na 
análise. 

Confiabilidade  Grau  em  que  uma  variável  ou  conjunto  de  variá¬ 
veis  é  consistente  com  o  que  se  pretende  medir.  Se  múltiplas 
medidas  são  realizadas,  as  medidas  confiáveis  serão  muito 
consistentes  em  seus  valores.  É  diferente  de  validade,  no  sen¬ 
tido  de  que  não  se  relaciona  com  o  que  deveria  ser  medido, 
mas  com  o  modo  como  é  medido. 

Definição  conceituai  Especificação  da  base  teórica  para  um 
conceito  representado  por  um  fator. 

EQUIMAX  Um  dos  métodos  de  rotação  fatorial  ortogonal  que  é 
um  “meio-termo”  entre  as  técnicas  VARIMAX  e  QUARTIMAX, 
mas  não  é  amplamente  usado. 

Erro  de  medida  Imprecisões  ao  se  medirem  os  “verdadeiros” 
valores  das  variáveis,  devido  â  falibilidade  do  instrumento  de 
medida  (ou  seja,  escalas  de  resposta  inapropriadas),  aos  er¬ 
ros  na  entrada  de  dados,  ou  aos  erros  dos  respondentes. 

Escalas  múltiplas  Método  de  combinação  de  diversas  variá¬ 
veis  que  medem  o  mesmo  conceito  em  uma  única  variável 
como  tentativa  de  aumentar  a  confiabilidade  da  medida.  Na 
maioria  dos  casos,  as  variáveis  separadas  são  somadas  e  en¬ 
tão  seu  total  ou  escore  médio  é  usado  na  análise. 

Escore  fatorial  Medida  composta  criada  para  cada  observação 
de  cada  fator  extraído  na  análise  fatorial.  Os  pesos  fatoriais 
são  usados  em  conjunção  com  os  valores  da  variável  original 
para  calcular  o  escore  de  cada  observação.  O  escore  fatorial 
pode  então  ser  usado  para  representar  o(s)  fator(es)  em  aná¬ 
lises  subseqüentes.  Os  escores  fatoriais  são  padronizados 
para  que  tenham  uma  média  de  0  e  um  desvio-padrão  de  1 . 

Escore  reverso  Processo  de  reversão  dos  escores  de  uma  va¬ 
riável,  embora  mantenha  as  características  de  distribuição, 
para  mudar  as  relações  (correlações)  entre  duas  variáveis. 
Usado  na  construção  de  escala  múltipla  para  evitar  um  can¬ 
celamento  entre  variáveis  com  cargas  fatoriais  positivas  e  ne¬ 
gativas  no  mesmo  fator. 


Fator  Combinação  linear  (variável  estatística)  das  variáveis  ori¬ 
ginais.  Os  fatores  também  representam  as  dimensões  latentes 
(construtos)  que  resumem  ou  explicam  o  conjunto  original  de 
variáveis  observadas. 

Indeterminância  fatorial  Característica  de  análise  de  fatores 
comuns  tal  que  diversos  escores  fatoriais  diferentes  podem 
ser  calculados  para  um  respondente,  cada  um  se  adequando 
ao  modelo  fatorial  estimado.  Isso  significa  que  os  escores  fa¬ 
toriais  não  são  únicos  para  cada  indivíduo. 

Indicador  Variável  simples  usada  em  conjunção  com  uma  ou 
mais  variáveis  distintas  para  formar  uma  medida  composta. 

Matriz  de  correlação  anti-imagem  Matriz  das  correlações  par¬ 
ciais  entre  variáveis  após  a  análise  fatorial,  e  que  representa  o 
grau  em  que  os  fatores  explicam  um  ao  outro  nos  resultados. 
A  diagonal  contém  as  medidas  de  adequação  da  amostra 
para  cada  variável,  e  os  demais  valores  são  correlações  par¬ 
ciais  entre  variáveis. 

Matriz  de  correlação  Tabela  que  mostra  as  intercorrelações  en¬ 
tre  todas  as  variáveis. 

Matriz  de  estrutura  fatorial  Uma  matriz  fatorial  obtida  em  uma 
rotação  oblíqua  que  representa  as  correlações  simples  entre 
variáveis  e  fatores,  incorporando  a  variância  única  e  as  cor¬ 
relações  entre  fatores.  A  maioria  dos  pesquisadores  prefere 
usar  a  matriz  de  padrão  fatorial  no  momento  da  interpretação 
de  uma  solução  oblíqua. 

Matriz  de  padrão  fatorial  Uma  de  duas  matrizes  fatoriais  em 
uma  rotação  oblíqua  que  é  mais  comparável  com  a  matriz  fa¬ 
torial  em  uma  rotação  ortogonal. 

Matriz  fatorial  Tabela  das  cargas  fatoriais  de  todas  as  variáveis 
sobre  cada  fator. 

Medida  composta  Ver  escala  múltipla. 

Medida  de  adequação  da  amostra  (MSA)  Medida  calculada 
tanto  para  toda  a  matriz  de  correlação  quanto  para  cada  variá¬ 
vel  individual,  e  que  permite  avaliar  o  quão  adequada  é  a  apli¬ 
cação  da  análise  fatorial.  Valores  acima  de  0,50  para  a  matriz 
toda  ou  para  uma  variável  individual  indicam  tal  adequação. 

Multicolinearidade  Grau  em  que  uma  variável  pode  ser  expli¬ 
cada  pelas  outras  variáveis  na  análise. 

Ortogonal  Independência  matemática  (sem  correlação)  de  ei¬ 
xos  fatoriais,  um  em  relação  ao  outro  (ou  seja,  em  ângulos 
retos  ou  de  90  graus). 

QUARTIMAX  Um  tipo  de  método  de  rotação  fatorial  ortogonal  que 
foca  a  simplificação  de  colunas  de  uma  matriz  fatorial.  Geral¬ 
mente  considerada  menos  efetiva  do  que  a  rotação  VARIMAX. 

Raiz  latente  Ver  autovalor. 

Rotação  fatorial  oblíqua  Rotação  fatorial  computada  de  modo 
que  os  fatores  extraídos  são  correlacionados.  Ao  invés  de  res¬ 
tringir  arbitrariamente  a  rotação  fatorial  a  uma  solução  ortogo¬ 
nal,  a  rotação  oblíqua  identifica  o  grau  em  que  cada  fator  está 
correlacionado. 

Rotação  fatorial  ortogonal  Rotação  fatorial  na  qual  os  fatores  são 
extraídos  de  modo  que  seus  eixos  sejam  mantidos  em  90  graus. 
Cada  fator  é  independente,  ou  ortogonal,  em  relação  a  todos  os 
outros.  A  correlação  entre  os  fatores  é  determinada  como  0. 

Rotação  fatorial  Processo  de  manipulação  ou  de  ajuste  dos  ei¬ 
xos  fatoriais  para  conseguir  uma  solução  fatorial  mais  simples 
e  pragmaticamente  mais  significativa. 
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Teste  de  esfericidade  de  Bartiett  Teste  estatístico  da  significância 
geral  de  todas  as  correlações  em  uma  matriz  de  correlação. 

Traço  Representa  a  quantia  total  de  variância  na  qual  a  solução 
fatorial  é  baseada.  O  traço  é  igual  ao  número  de  variáveis, 
baseado  na  suposição  de  que  a  variância  em  cada  variável 
é  igual  a  1. 

Validade  Grau  em  que  uma  medida  ou  um  conjunto  de  medidas 
corretamente  representa  o  conceito  de  estudo  -  o  grau  em 
que  se  está  livre  de  qualquer  erro  sistemático  ou  não-alea- 
tório.  A  validade  se  refere  a  quão  bem  o  conceito  é  definido 
pela(s)  medida(s),  ao  passo  que  confiabilidade  se  refere  á 
consistência  da(s)  medida(s). 

Validade  de  conteúdo  Avaliação  do  grau  de  correspondência 
entre  os  itens  selecionados  para  constituir  uma  escala  múlti¬ 
pla  e  sua  definição  conceituai. 

Validade  de  expressão  Ver  validade  de  conteúdo. 

Variância  comum  Variância  compartilhada  com  outras  variáveis 
na  análise  fatorial. 

Variância  do  erro  Variância  de  uma  variável  devido  a  erros  na 
coleta  de  dados  ou  na  medida. 

Variância  específica  Variância  de  cada  variável,  única  àquela 
variável  e  que  não  é  explicada  ou  associada  com  outras  variá¬ 
veis  na  análise  fatorial. 

Variância  única  Ver  variância  específica. 

Variável  dicotômica  Variável  métrica  binária  usada  para  repre¬ 
sentar  uma  única  categoria  de  uma  variável  não-métrica. 

Variável  estatística  Combinação  linear  de  variáveis  formada  ao 
se  obter  pesos  empíricos  aplicados  a  um  conjunto  de  variá¬ 
veis  especificadas  pelo  pesquisador. 

Variável  substituta  Seleção  de  uma  única  variável  com  a  maior 
carga  fatorial  para  representar  um  fator  no  estágio  de  redução 
de  dados,  em  vez  de  usar  uma  escala  múltipla  ou  um  escore 
fatorial. 

VARIMAX  Os  mais  populares  métodos  de  rotação  fatorial  orto¬ 
gonal,  concentrando-se  na  simplificação  das  colunas  em  uma 
matriz  fatorial.  Geralmente  considerado  superior  a  outros  mé¬ 
todos  de  rotação  fatorial  ortogonal  para  conseguir  uma  estru¬ 
tura  fatorial  simplificada. 


O  QUE  É  ANÁLISE  EATORIAL? 

Análise  fatorial  é  uma  técnica  de  interdependência,  como 
definido  no  Capítulo  1,  cujo  propósito  principal  é  definir  a 
estrutura  inerente  entre  as  variáveis  na  análise.  Obviamen¬ 
te,  variáveis  têm  um  papel  chave  em  qualquer  análise  mul¬ 
tivariada.  Se  estivermos  fazendo  uma  previsão  de  vendas 
com  regressão,  prevendo  sucesso  ou  fracasso  de  uma  nova 
empresa  com  análise  discriminante,  ou  usando  qualquer 
uma  das  demais  técnicas  multivariadas  discutidas  no  Capí¬ 
tulo  1,  devemos  ter  um  conjunto  de  variáveis  sobre  o  qual 
deve-se  formar  relações  (p.  ex.,  quais  são  as  variáveis  que 
melhor  prevêem  vendas  ou  sucesso/fracasso?).  Como  tais, 
as  variáveis  são  os  alicerces  fundamentais  das  relações. 

A  medida  que  empregamos  técnicas  multivariadas, 
por  sua  própria  natureza,  o  número  de  variáveis  aumenta. 


Técnicas  univariadas  são  limitadas  a  uma  única  variável, 
mas  técnicas  multivariadas  podem  ter  dezenas,  centenas 
ou  mesmo  milhares  de  variáveis.  Mas  como  descrevemos 
e  representamos  todas  essas  variáveis?  Certamente,  se 
temos  apenas  umas  poucas  variáveis,  todas  elas  podem 
ser  distintas  e  diferentes.  A  medida  que  acrescentamos 
mais  e  mais  variáveis,  cada  vez  mais  a  sobreposição  (ou 
seja,  correlação)  acontece  entre  as  mesmas.  Em  alguns 
casos,  como  aqueles  nos  quais  estamos  usando  múltiplas 
medidas  para  superar  erro  de  medida  devido  à  medida 
multivariável  (ver  Capítulo  1  para  uma  discussão  mais 
detalhada),  o  pesquisador  ainda  se  esforça  para  uma  cor¬ 
relação  entre  as  variáveis.  Quando  as  variáveis  se  tornam 
correlacionadas,  o  pesquisador  precisa  de  caminhos  para 
gerenciar  essas  variáveis  -  agrupando  variáveis  altamente 
correlacionadas,  rotulando  ou  nomeando  os  grupos,  e  tal¬ 
vez  até  mesmo  criando  uma  nova  medida  composta  que 
possa  representar  cada  grupo  de  variáveis. 

Introduzimos  a  análise  fatorial  como  nossa  primeira  téc¬ 
nica  multivariada  porque  ela  pode  desempenhar  um  papel 
único  na  aplicação  de  outras  técnicas  multivariadas.  Gene¬ 
ricamente  falando,  a  análise  fatorial  fornece  as  ferramentas 
para  analisar  a  estrutura  das  inter-relações  (correlações) 
em  um  grande  número  de  variáveis  (p.  ex.,  escores  de  teste, 
itens  de  teste,  respostas  a  questionários)  definindo  conjun¬ 
tos  de  variáveis  que  são  fortemente  inter-relacionadas,  co¬ 
nhecidos  como  fatores.  Esses  grupos  de  variáveis  (fatores), 
que  são  por  definição  altamente  intercorrelacionadas,  são 
considerados  como  representantes  de  dimensões  dentro 
dos  dados.  Se  estamos  preocupados  apenas  com  a  redução 
do  número  de  variáveis,  então  as  dimensões  podem  orien¬ 
tar  a  criação  de  novas  medidas  compostas.  Por  outro  lado, 
se  temos  uma  base  conceituai  para  compreender  as  rela¬ 
ções  entre  variáveis,  então  as  dimensões  podem  realmente 
ter  significado  para  aquilo  que  elas  coletivamente  represen¬ 
tam.  No  último  caso,  essas  dimensões  podem  corresponder 
a  conceitos  que  não  podem  ser  adequadamente  descritos 
por  uma  única  medida  (p.  ex.,  a  atmosfera  de  uma  loja  é 
definida  por  muitos  componentes  sensoriais  que  devem  ser 
medidos  separadamente  mas  são  todos  relacionados  entre 
si).  Veremos  que  a  análise  fatorial  apresenta  diversas  ma¬ 
neiras  de  representação  desses  grupos  de  variáveis  para  uso 
em  outras  técnicas  multivariadas. 

Devemos  observar  neste  ponto  que  técnicas  analíticas 
fatoriais  podem  atingir  seus  objetivos  ou  de  uma  perspecti¬ 
va  exploratória,  ou  de  uma  perspectiva  confirmatória.  Exis¬ 
te  um  debate  contínuo  sobre  o  papel  apropriado  da  aná¬ 
lise  fatorial.  Muitos  pesquisadores  consideram-na  apenas 
exploratória,  útil  na  busca  da  estrutura  em  um  conjunto  de 
variáveis  ou  como  um  método  de  redução  de  dados.  Sob 
essa  perspectiva,  as  técnicas  analíticas  fatoriais  “conside¬ 
ram  o  que  os  dados  oferecem”  e  não  estabelecem  restrições 
a  priori  sobre  a  estimação  de  componentes  nem  sobre  o  nú¬ 
mero  de  componentes  a  serem  extraídos.  Para  muitas  -  tal¬ 
vez  a  maioria  -  das  aplicações,  esse  uso  da  análise  fatorial  é 
adequado.  No  entanto,  em  outras  situações,  o  pesquisador 
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tem  idéias  preconcebidas  sobre  a  real  estrutura  dos  dados, 
baseado  em  suporte  teórico  ou  em  pesquisas  anteriores. 
Ele  pode  desejar  testar  hipóteses  envolvendo  questões  so¬ 
bre,  por  exemplo,  quais  variáveis  deveriam  ser  agrupadas 
em  um  fator,  ou  o  número  exato  de  fatores.  Nesses  casos,  o 
pesquisador  espera  que  a  análise  fatorial  desempenhe  um 
papel  confirmatório  -  ou  seja,  avalie  o  grau  em  que  os  da¬ 
dos  satisfazem  a  estrutura  esperada.  Os  métodos  que  discu¬ 
timos  neste  capítulo  não  fornecem  diretamente  a  estrutura 
necessária  para  testes  de  hipóteses  formalizadas.  Aborda¬ 
mos  explicitamente  a  perspectiva  confirmatória  da  análise 
fatorial  no  Capítulo  11.  Neste  capítulo,  porém,  vemos  as 
técnicas  analíticas  fatoriais  principalmente  de  um  ponto  de 
vista  exploratório  ou  não-confirmatório. 


UM  EXEMPLO  HIPOTÉTICO 
DE  ANÁLISE  EATORIAL 

Considere  que,  durante  uma  pesquisa  qualitativa,  uma 
empresa  de  varejo  tenha  identificado  80  características 
diferentes  de  lojas  de  varejo  e  seus  serviços  que,  segundo 
os  consumidores,  afetaram  sua  preferência  entre  lojas.  O 
varejista  quer  entender  como  os  consumidores  tomam  de¬ 
cisões,  mas  sente  que  não  pode  avaliar  80  características 
separadas  ou  desenvolver  planos  de  ação  para  todas  essas 
variáveis,  pois  elas  são  específicas  demais.  Em  vez  disso, 
o  varejista  gostaria  de  saber  se  os  consumidores  pensam 
em  dimensões  de  avaliação  mais  gerais,  ao  invés  de  itens 
específicos.  Por  exemplo,  consumidores  podem  conside¬ 
rar  vendedores  como  uma  dimensão  avaliativa  mais  geral 
que  é  composta  de  muitas  outras  características  específi¬ 
cas,  como  conhecimento,  cortesia,  empatia,  sensibilidade, 
simpatia,  prontidão  e  assim  por  diante. 

Para  identificar  essas  dimensões  mais  amplas,  o  vare¬ 
jista  poderia  encomendar  uma  pesquisa  que  sondasse  as 
avaliações  dos  consumidores  sobre  cada  um  dos  80  itens 
específicos.  A  análise  fatorial  seria  então  usada  para  iden¬ 
tificar  as  dimensões  de  avaliação  latentes.  Itens  específi¬ 
cos  altamente  correlacionados  são  considerados  um  ele¬ 
mento  daquela  dimensão  mais  ampla.  Essas  dimensões  se 
tornam  composições  de  variáveis  específicas,  as  quais,  por 
sua  vez,  permitem  que  as  dimensões  sejam  interpretadas 
e  descritas.  Em  nosso  exemplo,  a  análise  fatorial  poderia 
identificar  dimensões,  como  diversidade  de  produtos,  qua¬ 
lidade  de  produtos,  preços,  profissionais  da  loja,  serviço  e 
atmosfera  da  loja  como  as  dimensões  de  avaliação  usadas 
pelos  respondentes.  Cada  uma  dessas  dimensões  contém 
itens  específicos  que  são  uma  faceta  da  dimensão  avalia¬ 
tiva  mais  ampla.  A  partir  dessas  descobertas,  o  varejista 
pode  então  usar  as  dimensões  (fatores)  para  definir  áreas 
amplas  de  planejamento  e  ação. 

Este  exemplo  simples  de  análise  fatorial  demonstra 
seu  objetivo  básico  de  agrupar  variáveis  altamente  cor¬ 
relacionadas  em  conjuntos  distintos  (fatores).  Em  mui¬ 
tas  situações,  esses  fatores  podem  fornecer  uma  grande 


Um  exemplo  ilustrativo  de  uma  aplicação  simples  da 
análise  fatorial  é  mostrado  na  Figura  3-i,  a  qual  repre¬ 
senta  a  matriz  de  correlação  para  nove  elementos  da 
imagem  de  uma  loja.  Incluídos  nesse  conjunto  estão  me¬ 
didas  da  oferta  de  produtos,  pessoal,  níveis  de  preço,  e 
serviços  e  experiências  internos.  A  questão  que  um  pes¬ 
quisador  pode  querer  levantar  é:  aqueles  elementos  to¬ 
dos  são  separados  no  que  se  refere  às  suas  propriedades 
de  avaliação,  ou  eles  se  “agrupam”  em  algumas  áreas 
mais  gerais  de  avaliação?  Por  exemplo,  será  que  todos 
os  elementos  dos  produtos  se  agrupam?  Onde  o  nível  de 
preço  se  encaixa  ou  está  separado?  Como  as  característi¬ 
cas  internas  (p.ex.,  pessoal,  serviço  e  atmosfera)  se  rela¬ 
cionam  umas  com  as  outras?  A  inspeção  visual  da  matriz 
de  correlação  original  (Figura  3-f,  parte  1)  não  revela 
facilmente  qualquer  padrão  específico.  Há  correlações 
elevadas  espalhadas,  mas  os  agrupamentos  de  variáveis 
não  são  óbvios.  A  aplicação  da  análise  fatorial  resulta 
no  agrupamento  de  variáveis,  como  se  reflete  na  parte 
2  da  Figura  3-1.  Aqui  alguns  padrões  interessantes  apa¬ 
recem.  Primeiro,  quatro  variáveis  relacionadas  com  ex¬ 
periências  internas  de  clientes  são  colocadas  juntas.  Em 
seguida,  três  variáveis  que  descrevem  a  diversidade  e  a 
disponibilidade  de  produtos  são  agrupadas.  Finalmente, 
a  qualidade  de  produto  e  os  níveis  de  preço  formam  ou¬ 
tro  grupo.  Cada  grupo  representa  um  conjunto  de  variá¬ 
veis  altamente  inter-relacionadas  que  pode  refletir  uma 
dimensão  avaliativa  mais  geral.  Nesse  caso,  poderíamos 
rotular  os  três  agrupamentos  de  variáveis  pelos  nomes 
experiência  interna,  oferta  de  produtos  e  valor. 


quantidade  de  informação  sobre  as  inter-relações  das 
variáveis.  Neste  exemplo,  a  análise  fatorial  identificou 
para  gerenciamento  de  loja  um  conjunto  menor  de  con¬ 
ceitos  para  se  considerar  em  qualquer  plano  de  marke¬ 
ting  estratégico  ou  tático,  enquanto  ainda  fornece  uma 
visão  sobre  o  que  constitui  cada  área  geral  (i.e.,  as  variá¬ 
veis  individuais  definindo  cada  fator). 


PROCESSO  DE  DECISÃO  EM 
ANÁLISE  EATORIAL 

Centralizamos  a  discussão  de  análise  fatorial  sobre  o  para¬ 
digma  da  construção  de  modelo  em  seis  estágios  introdu¬ 
zido  no  Capítulo  1.  A  Figura  3-2  mostra  os  três  primeiros 
estágios  do  tratamento  estruturado  para  construção  de 
modelo  multivariado,  e  a  Figura  3-4  detalha  os  três  está¬ 
gios  finais,  acrescidos  de  um  estágio  adicional  (estágio  7), 
além  da  estimação,  interpretação  e  validação  dos  mode¬ 
los  fatoriais,  que  ajuda  a  selecionar  variáveis  substitutas, 
computar  escores  fatoriais  ou  criar  escalas  múltiplas  para 
uso  em  outras  técnicas  multivariadas.  Uma  discussão  de 
cada  estágio  vem  a  seguir. 
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PARTE  1 :  MATRIZ  ORIGINAL  DE  CORRELAÇÃO 


V2 

V, 

K 

Vs 

Ve 

V, 

Ve 

Ve 

l/,  Nível  de  preço 

1,000 

14  Pessoal  da  loja 

0,427 

1,000 

14  Política  de  devolução 

0,302 

0,771 

1,000 

14  Disponibilidade  do  produto 

0,470 

0,497 

0,427 

1,000 

14  Qualidade  do  produto 

0,765 

0,406 

0,307 

0,427 

1,000 

14  Profundidade  de  diversidade 

0,281 

0,445 

0,423 

0,713 

0,325 

1,000 

14  Amplidão  da  diversidade 

0,345 

0,490 

0,471 

0,719 

0,378 

0,724 

1,000 

14  Serviço  interno 

0,242 

0,719 

0,733 

0,428 

0,240 

0,311 

0,435 

1,000 

14  Atmosfera  da  loja 

0,372 

0,737 

0,774 

0,479 

0,326 

0,429 

0,466 

0,710 

1,000 

PARTE  2:  MATRIZ  DE  CORRELAÇÃO  DE  VARIÃVEIS  APÓS  AGRUPAMENTO  DE  ACORDO  COM  ANÃLISE  FATORIAL 

''a 

<^8 

V, 

V, 

V, 

1^4 

V, 

Vs 

14  Política  de  retorno 

1,000 

14  Serviço  interno 

0,773 

1,000 

14  Atmosfera  da  loja 

0,771 

0,710 

1,000 

14  Pessoal  da  loja 

0,771 

0,719 

0,737 

1,000 

14  Profundidade  de  diversidade 

0,423 

0,311 

0,429 

0,445 

1,000 

14  Amplidão  de  diversidade 

0,471 

0,435 

0,466 

0,490 

0,724 

1,000 

14  Disponibilidade  do  produto 

0,427 

0,428 

0,479 

0,497 

0,713 

0,729 

1,000 

14  Nível  de  preço 

0,302 

0,242 

0,372 

0,427 

0,281 

0,354 

0,470 

1,000 

14  Qualidade  do  produto 

0,307 

0,240 

0,326 

0,406 

0,325 

0,378 

0,427 

0,765 

1,000 

Nota:  Áreas  sombreadas  representam  variáveis  agrupadas  por  análise  fatoriai. 

FIGURA  3-1  Exemplo  ilustrativo  do  uso  de  análise  fatorial  para  identificar  estrutura  dentro  de  um  grupo  de  variáveis. 


Estágio  1:  Objetivos  da  análise  fatorial 

O  ponto  de  partida  em  análise  fatorial,  bem  como  em 
outras  técnicas  estatísticas,  é  o  problema  de  pesquisa.  O 
propósito  geral  de  técnicas  de  análise  fatorial  é  encontrar 
um  modo  de  condensar  (resumir)  a  informação  contida 
em  diversas  variáveis  originais  em  um  conjunto  menor  de 
novas  dimensões  compostas  ou  variáveis  estatísticas  (fa¬ 
tores)  com  uma  perda  mínima  de  informação  -  ou  seja, 
buscar  e  definir  os  construtos  fundamentais  ou  dimensões 
assumidas  como  inerentes  às  variáveis  originais  [18,33]. 
Ao  atingir  seus  objetivos,  a  análise  fatorial  é  ajustada  com 
quatro  questões:  especificação  da  unidade  de  análise;  ob¬ 
tenção  do  resumo  de  dados  e/ou  redução  dos  mesmos;  se¬ 
leção  de  variáveis  e  uso  de  resultados  da  análise  fatorial 
com  outras  técnicas  multivariadas. 

Especificação  da  unidade  de  análise 

Até  agora,  definimos  análise  fatorial  somente  em  termos  da 
identificação  de  estrutura  em  um  conjunto  de  variáveis.  Aná¬ 
lise  fatorial  é,  na  verdade,  um  modelo  mais  geral,  no  sentido 
de  que  ela  pode  identificar  a  estrutura  de  relações  entre  va¬ 
riáveis  ou  respondentes  pelo  exame  ou  de  correlações  entre 
as  variáveis,  ou  de  correlações  entre  os  respondentes. 


•  Se  o  objetivo  da  pesquisa  fosse  resumir  as  características, 
a  análise  fatorial  seria  aplicada  a  uma  matriz  de  correlação 
das  variáveis.  Esse  é  o  tipo  mais  comum  de  análise  fatorial 
e  é  chamado  de  análise  fatorial  R,  que  analisa  um  conjunto 
de  variáveis  para  identificar  as  dimensões  latentes  (que  não 
são  fáceis  de  observar). 

•  A  análise  fatorial  também  pode  ser  aplicada  a  uma  matriz 
de  correlação  dos  respondentes  individuais  baseada  nas 
características  dos  mesmos.  Chamado  de  análise  fatorial 
Q,  este  método  combina  ou  condensa  grandes  números  de 
pessoas  em  diferentes  grupos  de  uma  população  maior.  A 
análise  fatorial  Q  não  é  utilizada  muito  freqüentemente 
por  causa  das  dificuldades  computacionais.  Em  vez  disso,  a 
maioria  dos  pesquisadores  utiliza  algum  tipo  de  análise  de 
agrupamentos  (ver  Capítulo  9)  para  agrupar  respondentes 
individuais.  Ver  também  Stewart  [36]  para  outras  possíveis 
combinações  de  grupos  e  tipos  de  variáveis. 

Assim,  o  pesquisador  deve  primeiramente  selecionar 
a  unidade  de  análise  para  a  análise  fatorial:  variáveis  ou 
respondentes.  Ainda  que  nos  concentremos  prioritaria¬ 
mente  na  estruturação  de  variáveis,  a  opção  de  empregar 
análise  fatorial  entre  respondentes  como  uma  alternativa 
para  a  análise  de  agrupamentos  também  está  disponível. 
As  implicações  em  termos  da  identificação  de  variáveis  ou 
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Estágio  1 


Problema  de  pesquisa 
A  análise  é  exploratória  ou  confirmatória? 
Selecione  objetivo(s): 

Resumo  de  dados  e  identificação  de  estruturas 
Redução  de  dados 


I - 

Confirmatória 


Modelagem  de  equações  estruturais 
(Capítulos  10  e  11) 


Exploratória 


Estágio  2 


Análise  fatorial  do  tipo  Q  ou 


Estágio  3 


Análise  fatorial  do  tipo  R 


FIGURA  3-2  Estágios  1  -3  no  diagrama  de  decisão  da  análise  fatorial. 


respondentes  similares  serão  discutidas  no  estágio  2  quan¬ 
do  a  matriz  de  correlação  for  definida. 

Obtenção  do  resumo  versus  redução  de  dados 

A  análise  fatorial  fornece  ao  pesquisador  duas  saídas 
distintas  mas  relacionadas:  resumo  de  dados  e  redução 
de  dados.  No  resumo  de  dados,  a  análise  fatorial  obtém 


dimensões  inerentes  que,  quando  interpretadas  e  com¬ 
preendidas,  descrevem  os  dados  em  um  número  muito 
menor  de  conceitos  do  que  as  variáveis  individuais  origi¬ 
nais.  Redução  de  dados  estende  esse  processo  derivando 
um  valor  empírico  (escore  fatorial)  para  cada  dimensão 
(fator)  e  então  substituindo  o  valor  original  por  esse 
novo  valor. 
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Resumo  de  dados.  O  conceito  fundamental  envolvido 
no  resumo  de  dados  é  a  definição  de  estrutura.  Através 
da  estrutura,  o  pesquisador  pode  ver  o  conjunto  de  variá¬ 
veis  em  diversos  níveis  de  generalização,  variando  do  ní¬ 
vel  mais  detalhado  (as  próprias  variáveis  individuais)  até 
o  nível  mais  generalizado,  onde  variáveis  individuais  são 
agrupadas  e  então  vistas  não  por  aquilo  que  elas  repre¬ 
sentam  individualmente,  mas  por  aquilo  que  representam 
coletivamente  na  expressão  de  um  conceito. 


Por  exemplo,  variáveis  no  nível  individual  poderiam  ser: 
“Compro  coisas  especiais”,  “Geralmente  procuro  os  me¬ 
nores  preços  possíveis”,  “Compro  produtos  em  promo¬ 
ções”,  “Marcas  nacionais  valem  mais  a  pena  do  que  mar¬ 
cas  próprias”.  Coletivamente  essas  variáveis  poderiam  ser 
usadas  para  identificar  consumidores  que  são  “conscientes 
sobre  preços”  ou  “caçadores  de  promoções”. 


A  análise  fatorial,  enquanto  técnica  de  interdepen¬ 
dência,  difere  das  fécnicas  de  dependência  discutidas  na 
próxima  seção  (i.e.,  regressão  múltipla,  análise  discrimi¬ 
nante,  análise  multivariada  de  variância  ou  análise  con¬ 
junta)  onde  uma  ou  mais  variáveis  são  explicitamente 
consideradas  o  critério  ou  variáveis  dependentes,  e  todas 
as  outras  são  as  variáveis  preditoras  ou  independentes. 
Na  análise  fatorial,  todas  as  variáveis  são  simultanea¬ 
mente  consideradas  sem  distinção  quanto  ao  seu  caráter 
de  dependência  ou  independência.  A  análise  fatorial  ain¬ 
da  emprega  o  conceito  de  variável  estatística,  a  composi¬ 
ção  linear  de  variáveis,  mas  em  análise  fatorial  as  variá¬ 
veis  estatísticas  (fatores)  são  formadas  para  maximizar 
sua  explicação  do  conjunfo  infeiro  de  variáveis,  e  não 
para  prever  uma  ou  mais  variáveis  dependenfes.  A  mefa 
do  resumo  de  dados  é  afingida  definindo-se  um  pequeno 
número  de  fatores  que  adequadamente  representam  o 
conjunto  original  de  variáveis. 

Se  fizéssemos  uma  analogia  com  técnicas  de  dependên¬ 
cia,  seria  no  sentido  de  que  cada  uma  das  variáveis  obser¬ 
vadas  (originais)  é  uma  variável  dependente,  que  é  uma 
função  de  alguns  conjuntos  inerentes  e  latentes  de  fatores 
(dimensões),  que  são  por  sua  vez  compostos  por  todas  as 
outras  variáveis.  Assim,  cada  variável  é  prevista  por  todos 
os  fatores  e,  indiretamente,  por  todas  as  demais  variáveis. 
Reciprocamente,  pode-se  olhar  cada  fator  (variável  esta¬ 
tística)  como  uma  variável  dependente,  que  é  uma  função 
do  conjunto  inteiro  de  variáveis  observadas.  Qualquer 
analogia  ilustra  as  diferenças  de  meta  entre  técnicas  de 
dependência  (previsão)  e  interdependência  (identificação 
de  estrutura).  Estrutura  se  define  pelas  relações  entre  va¬ 
riáveis,  viabilizando  a  especificação  de  um  número  menor 
de  dimensões  (fatores)  representando  o  conjunto  original 
de  variáveis. 

Redução  de  dados.  A  análise  fatorial  também  pode  ser 
usada  para  conseguir  redução  de  dados  pela  (1)  identi¬ 


ficação  de  variáveis  representativas  a  partir  de  um  con¬ 
junto  muito  maior  de  variáveis  para  uso  em  análises 
multivariadas  subseqüentes,  ou  (2)  pela  criação  de  um 
conjunto  inteiramente  novo  de  variáveis,  muito  menor, 
para  substituir  parcial  ou  completamente  o  conjunto 
original  de  variáveis.  Em  ambos  os  casos,  o  propósito  é 
manter  a  natureza  e  o  caráter  das  variáveis  originais,  mas 
reduzir  seu  número  para  simplificar  a  análise  multivaria¬ 
da  a  ser  empregada  a  seguir.  Ainda  que  as  técnicas  multi¬ 
variadas  tenham  sido  desenvolvidas  para  acomodar  múl¬ 
tiplas  variáveis,  o  pesquisador  está  sempre  procurando 
o  conjunto  mais  parcimonioso  de  variáveis  para  incluir 
na  análise.  Como  discutido  no  Capítulo  1,  tanto  questões 
conceituais  quanto  empíricas  apóiam  a  criação  de  medi¬ 
das  compostas.  A  análise  fatorial  fornece  a  base  empírica 
para  avaliar  a  estrutura  de  variáveis  e  o  potencial  para 
criar  essas  medidas  compostas  ou  selecionar  um  subcon¬ 
junto  de  variáveis  representativas  para  análise  posterior. 

O  resumo  de  dados  faz  da  identificação  das  dimensões 
ou  fatores  latentes  um  fim  em  si  próprio.  Assim,  as  esti¬ 
mativas  dos  fatores  e  as  contribuições  de  cada  variável 
aos  fatores  (chamadas  de  cargas)  são  tudo  o  que  requer  a 
análise.  A  redução  de  dados  também  depende  de  cargas 
fatoriais,  mas  elas  são  usadas  como  a  base  para  identificar 
variáveis  para  análises  posteriores  com  outras  técnicas  ou 
para  fazer  estimativas  dos  próprios  fatores  (escores  fa¬ 
toriais  ou  escalas  múltiplas),  as  quais  substituem  as  va¬ 
riáveis  originais  em  análises  subseqüentes.  O  método  de 
calcular  e  interpretar  cargas  fatoriais  será  apresentado 
posteriormente. 

Seleção  de  variáveis 

Seja  a  análise  fatorial  usada  para  redução  e/ou  resumo 
de  dados,  o  pesquisador  deve  sempre  considerar  as  bases 
conceituais  das  variáveis  e  julgar  quanto  à  adequação  das 
variáveis  para  a  análise  fatorial. 

•  Em  ambos  os  usos  da  análise  fatorial,  o  pesquisador  impli¬ 
citamente  especifica  as  dimensões  potenciais  que  podem  ser 
identificadas  por  meio  do  caráter  e  da  natureza  das  variá¬ 
veis  submetidas  à  análise  fatorial.  Por  exemplo,  ao  avaliar 
as  dimensões  de  imagem  da  loja,  se  nenhuma  questão  sobre 
pessoal  da  loja  for  incluída,  a  análise  fatorial  não  será  capaz 
de  identificar  tal  dimensão. 

•  O  pesquisador  deve  também  lembrar  que  análise  fatorial 
sempre  produzirá  fatores.  Assim,  a  análise  fatorial  é  sem¬ 
pre  um  candidato  potencial  para  o  fenômeno  “lixo  dentro, 
lixo  fora”.  Se  o  pesquisador  incluir  indiscriminadamente  um 
grande  número  de  variáveis  e  esperar  que  a  análise  fatorial 
“arrume  as  coisas”,  então  torna-se  elevada  a  possibilidade 
de  resultados  pobres.  A  qualidade  e  o  significado  dos  fato¬ 
res  obtidos  reflete  as  bases  conceituais  das  variáveis  incluí¬ 
das  na  análise. 

Obviamente,  o  emprego  da  análise  fatorial  como  uma 
técnica  de  resumo  de  dados  baseia-se  em  ter  uma  base 
conceituai  para  qualquer  variável  analisada.  Mas  ainda 
que  a  análise  fatorial  seja  usada  apenas  para  fins  de  re- 
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dução  de  dados,  ela  é  mais  eficiente  quando  dimensões 
conceitualmente  definidas  podem  ser  representadas  pelos 
fatores  obtidos. 

Uso  de  análise  fatorial  com  outras 
técnicas  multivariadas 

A  análise  fatorial,  por  fornecer  uma  visão  muito  direta 
das  inter-relações  entre  variáveis  e  a  estrutura  subjacente 
dos  dados,  é  um  excelente  ponto  de  partida  para  muitas 
outras  técnicas  multivariadas.  Da  perspectiva  do  resumo 
de  dados,  a  análise  fatorial  fornece  ao  pesquisador  uma 
clara  compreensão  sobre  quais  variáveis  podem  atuar  jun¬ 
tas  e  quantas  variáveis  podem  realmente  ser  consideradas 
como  tendo  impacto  na  análise. 

•  Variáveis  determinadas  como  altamente  correlacionadas  e 
membros  do  mesmo  fator  devem  ter  perfis  semelhantes  de 
diferenças  ao  longo  de  grupos  em  análise  multivariada  de 
variância  ou  em  análise  discriminante. 

•  Variáveis  altamente  correlacionadas,  como  aquelas  dentro 
de  um  fator,  afetam  os  procedimentos  por  etapas  de  regres¬ 
são  múltipla  e  análise  discriminante  que  seqüencialmente 
incluem  variáveis  com  base  em  seu  poder  preditivo  incre¬ 
mental  sobre  variáveis  já  presentes  no  modelo.  Quando  se 
inclui  uma  variável  de  um  fator,  torna-se  menos  provável 
que  variáveis  adicionais  do  mesmo  fator  sejam  também  in¬ 
cluídas,  devido  a  suas  elevadas  correlações  com  variáveis 
já  presentes  no  modelo,  o  que  significa  que  elas  têm  pouco 
poder  preditivo  a  ser  acrescentado.  Isso  não  significa  que 
as  outras  variáveis  do  fator  são  menos  importantes  ou  têm 
menor  impacto,  mas  que  seus  efeitos  já  estão  representados 
pela  variável  incluída  do  fator.  Assim,  o  conhecimento  em 
si  da  estrutura  das  variáveis  daria  ao  pesquisador  uma  me¬ 
lhor  compreensão  da  razão  por  trás  da  entrada  de  variáveis 
nesta  técnica. 

A  visão  dada  pelo  resumo  de  dados  pode  ser  direta¬ 
mente  incorporada  em  outras  técnicas  multivariadas  por 
meio  de  qualquer  técnica  de  redução  de  dados.  A  análise 
fatorial  fornece  a  base  para  a  criação  de  um  novo  con¬ 
junto  de  variáveis  que  incorporam  o  caráter  e  a  natureza 
das  variáveis  originais  em  um  número  muito  menor  de 
novas  variáveis,  usando  variáveis  representativas,  escores 
fatoriais  ou  escalas  múltiplas.  Dessa  maneira,  problemas 
associados  com  grandes  números  de  variáveis  ou  altas 
intercorrelações  entre  variáveis  podem  ser  substancial¬ 
mente  reduzidos  pela  substituição  das  novas  variáveis.  O 
pesquisador  pode  se  beneficiar  com  a  estimação  empírica 
de  relações,  bem  como  com  a  visão  do  fundamento  con¬ 
ceituai  e  da  interpretação  dos  resultados. 

Estágio  2:  Planejamento  de  nma  análise  fatorial 

O  planejamento  de  uma  análise  fatorial  envolve  três  deci¬ 
sões  básicas:  (1)  cálculo  dos  dados  de  entrada  (uma  matriz 
de  correlação)  para  atender  os  objetivos  especificados  de 
agrupamento  de  variáveis  ou  respondentes;  (2)  planeja¬ 
mento  do  estudo  em  termos  de  número  de  variáveis,  pro¬ 


priedades  de  medida  das  variáveis  e  tipos  de  variáveis  ad¬ 
missíveis;  e  (3)  o  tamanho  necessário  para  a  amostra  em 
termos  absolutos  e  como  função  do  número  de  variáveis 
na  análise. 

Correlações  entre  variáveis  ou  respondentes 

A  primeira  decisão  no  planejamento  de  uma  análise  fa¬ 
torial  focaliza  o  cálculo  dos  dados  de  entrada  para  a  aná¬ 
lise.  Discutimos  anteriormente  as  duas  formas  de  análise 
fatorial:  análise  fatorial  do  tipo  R  versus  tipo  Q.  Ambos 
os  tipos  utilizam  uma  matriz  de  correlação  como  os  da¬ 
dos  de  entrada  básicos.  Com  a  análise  fatorial  do  tipo  R, 
o  pesquisador  usaria  uma  matriz  tradicional  de  correla¬ 
ção  (correlações  entre  variáveis)  como  entrada.  Mas  o 
pesquisador  poderia  também  escolher  a  opção  de  obter 
a  matriz  de  correlação  a  partir  das  correlações  entre  os 
respondentes  individuais.  Nessa  análise  fatorial  de  tipo  Q, 
os  resultados  seriam  uma  matriz  fatorial  que  identificaria 
indivíduos  semelhantes. 


Por  exemplo,  se  os  respondentes  individuais  são  identi¬ 
ficados  por  números,  o  padrão  fatorial  resultante  pode 
nos  dizer  que  os  indivíduos  1,  5,  6  e  7  são  semelhantes. 
Do  mesmo  modo,  os  respondentes  2,  3,  4  e  8  talvez  ocu¬ 
passem  juntos  um  outro  fator,  e  então  os  rotularíamos 
como  semelhantes. 


Dos  resultados  de  uma  análise  fatorial  Q,  poderíamos 
identificar  grupos  ou  agrupamentos  de  indivíduos  que  de¬ 
monstrassem  um  padrão  parecido  nas  variáveis  incluídas 
na  análise. 

Uma  questão  lógica  neste  ponto  seria:  de  que  forma 
a  análise  fatorial  do  tipo  Q  difere  da  análise  de  agrupa¬ 
mentos,  uma  vez  que  ambas  comparam  o  padrão  de  res¬ 
postas  ao  longo  de  várias  variáveis  e  estabelecem  os  res¬ 
pondentes  em  grupos?  A  resposta  é  que  a  análise  fatorial 
Q  é  baseada  nas  intercorrelações  entre  os  respondentes, 
enquanto  a  análise  de  agrupamentos  forma  grupos  com 
base  em  uma  medida  de  similaridade  dada  em  termos  de 
distância  entre  os  escores  dos  respondentes  para  as  variá¬ 
veis  que  são  analisadas. 


Para  ilustrar  essa  diferença,  considere  a  Figura  3-3,  que 
contém  os  escores  de  quatro  respondentes  para  três  va¬ 
riáveis  diferentes.  Uma  análise  fatorial  do  tipo  Q  desses 
quatro  respondentes  produziria  dois  grupos  com  estru¬ 
turas  de  covariância  semelhantes,  que  consistiria  nos 
respondentes  A  e  C  versus  B  e  D.  Em  contrapartida, 
a  análise  de  agrupamentos  seria  sensível  às  distâncias 
reais  entre  os  escores  dos  respondentes  e  conduziria  a 
um  agrupamento  dos  pares  mais  próximos.  Logo,  com 
uma  análise  de  agrupamentos,  os  respondentes  A  e  B 
seriam  colocados  em  um  grupo,  e  C  e  D,  em  outro. 
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Respondente  D 
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FIGURA  3-3  Comparações  de  perfis  de  escore  para  análise  fatorial  do  tipo  Q  e  análise  de  agrupamentos. 


Se  o  pesquisador  decidir  empregar  análise  fatorial  do 
tipo  Q,  essas  diferenças  em  relação  às  técnicas  tradicio¬ 
nais  de  análise  de  agrupamentos  deverão  ser  notadas. 
Com  a  disponibilidade  de  outras  técnicas  de  agrupamento 
e  o  amplo  uso  de  análise  fatorial  para  redução  e  resumo 
de  dados,  o  restante  da  discussão  neste  capítulo  focaliza 
a  análise  fatorial  do  tipo  R,  o  agrupamento  de  variáveis  e 
não  de  respondentes. 

Questões  sobre  seleção  de  variáveis  e  medidas 

Duas  questões  específicas  devem  ser  respondidas  nes¬ 
te  ponto:  (1)  quais  tipos  de  variáveis  podem  ser  usadas 
em  análise  fatorial?  e  (2)  quantas  variáveis  devem  ser 
incluídas?  Em  termos  dos  tipos  de  variáveis  incluídas,  o 
requisito  principal  é  que  um  valor  de  correlação  possa 
ser  calculado  entre  todas  as  variáveis.  Variáveis  métricas 
são  facilmente  medidas  por  vários  tipos  de  correlações. 
Variáveis  não-métricas,  contudo,  são  mais  problemáti¬ 
cas  por  não  poderem  usar  os  mesmos  tipos  de  medida  de 
correlação  empregados  em  variáveis  métricas.  Apesar  de 
alguns  métodos  especializados  calcularem  correlações  en¬ 
tre  variáveis  não-métricas,  a  abordagem  mais  prudente  é 
evitá-las.  Se  uma  variável  não-métrica  deve  ser  incluída, 
um  método  é  definir  variáveis  dicotômicas  (codificadas 
como  0  e  1)  para  representarem  categorias  de  variáveis 
não-métricas.  Se  todas  as  variáveis  são  dicotômicas,  então 
formas  especializadas  de  análise  fatorial,  como  análise  fa¬ 
torial  booleana,  são  mais  adequadas  [5]. 

O  pesquisador  também  deve  tentar  minimizar  o  núme¬ 
ro  de  variáveis  incluídas,  mas  manter  um  número  razoável 
de  variáveis  por  fator.  Se  um  estudo  está  sendo  planejado 
para  avaliar  uma  estrutura  proposta,  o  pesquisador  deve 
certificar-se  de  incluir  diversas  variáveis  (cinco  ou  mais) 
que  possam  representar  cada  fator  proposto.  A  força  da 
análise  fatorial  reside  em  encontrar  padrões  entre  grupos 
de  variáveis,  e  é  de  pouco  uso  na  identificação  de  fatores 
compostos  por  uma  única  variável.  Finalmente,  quando  se 
planeja  um  estudo  para  ser  analisado  por  fatores,  o  pes¬ 
quisador  deve,  se  possível,  identificar  diversas  variáveis- 


chave  (algumas  vezes  chamadas  de  indicadores-chave  ou 
variáveis  de  marcação)  que  intimamente  reflitam  os  fa¬ 
tores  latentes  que  foram  previstos  hipoteticamente.  Isso 
ajudará  na  validação  dos  fatores  determinados  e  na  ava¬ 
liação  da  significância  prática  dos  resultados. 

Tamanho  da  amostra 

No  que  se  refere  à  questão  do  tamanho  da  amostra,  o  pes¬ 
quisador  dificilmente  realiza  uma  análise  fatorial  com  uma 
amostra  com  menos  de  50  observações,  e  de  preferência  o 
tamanho  da  amostra  deve  ser  maior  ou  igual  a  100.  Como 
regra  geral,  o  mínimo  é  ter  pelo  menos  cinco  vezes  mais 
observações  do  que  o  número  de  variáveis  a  serem  ana¬ 
lisadas,  e  o  tamanho  mais  aceitável  teria  uma  proporção 
de  dez  para  um.  Alguns  pesquisadores  chegam  a  propor 
um  mínimo  de  20  casos  para  cada  variável.  Deve-se  lem¬ 
brar,  contudo,  que  com  30  variáveis,  por  exemplo,  há  435 
correlações  a  serem  calculadas  na  análise  fatorial.  Em  um 
nível  de  significância  de  0,05,  talvez  até  mesmo  20  dessas 
correlações  fossem  consideradas  significantes  e  apareces¬ 
sem  na  análise  fatorial  somente  por  sorte.  O  pesquisador 
sempre  deve  tentar  obter  a  maior  proporção  de  casos-por- 
variável  para  minimizar  as  chances  de  superajustar  os  da¬ 
dos  (ou  seja,  determinar  fatores  específicos  da  amostra, 
com  pouca  generalidade).  O  pesquisador  pode  fazer  isso 
empregando  o  conjunto  de  variáveis  mais  parcimonioso, 
guiado  por  considerações  conceituais  e  práticas,  e  então 
obtendo  um  tamanho  adequado  da  amostra  para  o  núme¬ 
ro  de  variáveis  examinadas.  Quando  se  lida  com  amostras 
menores  e/ou  com  uma  proporção  menor  de  casos-por- 
variáveis,  o  pesquisador  sempre  deve  interpretar  qual¬ 
quer  descoberta  com  precaução.  A  questão  do  tamanho 
da  amostra  também  será  abordada  em  uma  seção  adiante 
ao  se  interpretarem  cargas  fatoriais. 

Resumo 

Questões  no  planejamento  de  uma  análise  fatorial  são 
de  importância  igualmente  crítica  se  uma  perspectiva 
exploratória  ou  conflrmatória  é  assumida.  Sob  qualquer 
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ponto  de  vista,  o  pesquisador  está  confiando  na  técnica 
para  fornecer  uma  visão  sobre  a  estrutura  dos  dados,  mas 
a  estrutura  revelada  na  análise  depende  de  decisões  do 
pesquisador  em  áreas  como  variáveis  incluídas,  tamanho 
da  amostra  e  assim  por  diante.  Desse  modo,  diversas  con¬ 
siderações-chave  são  listadas  nas  Regras  Práticas  3-1. 

Estágio  3:  Suposições  na  análise  fatorial 

As  suposições  críticas  na  análise  fatorial  são  mais  concei¬ 
tuais  do  que  estatísticas.  O  pesquisador  está  sempre  preo¬ 
cupado  em  atender  a  exigência  estatística  para  qualquer 
técnica  multivariada,  mas  em  análise  fatorial  as  preocu¬ 
pações  que  se  impõem  se  centram  muito  mais  no  caráter 
e  na  composição  das  variáveis  incluídas  na  análise  do  que 
em  suas  qualidades  estatísticas. 

Questões  conceituais 

As  premissas  conceituais  subjacentes  à  análise  fatorial  se 
referem  ao  conjunto  de  variáveis  selecionadas  e  à  amostra 
escolhida.  Uma  suposição  básica  da  análise  fatorial  é  que 
existe  alguma  estrutura  subjacente  no  conjunto  de  variá¬ 
veis  escolhidas.  A  presença  de  variáveis  correlacionadas 
e  a  subseqüente  definição  de  fatores  não  garantem  rele¬ 
vância,  mesmo  que  elas  satisfaçam  as  exigências  estatís¬ 
ticas.  É  responsabilidade  do  pesquisador  garantir  que  os 
padrões  observados  sejam  conceitualmente  válidos  e  ade¬ 
quados  para  se  estudar  com  análise  fatorial,  pois  a  técnica 
não  dispõe  de  meios  para  determinar  adequação  além  das 
correlações  entre  variáveis.  Por  exemplo,  misturar  variá¬ 
veis  dependentes  e  independentes  em  uma  análise  fatorial 
e  então  usar  os  fatores  obtidos  para  apoiar  relações  de  de¬ 
pendência  é inadequado. 


-  REGRAS  PRÁTICAS  3-1  - 

Planejamento  de  análise  fatorial 

•  Análise  fatorial  é  executada  geralmente  apenas  sobre 
variáveis  métricas,  apesar  de  existirem  métodos 
especializados  para  o  emprego  de  variáveis  dicotômicas; 
um  número  pequeno  de  “variáveis  dicotômicas”  pode 
ser  incluído  em  um  conjunto  de  variáveis  métricas  que 
são  analisadas  por  fatores. 

•  Se  um  estudo  está  sendo  planejado  para  revelar 
estrutura  fatorial,  esforce-se  para  ter  pelo  menos  cinco 
variáveis  para  cada  fator  proposto. 

•  Para  tamanho  de  amostra: 

•  A  amostra  deve  ter  mais  observações  do  que 
variáveis. 

•  O  menor  tamanho  absoluto  de  amostra  deve  ser  de 
50  observações. 

•  Maximize  o  número  de  observações  por  variável,  com 
um  mínimo  de  5  e,  com  sorte,  com  pelo  menos  10 
observações  por  variável. 


O  pesquisador  deve  também  garantir  que  a  amostra 
é  homogênea  com  relação  à  estrutura  fatorial  inerente. 
É  inadequado  aplicar  análise  fatorial  em  uma  amostra 
de  homens  e  mulheres  para  um  conjunto  de  itens  conhe¬ 
cidos  por  diferirem  por  conta  de  sexo.  Quando  as  duas 
subamostras  (homens  e  mulheres)  são  combinadas,  as 
correlações  resultantes  e  a  estrutura  de  fatores  serão  uma 
representação  pobre  da  estrutura  exclusiva  de  cada  gru¬ 
po.  Logo,  sempre  que  grupos  diferentes  são  esperados  na 
amostra,  análises  fatoriais  separadas  devem  ser  executa¬ 
das,  e  os  resultados  devem  ser  comparados  para  identi¬ 
ficar  diferenças  não  refletidas  nos  resultados  da  amostra 
combinada. 

Questões  estatísticas 

De  um  ponto  de  vista  estatístico,  os  desvios  da  normali¬ 
dade,  da  homocedasticidade  e  da  linearidade  aplicam-se 
apenas  porque  eles  diminuem  as  correlações  observadas. 
Apenas  a  normalidade  é  necessária  se  um  teste  estatístico 
é  aplicado  para  a  significância  dos  fatores,  mas  esses  testes 
raramente  são  usados.  Na  verdade,  um  pouco  de  multíco- 
linearidade  é  desejável,  pois  o  objetivo  é  identificar  con¬ 
juntos  de  variáveis  inter-relacionadas. 

Assumindo  que  o  pesquisador  atende  as  exigências 
conceituais  para  as  variáveis  incluídas  na  análise,  o  próxi¬ 
mo  passo  é  garantir  que  as  variáveis  são  suficientemente 
correlacionadas  umas  com  as  outras  para  produzir  fato¬ 
res  representativos.  Como  veremos,  podemos  avaliar  esse 
grau  de  relacionamento  a  partir  de  pontos  de  vista  geral 
ou  individual.  A  seguir  há  diversas  medidas  empíricas 
para  ajudar  no  diagnóstico  da  fatorabilidade  da  matriz  de 
correlação. 

Medidas  gerais  de  intercorrelação.  Além  das  bases  esta¬ 
tísticas  para  as  correlações  da  matriz  de  dados,  o  pesqui¬ 
sador  também  deve  garantir  que  a  matriz  de  dados  tenha 
correlações  suficientes  para  justificar  a  aplicação  da  análi¬ 
se  fatorial.  Se  se  descobrir  que  todas  as  correlações  são  pe¬ 
quenas,  ou  que  todas  as  correlações  são  iguais  (mostrando 
que  não  existe  qualquer  estrutura  para  agrupar  variáveis), 
então  o  pesquisador  deve  questionar  a  aplicação  de  análi¬ 
se  fatorial.  Para  esse  propósito,  diversas  abordagens  estão 
disponíveis: 

•  Se  a  inspeção  visual  não  revela  um  número  substancial  de 
correlações  maiores  que  0,30,  então  a  análise  fatorial  pro¬ 
vavelmente  é  inapropriada.  As  correlações  entre  variáveis 
também  podem  ser  analisadas  computando-se  as  correlações 
parciais  entre  variáveis.  Uma  correlação  parcial  é  aquela  que 
não  é  explicada  quando  os  efeitos  de  outras  variáveis  são  le¬ 
vados  em  consideração.  Se  existem  fatores  “verdadeiros”  nos 
dados,  a  correlação  parcial  deverá  ser  pequena,  pois  a  variá¬ 
vel  pode  ser  explicada  pelas  variáveis  que  compõem  os  fato¬ 
res.  Se  as  correlações  parciais  são  altas,  indicando  ausência 
de  fatores  inerentes,  então  a  análise  fatorial  é  inadequada.  O 
pesquisador  está  procurando  um  padrão  de  altas  correlações 
parciais,  denotando  uma  variável  não  correlacionada  com 
um  grande  número  de  outras  variáveis  na  análise. 
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A  única  exceção  referente  a  elevadas  correlações  como 
indicativas  de  uma  matriz  de  correlação  pobre  acontece 
quando  duas  variáveis  estão  altamente  correlacionadas  e 
têm  cargas  substancialmente  maiores  do  que  outras  variá¬ 
veis  naquele  fator.  Logo,  a  correlação  parcial  delas  pode  ser 
elevada  porque  elas  não  são  explicadas  em  grande  parte  pe¬ 
las  outras  variáveis,  mas  explicam  umas  a  outras.  Essa  exce¬ 
ção  espera-se  também  quando  um  fator  tem  somente  duas 
variáveis  com  cargas  elevadas. 

Uma  elevada  correlação  parcial  é  aquela  com  significân- 
cia  prática  e  estatística,  e  uma  regra  prática  seria  considerar 
correlações  parciais  acima  de  0,7  como  elevadas.  O  SPSS  e 
o  SAS  fornecem  a  matriz  de  correlação  anti-imagem,  que 
é  simplesmente  o  valor  negativo  da  correlação  parcial,  en¬ 
quanto  o  BMDP  nos  dá  as  correlações  parciais  diretamente. 
Em  cada  caso,  as  correlações  parciais  ou  correlações  antii- 
magem  maiores  são  indicativas  de  uma  matriz  de  dados  que 
talvez  não  seja  adequada  para  análise  fatorial. 

•  Outro  modo  de  determinar  a  adequação  da  análise  fatorial 
examina  a  matriz  de  correlação  inteira.  O  teste  de  esfericidade 
de  Bartlett,  um  teste  estatístico  para  a  presença  de  correlações 
entre  as  variáveis,  é  uma  medida  dessa  natureza.  Ele  fornece 
a  significância  estatística  de  que  a  matriz  de  correlação  tem 
correlações  significantes  entre  pelo  menos  algumas  das  variá¬ 
veis.  O  pesquisador  deve  perceber,  porém,  que  aumentar  o 
tamanho  da  amostra  faz  com  que  o  teste  Bartlett  se  torne  mais 
sensível  na  detecção  de  correlações  entre  as  variáveis. 

•  Uma  terceira  medida  para  quantificar  o  grau  de  intercorre- 
lações  entre  as  variáveis  e  a  adequação  da  análise  fatorial  é  a 
medida  de  adequação  da  amostra  (MS A).  Esse  índice  varia 
de  0  a  1,  alcançando  1  quando  cada  variável  é  perfeitamen¬ 
te  prevista  sem  erro  pelas  outras  variáveis.  A  medida  pode 
ser  interpretada  com  as  seguintes  orientações:  0,80  ou  acima, 
admirável;  0,70  ou  acima,  mediano;  0,60  ou  acima,  medíocre; 
0,50  ou  acima,  ruim;  e  abaixo  de  0,50,  inaceitável  [22,23]*.  O 
MS  A  aumenta  quando  (1)  o  tamanho  da  amostra  aumenta, 
(2)  as  correlações  médias  aumentam,  (3)  o  número  de  va¬ 
riáveis  aumenta,  ou  (4)  o  número  de  fatores  diminui  [23].  O 
pesquisador  sempre  deve  ter  um  valor  MSA  geral  acima  de 
0,50  antes  de  proceder  com  a  análise  fatorial.  Se  o  valor  MSA 
ficar  abaixo  de  0,50,  então  os  valores  específicos  MSA  (ver  a 
discussão  que  se  segue)  podem  identificar  variáveis  para  eli¬ 
minação  para  atingir  um  valor  geral  de  0,50. 

Medidas  específicas  de  intercorrelação  de  variáveis. 
Além  de  um  exame  visual  das  correlações  de  uma  variá¬ 
vel  com  outras  na  análise,  as  orientações  MSA  podem  ser 
estendidas  para  variáveis  individuais.  O  pesquisador  deve 
examinar  os  valores  MSA  para  cada  variável  e  excluir 
aquelas  que  estão  no  domínio  inaceitável.  No  processo 
de  eliminação  de  variáveis,  o  pesquisador  deve  primeiro 
eliminar  a  variável  com  o  menor  MSA  e  então  recalcular 
a  análise  fatorial.  Continue  esse  processo  de  eliminar  a  va¬ 
riável  com  o  menor  valor  MSA  abaixo  de  0,50  até  que  to¬ 
das  as  variáveis  tenham  um  valor  aceitável.  Uma  vez  que 
variáveis  individuais  atinjam  um  nível  aceitável,  então  o 


*  N.  de  R.  T.:  A  frase  correta  seria  “0,80  ou  acima,  admirável;  maior 
ou  igual  a  0,70  e  abaixo  de  0,80,  mediano;  maior  ou  igual  a  0,60  e 
abaixo  de  0,70,  medíocre;  maior  ou  igual  a  0,50  e  abaixo  de  0,60, 
ruim;  e  abaixo  de  0,50,  inaceitável”. 


MSA  geral  pode  ser  calculado  e  uma  decisão  pode  ser  to¬ 
mada  sobre  a  continuidade  da  análise  fatorial. 

Resumo 

A  análise  fatorial,  enquanto  técnica  de  interdependência, 
é  de  várias  formas  mais  afetada  se  não  atender  suas  pre¬ 
missas  conceituais  inerentes  do  que  pelas  suposições  esta¬ 
tísticas.  O  pesquisador  deve  se  certificar  de  compreender 
completamente  as  implicações  não  apenas  de  garantir  que 
os  dados  atendem  as  exigências  estatísticas  para  uma  esti¬ 
mação  apropriada  da  estrutura  fatorial,  mas  de  que  o  con¬ 
junto  de  variáveis  tem  a  fundamentação  conceituai  para 
embasar  os  resultados.  Fazendo  isso,  o  pesquisador  deve 
considerar  várias  orientações  importantes,  como  listadas 
nas  Regras  Práticas  3-2. 

Estágio  4:  Determinação  de  fatores 
e  avaliação  do  ajuste  geral 

Uma  vez  que  as  variáveis  sejam  especificadas  e  a  matriz 
de  correlação  seja  preparada,  o  pesquisador  está  pronto 
para  aplicar  a  análise  fatorial  para  identificar  a  estrutura 
latente  de  relações  (ver  Figura  3-4).  Nisso,  as  decisões  de¬ 
vem  ser  tomadas  com  relação  (1)  ao  método  de  extração 
dos  fatores  (análise  de  fatores  comuns  versus  análise  de 
componentes)  e  (2)  ao  número  de  fatores  selecionados 
para  explicar  a  estrutura  latente  dos  dados. 

Seleção  do  método  de  extração  de  fatores 

O  pesquisador  pode  escolher  a  partir  de  dois  métodos  se¬ 
melhantes,  ainda  que  únicos,  para  definir  (extrair)  os  fato¬ 
res  que  representem  a  estrutura  das  variáveis  na  análise. 
Essa  decisão  sobre  o  método  a  ser  usado  deve  combinar 
os  objetivos  da  análise  fatorial  com  o  conhecimento  sobre 
algumas  características  básicas  das  relações  entre  variá¬ 
veis.  Antes  de  discutirmos  sobre  os  dois  métodos  dispo¬ 
níveis  para  extração  de  fatores,  apresentamos  uma  breve 
introdução  à  partição  da  variância  de  uma  variável. 

-  REGRAS  PRÁTICAS  3-2  - 

Teste  das  suposições  da  análise  fatorial 

•  Uma  forte  fundamentação  conceituai  é  necessária  para 
embasar  a  suposição  de  que  existe  uma  estrutura  antes 
que  a  análise  fatorial  seja  realizada. 

•  Um  teste  de  esfericidade  de  Bartlett  estatisticamente 
significante  (sign.  <  0,05)  indica  que  correlações 
suficientes  existem  entre  as  variáveis  para  se  continuar  a 
análise. 

•  Medidas  de  valores  de  adequação  da  amostra  (MSA) 
devem  exceder  0,50  tanto  para  o  teste  geral  quanto 
para  cada  variável  individual;  variáveis  com  valores 
inferiores  a  0,50  devem  ser  omitidas  da  análise  fatorial 
uma  por  vez,  sendo  aquela  com  menor  valor  eliminada 
a  cada  vez. 


Estágio  4 


Estágio  5 


Estágio  6 


Estágio  7 

Usos 

adicionais 


CAPÍTULO  3  Análise  Fatorial  Hl 


FIGURA  3-4  Estágios  4-7  no  diagrama  de  decisão  da  análise  fatorial. 
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Partição  da  variância  de  uma  variável.  Para  escolher  entre 
os  dois  métodos  de  extração  de  fatores,  o  pesquisador  deve 
primeiro  ter  certa  compreensão  da  variância  para  uma  va¬ 
riável  e  como  ela  é  dividida  ou  particionada.  Primeiro,  lem¬ 
bre  que  variância  é  um  valor  (i.e.,  o  quadrado  do  desvio  pa¬ 
drão)  que  representa  a  quantia  total  de  dispersão  de  valores 
para  uma  única  variável  em  torno  de  sua  média.  Quando 
uma  variável  é  correlacionada  com  outra,  dizemos  muitas 
vezes  que  ela  compartilha  variância  com  a  outra  variável,  e 
essa  quantia  de  partilha  entre  apenas  duas  variáveis  é  sim¬ 
plesmente  a  correlação  ao  quadrado.  Por  exemplo,  se  duas 
variáveis  têm  uma  correlação  de  0,50,  cada  variável  com¬ 
partilha  25%  (0,50^)  de  sua  variância  com  a  outra. 

Em  análise  fatorial,  agrupamos  variáveis  por  suas  cor¬ 
relações,  de  modo  que  variáveis  em  um  grupo  (fator)  têm 
elevadas  correlações  umas  com  as  outras.  Assim,  para  os 
propósitos  da  análise  fatorial,  é  importante  entender  o 
quanto  da  variância  de  uma  variável  é  compartilhado  com 
outras  variáveis  naquele  fator  versus  o  que  não  pode  ser 
compartilhado  (p.ex.,  inexplicado).  A  variância  total  de 
qualquer  variável  pode  ser  dividida  (particionada)  em  três 
tipos  de  variância: 

1.  Variância  comum  é  definida  como  aquela  variância  em  uma 
variável  que  é  compartilhada  com  todas  as  outras  variáveis 
na  análise.  Essa  variância  é  explicada  (compartilhada)  com 
base  nas  correlações  de  uma  variável  com  as  demais  na  aná¬ 
lise.  A  comunalidade  de  uma  variável  é  a  estimativa  de  sua 
variância  compartilhada,  ou  em  comum,  entre  as  variáveis 
como  representadas  pelos  fatores  obtidos. 

2.  Variância  específica  (também  conhecida  como  variância 
única)  é  aquela  associada  com  apenas  uma  variável  específi¬ 
ca.  Essa  variância  não  pode  ser  explicada  pelas  correlações 
com  as  outras  variáveis,  mas  ainda  é  associada  unicamente 
com  uma  variável. 

3.  Variância  de  erro  é  também  variância  que  não  pode  ser  ex¬ 
plicada  por  correlações  com  outras  variáveis,  mas  resulta  da 
não  confiabilidade  no  processo  de  coleta  de  dados,  de  erro  de 
medida  ou  de  componente  aleatório  no  fenômeno  medido. 

Assim,  a  variância  total  de  uma  variável  é  composta  de 
suas  variâncias  comum,  única  e  de  erro.  Quando  uma  va¬ 
riável  é  mais  correlacionada  com  uma  ou  mais  variáveis, 
a  variância  comum  (comunalidade)  aumenta.  Por  outro 
lado,  se  medidas  não-confiáveis  ou  outras  fontes  de  va¬ 
riância  de  erros  externos  são  introduzidas,  então  a  quan¬ 
tia  de  variância  comum  possível  é  reduzida,  bem  como  a 
habilidade  de  relacionar  a  variável  com  qualquer  outra. 

Análise  de  fatores  comuns  versus  análise  de  compo-nen- 
tes.  Com  uma  compreensão  básica  sobre  como  a  variân¬ 
cia  pode  ser  particionada,  o  pesquisador  está  pronto  para 
abordar  as  diferenças  entre  os  dois  métodos,  conhecidos 
como  análise  de  fatores  comuns  e  análise  de  componen¬ 
tes.  A  escolha  de  um  método  em  vez  do  outro  é  baseada 
em  dois  critérios:  (1)  os  objetivos  da  análise  fatorial  e  (2) 
o  montante  de  conhecimento  prévio  sobre  a  variância  nas 
variáveis.  A  análise  de  componentes  é  usada  quando  o 


objetivo  é  resumir  a  maior  parte  da  informação  original 
(variância)  a  um  número  mínimo  de  fatores  para  fins  de 
previsão.  Em  contraste,  análise  de  fatores  comuns  é  usada 
prioritariamente  para  identificar  fatores  ou  dimensões  la¬ 
tentes  que  refletem  o  que  as  variáveis  têm  em  comum.  A 
comparação  mais  direta  entre  os  dois  métodos  é  pelo  seu 
uso  da  variância  explicada  versus  não-explicada: 

•  Análise  de  componente,  também  conhecida  como  análise  de 
componentes  principais,  considera  a  variância  total  e  deriva 
fatores  que  contêm  pequenas  proporções  de  variância  única 
e,  em  alguns  casos,  variância  de  erro.  Não  obstante,  os  pri¬ 
meiro  poucos  fatores  não  contêm  variância  de  erro  ou  única 
o  suficiente  para  distorcer  a  estrutura  fatorial  geral.  Especi¬ 
ficamente,  com  análise  de  componentes,  unidades  (valores 
de  1,0)  são  inseridas  na  diagonal  da  matriz  de  correlação,  de 
modo  que  a  variância  completa  é  trazida  à  matriz  fatorial. 
A  Figura  3-5  retrata  o  emprego  da  variância  total  em  análi¬ 
se  de  componentes  e  as  diferenças  quando  comparada  com 
análise  de  fatores  comuns. 

•  Análise  de  fator  comum,  em  contraste,  considera  apenas  va¬ 
riância  em  comum  ou  compartilhada,  assumindo  que  tanto  a 
variância  de  erro  quanto  a  única  não  são  de  interesse  na  de¬ 
finição  da  estrutura  das  variáveis.  Para  empregar  apenas  va¬ 
riância  comum  na  estimação  dos  fatores,  comunalidades  (ao 
invés  de  unidades)  são  inseridas  na  diagonal.  Assim,  fatores 
resultantes  da  análise  de  fator  comum  se  baseiam  somente 
na  variância  comum.  Como  mostrado  na  Figura  3-5,  a  análi¬ 
se  de  fator  comum  exclui  uma  porção  da  variância  incluída 
em  uma  análise  de  componentes. 

Como  o  pesquisador  escolherá  entre  os  dois  métodos? 
Primeiro,  tanto  o  modelo  de  fator  comum  quanto  o  de  análi¬ 
se  de  componente  são  amplamente  usados.  Em  termos  prá¬ 
ticos,  o  modelo  por  componentes  é  o  método  padrão  típico 
da  maioria  dos  programas  estatísticos,  quando  se  executa 
uma  análise  fatorial.  Além  do  padrão  em  programas,  casos 
distintos  indicam  qual  dos  dois  métodos  é  o  mais  adequado: 

A  análise  fatorial  de  componentes  é  a  mais  adequada  quando: 

•  redução  de  dados  é  uma  preocupação  prioritária,  focando 
o  número  mínimo  de  fatores  necessários  para  explicar  a 
porção  máxima  da  variância  total  representada  no  conjunto 
original  de  variáveis,  e 

•  conhecimento  anterior  sugere  que  variância  específica  e  de 
erro  representam  uma  proporção  relativamente  pequena  da 
variância  total. 

Análise  de  fatores  comuns  é  mais  apropriada  quando: 

•  o  objetivo  prioritário  é  identificar  as  dimensões  ou  construtos 
latentes  representados  nas  variáveis  originais,  e 

•  o  pesquisador  tem  pouco  conhecimento  sobre  a  quantia  de 
variância  específica  e  de  erro,  e,  portanto,  deseja  eliminar 
essa  variância. 

A  análise  de  fatores  comuns,  com  suas  suposições  mais 
restritivas  e  uso  apenas  de  dimensões  latentes  (variância 
compartilhada),  muitas  vezes  é  vista  como  algo  teoricamen¬ 
te  mais  fundamentado.  No  entanto,  apesar  de  teoricamente 
válida,  ela  tem  vários  problemas.  Primeiro,  a  análise  de  fa- 
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FIGURA  3-5  Tipos  de  variância  considerados  na  matriz  fatorial. 


tores  comuns  sofre  de  índeterminâncía  fatorial,  o  que  sig¬ 
nifica  que  para  qualquer  respondente  individual,  diversos 
escores  fatoriais  diferentes  podem  ser  calculados  a  partir 
dos  resultados  de  um  único  modelo  fatorial  [26].  Não  há  so¬ 
lução  única,  como  ocorre  em  análise  de  componentes,  mas 
na  maioria  dos  casos  as  diferenças  não  são  substanciais.  A 
segunda  questão  envolve  o  cálculo  de  comunalidades  esti¬ 
madas  usadas  para  representar  a  variância  compartilhada. 
Às  vezes  as  comunalidades  não  são  estimáveis  ou  podem 
ser  inválidas  (p.ex.,  valores  maiores  que  1  ou  menores  que 
0),  exigindo  a  eliminação  da  variável  da  análise. 

A  escolha  de  um  modelo  ou  de  outro  realmente  afe¬ 
ta  os  resultados?  As  complicações  da  análise  de  fatores 
comuns  têm  contribuído  para  o  amplo  uso  de  análise  de 
componentes.  Mas  a  base  de  proponentes  para  o  modelo 
de  fator  comum  é  forte.  Cliff  [13]  caracteriza  a  disputa  en¬ 
tre  os  dois  lados  como  se  segue: 

Algumas  autoridades  insistem  que  análise  de  com¬ 
ponentes  é  a  única  abordagem  adequada,  e  que  os 
métodos  de  fatores  comuns  apenas  impõem  termino¬ 
logia  confusa,  lidando  com  coisas  fundamentalmente 
não-mensuráveis,  os  fatores  comuns.  Os  sentimen¬ 
tos  são,  em  certo  sentido,  ainda  mais  fortes  no  outro 
lado.  Partidários  da  análise  de  fatores  comuns  insis¬ 
tem  que  a  análise  de  componentes  é,  na  melhor  das 
hipóteses,  uma  análise  de  fatores  comuns  com  algum 
erro  acrescentado,  e,  na  pior  das  hipóteses,  uma  mis¬ 
tura  confusa  e  inaceitável  de  coisas  a  partir  das  quais 
nada  pode  ser  determinado.  Alguns  chegam  a  insis¬ 
tir  que  o  termo  “análise  fatorial”  não  deve  ser  usado 
quando  a  análise  de  componentes  é  executada. 

Apesar  de  ainda  haver  muito  debate  sobre  qual  mode¬ 
lo  fatorial  é  o  mais  apropriado  [6,  19,  25,  35],  a  pesquisa 
empírica  tem  demonstrado  resultados  análogos  em  mui¬ 
tos  casos  [37].  Na  maioria  das  aplicações,  tanto  a  análise  de 
componentes  quanto  a  análise  de  fatores  comuns  chegam 
a  resultados  essencialmente  idênticos  se  o  número  de  va¬ 
riáveis  exceder  30  [18],  ou  se  as  comunalidades  excederem 
0,60  para  a  maioria  das  variáveis.  Se  o  pesquisador  estiver 
preocupado  com  as  suposições  da  análise  de  componen¬ 
tes,  então  a  análise  de  fatores  comuns  também  deve  ser 
aplicada  para  avaliar  sua  representação  da  estrutura. 


Quando  uma  decisão  foi  tomada  no  modelo  fatorial, 
o  pesquisador  está  pronto  para  extrair  os  fatores  iniciais 
não-rotacionados.  Examinando  a  matriz  fatorial  não-rota- 
cionada,  ele  pode  explorar  as  possibilidades  de  redução  de 
dados  e  obter  uma  estimativa  preliminar  do  número  de  fa¬ 
tores  a  extrair.  A  determinação  final  do  número  de  fatores, 
porém,  deve  esperar  até  o  momento  em  que  os  resultados 
sejam  rotacionados  e  os  fatores  sejam  interpretados. 

Critérios  para  o  número  de  fatores  a  extrair 

Como  decidimos  sobre  o  número  de  fatores  a  serem  ex¬ 
traídos?  Ambos  os  métodos  de  análise  fatorial  estão  in¬ 
teressados  na  melhor  combinação  linear  de  variáveis 
-  melhor  no  sentido  de  que  a  combinação  particular  de 
variáveis  originais  explica  a  maior  parte  da  variância  nos 
dados  como  um  todo  comparada  a  qualquer  outra  combi¬ 
nação  linear  de  variáveis.  Logo,  o  primeiro  fator  pode  ser 
visto  como  o  melhor  resumo  de  relações  lineares  exibidas 
nos  dados.  O  segundo  fator  é  definido  como  a  segunda 
melhor  combinação  linear  das  variáveis,  sujeita  à  restri¬ 
ção  de  que  é  ortogonal  ao  primeiro  fator.  Para  ser  orto¬ 
gonal  ao  primeiro  fator,  o  segundo  fator  deve  ser  obtido 
da  variância  remanescente  depois  que  o  primeiro  fator  foi 
extraído.  Assim,  o  segundo  fator  pode  ser  definido  como  a 
combinação  linear  de  variáveis  que  explica  a  maior  parte 
da  variância  que  ainda  é  inexplicada  após  o  efeito  da  re¬ 
moção  do  primeiro  fator  dos  dados.  O  processo  continua 
extraindo  fatores  que  explicam  quantias  cada  vez  menores 
de  variância  até  que  toda  a  variância  seja  explicada.  Por 
exemplo,  o  método  de  componentes  realmente  extrai  n 
fatores,  onde  néo  número  de  variáveis  na  análise.  Assim, 
se  30  variáveis  estão  na  análise,  30  fatores  são  extraídos. 

Assim,  o  que  se  ganha  com  análise  fatorial?  Apesar 
de  nosso  exemplo  conter  30  fatores,  alguns  dos  primeiros 
fatores  podem  explicar  uma  porção  substancial  da  variân¬ 
cia  total  ao  longo  de  todas  as  variáveis.  Espera-se  que  o 
pesquisador  possa  reter  ou  usar  apenas  um  pequeno  nú¬ 
mero  de  variáveis*  e  ainda  representar  adequadamente  o 
conjunto  inteiro  de  variáveis.  Assim,  a  questão-chave  é: 
quantos  fatores  devem  ser  extraídos  ou  retidos! 


*  N.  de  R.  T.:  A  palavra  correta  seria  “fatores”. 
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Ao  decidir  quando  parar  a  fatoração  (i.e.,  quantos 
fatores  devem  ser  extraídos),  o  pesquisador  deve  combi¬ 
nar  uma  fundamentação  conceituai  (quantos  fatores  de¬ 
vem  estar  na  estrutura?)  com  alguma  evidência  empírica 
(quantos  fatores  podem  ser  razoavelmente  sustentados?). 
O  pesquisador  geralmente  começa  com  alguns  critérios 
pré -determinados,  como  o  número  geral  de  fatores  mais 
algumas  referências  gerais  de  relevância  prática  (p.ex., 
percentual  exigido  de  variância  explicada).  Esses  critérios 
são  combinados  com  medidas  empíricas  da  estrutura  fato¬ 
rial.  Uma  base  quantitativa  exata  para  decidir  o  número 
de  fatores  a  extrair  ainda  não  foi  desenvolvida.  No  entan¬ 
to,  os  seguintes  critérios  de  parada  têm  sido  utilizados. 

Critério  da  raiz  latente.  A  técnica  mais  comumente  usa¬ 
da  é  o  critério  da  raiz  latente.  Esta  técnica  é  simples  de 
aplicar  na  análise  de  componentes,  bem  como  na  análise 
de  fatores  comuns.  O  raciocínio  para  o  critério  da  raiz 
latente  é  que  qualquer  fator  individual  deve  explicar  a  va¬ 
riância  de  pelo  menos  uma  variável  se  o  mesmo  há  de  ser 
mantido  para  interpretação.  Com  a  análise  de  componen¬ 
tes,  cada  variável  contribui  com  um  valor  1  do  autovalor 
total.  Logo,  apenas  os  fatores  que  têm  raízes  latentes  ou 
autovalores  maiores  que  1  são  considerados  significan- 
tes;  todos  os  fatores  com  raízes  latentes  menores  que  1 
são  considerados  insignificantes  e  são  descartados.  Usar 
o  autovalor  para  estabelecer  um  corte  é  mais  confiável 
quando  o  número  de  variáveis  está  entre  20  e  50.  Se  o  nú¬ 
mero  de  variáveis  é  menor  que  20,  há  uma  tendência  para 
que  esse  método  extraia  um  número  conservador  (muito 
pouco)  de  fatores;  ao  passo  que,  quando  mais  de  50  va¬ 
riáveis  estão  envolvidas,  não  é  raro  que  muitos  fatores 
sejam  extraídos. 

Critério  a  priorí.  O  critério  a  priori  é  um  critério  sim¬ 
ples,  ainda  que  razoável  sob  certas  circunstâncias.  Quando 
aplicado,  o  pesquisador  já  sabe  quantos  fatores  extrair  an¬ 
tes  de  empreender  a  análise  fatorial.  O  pesquisador  sim¬ 
plesmente  instrui  o  computador  a  parar  a  análise  quando 
o  número  desejado  de  fatores  tiver  sido  extraído.  Este 
tratamento  é  útil  quando  se  testa  uma  teoria  ou  hipóte¬ 
se  sobre  o  número  de  fatores  a  serem  extraídos.  Também 
pode  ser  justificado  na  tentativa  de  repetir  o  trabalho  de 
outro  pesquisador  e  extrair  o  mesmo  número  de  fatores 
anteriormente  encontrado. 

Critério  de  percentagem  de  variância  O  critério  de 
percentagem  de  variância  é  uma  abordagem  baseada  na 
conquista  de  um  percentual  cumulativo  especificado  da 
variância  total  extraída  por  fatores  sucessivos.  O  objetivo 
é  garantir  significância  prática  para  os  fatores  determina¬ 
dos,  garantindo  que  expliquem  pelo  menos  um  montan¬ 
te  especificado  de  variância.  Nenhuma  base  absoluta  foi 
adotada  para  todas  as  aplicações.  No  entanto,  em  ciên¬ 
cias  naturais,  o  procedimento  de  obtenção  de  fatores  ge¬ 
ralmente  não  deveria  ser  parado  até  os  fatores  extraídos 


explicarem  pelo  menos  95%  da  variância,  ou  até  o  último 
fator  explicar  apenas  uma  pequena  parcela  (menos  que 
5%).  Em  contraste,  em  ciências  sociais,  nas  quais  as  infor¬ 
mações  geralmente  são  menos  precisas,  não  é  raro  consi¬ 
derar  uma  solução  que  explique  60%  da  variância  total  (e 
em  alguns  casos  até  menos)  como  satisfatória. 

Uma  variante  deste  critério  envolve  a  seleção  de  fato¬ 
res  suficientes  para  atingir  uma  comunalidade  pré-espe- 
cificada  para  cada  variável.  Se  razões  teóricas  ou  práticas 
requerem  uma  certa  comunalidade  para  cada  variável,  en¬ 
tão  o  pesquisador  incluirá  tantos  fatores  quanto  necessá¬ 
rios  para  representar  adequadamente  cada  uma  das  variá¬ 
veis  originais.  Isso  difere  de  focalizar  somente  o  montante 
total  de  variância  explicada,  o  que  negligencia  o  grau  de 
explicação  para  as  variáveis  individuais. 

Critério  do  teste  scree.  Lembre  que,  no  modelo  fatorial 
de  análise  de  componentes,  os  últimos  fatores  extraídos 
contêm  tanto  a  variância  comum  quanto  a  única.  Apesar 
de  todos  os  fatores  conterem  pelo  menos  alguma  variância 
única,  a  proporção  de  variância  única  é  substancialmente 
maior  nos  últimos  fatores.  O  teste  scree  é  usado  para  iden¬ 
tificar  o  número  ótimo  de  fatores  que  podem  ser  extraídos 
antes  que  a  quantia  de  variância  única  comece  a  dominar 
a  estrutura  de  variância  comum  [9]. 

O  teste  scree  é  determinado  fazendo-se  o  gráfico  das 
raízes  latentes  em  relação  ao  número  de  fatores  em  sua 
ordem  de  extração,  e  a  forma  da  curva  resultante  é  usa¬ 
da  para  avaliar  o  ponto  de  corte.  A  Figura  3-6  exibe  os 
primeiros  18  fatores  extraídos  em  um  estudo.  Começan¬ 
do  com  o  primeiro  fator,  os  ângulos  de  inclinação  rapida¬ 
mente  decrescem  no  início  e  então  lentamente  se  aproxi¬ 
mam  de  uma  reta  horizontal.  O  ponto  no  qual  o  gráfico 
começa  a  ficar  horizontal  é  considerado  indicativo  do  nú¬ 
mero  máximo  de  fatores  a  serem  extraídos.  No  presente 
caso,  os  primeiros  10  fatores  se  qualificariam.  Além  de  10, 
uma  grande  proporção  de  variância  única  seria  incluída; 
logo,  esses  fatores  não  seriam  aceitáveis.  Observe  que,  ao 
se  usar  o  critério  da  raiz  latente,  apenas  8  fatores  teriam 
sido  considerados.  Entretanto,  usar  o  teste  scree  nos  dá  2 
fatores  a  mais.  Como  regra  geral,  o  teste  scree  resulta  em 
pelo  menos  um  e  às  vezes  dois  ou  três  fatores  a  mais  sendo 
considerados  para  inclusão  em  relação  ao  critério  da  raiz 
latente  [9]. 

Heterogeneidade  dos  respondentes.  A  variância  com¬ 
partilhada  entre  variáveis  é  a  base  para  ambos  os  modelos 
fatoriais,  de  fator  comum  e  de  componentes.  Uma  supo¬ 
sição  inerente  é  que  a  variância  compartilhada  se  estende 
ao  longo  de  toda  a  amostra.  Se  esta  é  heterogênea  em  re¬ 
lação  a  pelo  menos  um  subconjunto  das  variáveis,  então 
os  primeiros  fatores  representam  aquelas  variáveis  mais 
homogêneas  em  toda  a  amostra.  As  variáveis  que  são 
melhores  discriminadoras  entre  os  subgrupos  da  amostra 
carregam  nos  últimos  fatores,  muitas  vezes  aqueles  não- 
selecionados  pelos  critérios  recém  discutidos  [17].  Quan- 
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do  o  objetivo  é  identificar  fatores  que  discriminam  entre 
os  subgrupos  de  uma  amostra,  o  pesquisador  deve  extrair 
fatores  adicionais,  além  dos  indicados  pelos  métodos  cita¬ 
dos,  e  examinar  a  habilidade  dos  fatores  adicionais  de  dis¬ 
criminar  os  grupos.  Se  eles  demonstrarem  serem  menos 
benéficos  na  discriminação,  a  solução  poderá  ser  proces¬ 
sada  novamente  e  esses  últimos  fatores,  eliminados. 

Resumo  dos  critérios  de  seleção  de  fatores.  Na  práti¬ 
ca,  a  maioria  dos  pesquisadores  raramente  usa  um  único 
critério  para  determinar  quantos  fatores  devem  ser  ex¬ 
traídos.  Inicialmente  eles  usam  um  critério  como  o  da 
raiz  latente  como  uma  orientação  para  a  primeira  ten¬ 
tativa  de  interpretação.  Depois  que  os  fatores  foram  in¬ 
terpretados,  como  discutido  nas  seções  seguintes,  a  sua 
praticabilidade  é  avaliada.  Os  fatores  identificados  por 
outros  critérios  também  são  interpretados.  A  seleção  do 
número  de  fatores  é  inter-relacionada  com  uma  avalia¬ 
ção  da  estrutura,  a  qual  é  revelada  na  fase  de  interpre¬ 
tação.  Assim,  diversas  soluções  fatoriais  com  diferentes 
números  de  fatores  são  examinadas  antes  que  a  estrutura 
seja  bem  definida.  Ao  tomar  a  decisão  final  sobre  a  solu¬ 
ção  fatorial  para  representar  a  estrutura  das  variáveis,  o 
pesquisador  deve  lembrar  as  considerações  listadas  nas 
Regras  Práticas  3-3. 

Uma  advertência  quanto  à  seleção  do  conjunto  final 
de  fatores:  há  conseqüências  negativas  na  seleção  de  fato¬ 
res  em  excesso  ou  a  menos  para  representar  os  dados.  Se 
pouquíssimos  fatores  são  selecionados,  a  estrutura  correta 
não  é  revelada  e  dimensões  importantes  podem  ser  omi¬ 
tidas.  Se  muitos  fatores  são  mantidos,  a  interpretação  se 
torna  mais  difícil  quando  os  resultados  são  rotacionados 
(como  discutido  na  próxima  seção).  Apesar  de  os  fatores 
serem  independentes,  você  pode  ter  fatores  a  mais  ou  a 
menos,  sem  dificuldades.  Por  analogia,  escolher  o  número 


-  REGRAS  PRÁTICAS  3-3  - 

Escolha  de  modelos  fatoriais  e 
número  de  fatores 

•  Apesar  de  os  modelos  de  análise  de  fatores  comuns 
e  de  análise  de  componentes  levarem  a  resultados 
similares  em  ambientes  comuns  de  pesquisa  (30 
variáveis  ou  mais,  ou  comunalidades  de  0,60  para  a 
maioria  das  variáveis): 

•  O  modelo  de  análise  de  componentes  é  mais 
adequado  quando  a  redução  de  dados  é  soberana 

•  O  modelo  de  fatores  comuns  é  melhor  em  aplicações 
teóricas  bem  especificadas 

•  Qualquer  decisão  sobre  o  número  de  fatores  a  serem 
mantidos  deve  se  basear  em  diversas  considerações: 

•  Uso  de  diversos  critérios  de  parada  para  determinar 
o  número  inicial  de  fatores  a  serem  mantidos: 

•  Fatores  com  autovalores  maiores  do  que  1,0 

•  Um  número  pré-determinado  de  fatores  baseado 
em  objetivos  da  pesquisa  e/ou  pesquisa  anterior 

•  Fatores  suficientes  para  atender  um  percentual 
especificado  de  variância  explicada,  geralmente 
60%  ou  mais 

•  Fatores  apontados  pelo  teste  scree  como  tendo 
quantias  substanciais  de  variância  comum  (i.e., 
fatores  antes  do  ponto  de  inflexão) 

•  Mais  fatores  quando  heterogeneidade  está 
presente  entre  subgrupos  da  amostra 

•  Consideração  de  várias  soluções  alternativas  (um 
fator  a  mais  e  um  a  menos  em  relação  à  solução 
inicial)  para  garantir  que  a  melhor  estrutura  seja 
identificada 
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de  fatores  é  algo  como  focar  um  microscópio.  Ajuste  mui¬ 
to  alto  ou  muito  baixo  irá  obscurecer  uma  estrutura  que 
é  óbvia  quando  o  ajuste  está  simplesmente  correto.  Logo, 
pelo  exame  de  uma  certa  quantia  de  diferentes  estruturas 
fatoriais  obtidas  a  partir  de  várias  tentativas  de  soluções, 
o  pesquisador  pode  comparar  e  contrastar  para  chegar  à 
melhor  representação  dos  dados. 

Assim  como  outros  aspectos  de  modelos  multivariados, 
a  parcimônia  é  importante.  A  exceção  notável  é  quando 
a  análise  fatorial  é  usada  exclusivamente  para  redução  de 
dados  e  um  nível  estabelecido  de  variância  a  ser  extraído 
é  especificado.  O  pesquisador  sempre  deve  se  empenhar 
em  ter  o  conjunto  de  fatores  mais  representativo  e  parci¬ 
monioso  possível. 

Estágio  5:  Interpretação  dos  fatores 

Apesar  de  não  existirem  processos  ou  orientações  ine¬ 
quívocas  para  determinar  a  interpretação  de  fatores,  o 
pesquisador  com  forte  fundamentação  conceituai  para 
a  estrutura  antecipada  e  sua  justificativa  tem  a  maior 
chance  de  sucesso.  Não  podemos  estabelecer  de  manei¬ 
ra  suficientemente  impactante  a  importância  de  uma 
forte  fundamentação  conceituai,  seja  ela  vinda  de  pes¬ 
quisa  anterior,  paradigmas  teóricos  ou  princípios  comu- 
mente  aceitos.  Como  veremos,  o  pesquisador  deve  re¬ 
petidamente  fazer  julgamentos  subjetivos  em  decisões, 
como  o  número  de  fatores,  quais  são  as  relações  sufi¬ 
cientes  para  garantir  variáveis  que  discriminam  grupos, 
e  como  podem  ser  identificados  esses  grupos.  Como 
pode  atestar  o  pesquisador  experiente,  praticamente 
qualquer  coisa  pode  ser  descoberta  se  houver  empenho 
suficientemente  insistente  (p.ex.,  usando  diferentes  mo¬ 
delos  fatoriais,  extraindo  diferentes  números  de  fatores, 
usando  várias  formas  de  rotação).  Portanto,  deixa-se 
para  o  pesquisador  o  papel  de  juiz  de  última  instância 
quanto  à  forma  e  à  adequação  de  uma  solução  fatorial, 
e  tais  decisões  são  melhor  guiadas  por  bases  conceituais 
do  que  por  bases  empíricas. 

Para  auxiliar  no  processo  de  interpretação  de  uma  es¬ 
trutura  fatorial  e  escolher  a  solução  final,  três  processos 
fundamentais  são  descritos.  Dentro  de  cada  processo,  di¬ 
versas  questões  importantes  (rotação  fatorial,  significân- 
cia  de  carga  fatorial  e  interpretação)  são  encontradas.  As¬ 
sim,  após  a  breve  descrição  de  cada  processo,  os  mesmos 
serão  discutidos  mais  detalhadamente. 

Os  três  processos  de  interpretação  fatorial 

A  interpretação  fatorial  é  circular  por  natureza.  O  pes¬ 
quisador  primeiramente  avalia  os  resultados  iniciais,  em 
seguida  faz  alguns  julgamentos  vendo  e  refinando  tais 
resultados,  com  a  evidente  possibilidade  de  que  a  aná¬ 
lise  seja  reespecificada,  exigindo-se  uma  volta  ao  passo 
avaliativo.  Assim,  o  pesquisador  não  deve  se  surpreen¬ 
der  se  executar  diversas  iterações  até  que  uma  solução 
final  seja  obtida. 


Estimativa  da  matriz  fatorial.  Primeiro,  a  matriz  fatorial 

inicial  não-rotacionada  é  computada,  contendo  as  cargas 
fatoriais  para  cada  variável  sobre  cada  fator.  Cargas  fato¬ 
riais  são  a  correlação  de  cada  variável  com  o  fator.  Cargas 
indicam  o  grau  de  correspondência  entre  a  variável  e  o 
fator,  com  cargas  maiores  tornando  a  variável  representa¬ 
tiva  do  fator.  Cargas  fatoriais  são  o  meio  de  interpretar  o 
papel  que  cada  variável  tem  na  definição  de  cada  fator. 

Rotação  de  fatores.  Soluções  fatoriais  não-rotacionadas 
atingem  a  meta  de  redução  de  dados,  mas  o  pesquisador 
deve  perguntar  se  a  solução  fatorial  não-rotacionada  (que 
preenche  as  exigências  matemáticas  desejáveis)  fornecerá 
informação  que  oferece  interpretação  a  mais  adequada 
das  variáveis  sob  exame.  Na  maioria  dos  casos,  a  respos¬ 
ta  a  essa  questão  é  negativa,  pois  rotação  fatorial  (uma 
discussão  mais  detalhada  segue  na  próxima  seção)  deve 
simplificar  a  estrutura  fatorial.  Portanto,  o  pesquisador 
a  seguir  emprega  um  método  rotacional  para  conseguir 
soluções  mais  simples  e  teoricamente  mais  significativas. 
Na  maioria  das  vezes,  a  rotação  de  fatores  melhora  a  in¬ 
terpretação  pela  redução  de  algumas  das  ambigüidades 
que  freqüentemente  acompanham  as  soluções  fatoriais 
não-rotacionadas. 

Interpretação  e  reespecificação  de  fatores.  Como  um 
processo  final,  o  pesquisador  avalia  as  cargas  fatoriais  (ro- 
tacionadas)  para  cada  variável  a  fim  de  determinar  o  papel 
da  mesma  e  sua  contribuição  na  determinação  da  estrutura 
fatorial.  No  curso  deste  processo  de  avaliação,  pode  surgir 
a  necessidade  de  reespecificar  o  modelo  fatorial  devido  (1) 
à  eliminação  de  uma  variável(is)  da  análise,  (2)  ao  desejo 
de  empregar  um  método  rotacional  diferente  para  inter¬ 
pretação,  (3)  à  necessidade  de  extrair  um  número  diferen¬ 
te  de  fatores,  ou  (4)  ao  desejo  de  mudar  de  um  método  de 
extração  para  outro.  A  reespecificação  de  um  modelo  fato¬ 
rial  é  realizada  retornando-se  ao  estágio  de  extração  (está¬ 
gio  4),  extraindo  fatores  e  interpretando-os  novamente. 

Rotação  de  fatores 

Talvez  a  ferramenta  mais  importante  na  interpretação  de 
fatores  seja  a  rotação  fatorial.  O  termo  rotação  significa 
exatamente  o  que  sugere.  Especificamente,  os  eixos  de  re¬ 
ferência  dos  fatores  são  rotacionados  em  torno  da  origem 
até  que  alguma  outra  posição  seja  alcançada.  Como  ante¬ 
riormente  indicado,  as  soluções  de  fatores  não-rotaciona- 
dos  extraem  fatores  na  ordem  de  sua  variância  extraída. 
O  primeiro  fator  tende  a  ser  um  fator  geral  com  quase 
toda  variável  com  carga  significante,  e  explica  a  quantia 
maior  de  variância.  O  segundo  fator  e  os  seguintes  são  en¬ 
tão  baseados  na  quantia  residual  de  variância.  Cada  fator 
explica  porções  sucessivamente  menores  de  variância.  O 
efeito  final  de  rotacionar  a  matriz  fatorial  é  redistribuir 
a  variância  dos  primeiros  fatores  para  os  últimos  com  o 
objetivo  de  atingir  um  padrão  fatorial  mais  simples  e  teo¬ 
ricamente  mais  significativo. 
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O  caso  mais  simples  de  rotação  é  uma  rotação  orto¬ 
gonal,  na  qual  os  eixos  são  mantidos  a  90  graus.  Também 
é  possível  rotacionar  os  eixos  sem  manter  o  ângulo  de  90 
graus  entre  os  eixos  de  referência.  Quando  não  há  a  restri¬ 
ção  de  ser  ortogonal,  o  procedimento  de  rotação  se  chama 
rotação  oblíqua.  Rotações  fatoriais  ortogonais  e  oblíquas 
são  demonstradas  nas  Figuras  3-7  e  3-8,  respectivamente. 


A  Figura  3-7,  na  qual  cinco  variáveis  são  retratadas 
em  um  diagrama  fatorial  bidimensional,  ilustra  a  rota¬ 
ção  fatorial.  O  eixo  vertical  representa  o  fator  II  não- 
rotacionado,  e  o  horizontal  corresponde  ao  fator  I  não- 
rotacionado.  Os  eixos  são  rotulados  com  0  na  origem  e 
prolongados  para  -h1,0  ou  -1,0.  Os  números  nos  eixos 
representam  as  cargas  fatoriais.  As  cinco  variáveis  são 
rotuladas  por  V^,  V2,  F3,  F4  e  V^.  A  carga  fatorial  para  a 
variável  2  (V2)  no  fator  II  não-rotacionado  é  determina¬ 
da  desenhando-se  uma  linha  tracejada  horizontalmente 
a  partir  do  ponto  do  dado  até  o  eixo  vertical  do  fator  II. 
De  modo  similar,  uma  linha  vertical  é  tracejada  a  partir 
da  variável  2  até  o  eixo  horizontal  do  fator  não-rotacio- 
nado  I  para  determinar  a  carga  da  variável  2  no  fator 
I.  Um  procedimento  semelhante  adotado  para  as  outras 
variáveis  determina  as  cargas  fatoriais  para  as  soluções 
não-rotacionadas  e  rotacionadas,  como  exibido  na  Tabe¬ 
la  3-1  para  fins  de  comparação.  No  primeiro  fator  não- 
rotacionado,  todas  as  variáveis  têm  carga  alta.  No  segun¬ 
do,  as  variáveis  1  e  2  são  muito  altas  na  direção  positiva. 
A  variável  5  é  moderadamente  alta  na  direção  negativa, 
e  as  variáveis  3  e  4  têm  cargas  consideravelmente  meno¬ 
res  na  direção  negativa. 

A  partir  da  inspeção  visual  da  Figura  3-7,  é  óbvio  que 
há  dois  agrupamentos  de  variáveis.  As  variáveis  1  e  2  es¬ 
tão  juntas,  assim  como  as  variáveis  3,  4  e  5.  No  entanto, 
tal  padrão  de  variáveis  não  é  tão  óbvio  a  partir  das  cargas 
fatoriais  não-rotacionadas.  Rotacionando  os  eixos  ori¬ 
ginais  no  sentido  horário,  como  indicado  na  Figura  3-7, 
obtemos  um  padrão  de  cargas  fatoriais  completamente 
diferente.  Observe  que,  rotacionando  os  fatores,  os  eixos 
são  mantidos  a  90  graus.  Esse  procedimento  significa  que 
os  fatores  são  matematicamente  independentes  e  que  a 
rotação  foi  ortogonal.  Após  rotacionar  os  eixos  fatoriais, 
as  variáveis  3, 4  e  5  têm  cargas  altas  no  fator  I,  e  as  variá¬ 
veis  1  e  2  têm  cargas  elevadas  no  fator  II.  Logo,  o  agrupa¬ 
mento  ou  padrão  dessas  variáveis  em  dois  grupos  é  mais 
óbvio  após  a  rotação,  ainda  que  a  posição  ou  configura¬ 
ção  relativa  das  variáveis  permaneça  a  mesma. 


Os  mesmos  princípios  gerais  de  rotações  ortogonais 
são  aplicáveis  a  rotações  oblíquas.  No  entanto,  o  método 
de  rotação  oblíqua  é  mais  flexível,  pois  os  eixos  fatoriais 
não  precisam  ser  ortogonais.  Além  disso,  é  mais  realista, 
porque  as  dimensões  inerentes  que  são  teoricamente  im¬ 
portantes  não  são  supostas  sem  correlações  entre  si.  Na 
Figura  3-8,  os  dois  métodos  rotacionais  são  comparados. 


Note  que  a  rotação  fatorial  oblíqua  representa  o  agrupa¬ 
mento  de  variáveis  com  maior  precisão.  Essa  precisão  é 
um  resultado  do  fato  de  que  cada  eixo  fatorial  rotacionado 
agora  está  mais  próximo  do  respectivo  grupo  de  variáveis. 
Além  disso,  a  solução  oblíqua  fornece  informações  sobre 
o  grau  em  que  os  fatores  realmente  estão  correlacionados 
um  com  o  outro. 

Muitos  pesquisadores  concordam  que  a  maioria  das  so¬ 
luções  diretas  não-rotacionadas  não  é  suficiente.  Ou  seja, 
na  maioria  dos  casos,  a  rotação  melhora  a  interpretação 
reduzindo  algumas  das  ambigüidades  que  freqüentemen- 
te  acompanham  a  análise  preliminar.  A  principal  opção 
disponível  é  escolher  um  método  de  rotação  ortogonal  ou 
oblíqua.  A  meta  final  de  qualquer  rotação  é  obter  alguns 
fatores  teoricamente  significativos  e,  se  possível,  a  estru¬ 
tura  fatorial  mais  simples.  As  rotações  ortogonais  são 
mais  amplamente  usadas  porque  todos  os  pacotes  com¬ 
putacionais  com  análise  fatorial  contêm  opções  de  rota¬ 
ção  ortogonal,  enquanto  os  métodos  oblíquos  não  são  tão 
difundidos.  As  rotações  ortogonais  também  são  utilizadas 
mais  freqüentemente  porque  os  procedimentos  analíticos 
para  rotações  oblíquas  não  são  tão  bem  desenvolvidos  e 
ainda  estão  sujeitos  a  considerável  controvérsia.  Várias 
abordagens  diferentes  estão  à  disposição  para  a  execução 
de  rotações  ortogonais  ou  oblíquas.  Contudo,  apenas  um 
número  limitado  de  procedimentos  de  rotação  oblíqua 
está  disponível  na  maioria  dos  pacotes  estatísticos.  Logo, 
o  pesquisador  provavelmente  deverá  aceitar  o  que  lhe  é 
fornecido. 

Métodos  rotacionais  ortogonais.  Na  prática,  o  objetivo 
de  todos  os  métodos  de  rotação  é  simplificar  as  linhas  e 
colunas  da  matriz  fatorial  para  facilitar  a  interpretação. 
Em  uma  matriz  fatorial,  as  colunas  representam  fatores,  e 
cada  linha  corresponde  às  cargas  de  uma  variável  ao  longo 
dos  fatores.  Por  simplificação  das  linhas,  queremos  dizer 
tornar  o  máximo  de  valores  em  cada  linha  tão  próximos 
de  zero  quanto  possível  (isto  é,  maximizar  a  carga  de  uma 
variável  em  um  único  fator).  Simplificação  das  colunas 
significa  tornar  o  máximo  de  valores  em  cada  coluna  tão 
próximos  de  zero  quanto  possível  (ou  seja,  tornar  o  núme¬ 
ro  de  cargas  “elevadas”  o  menor  possível).  Três  aborda¬ 
gens  ortogonais  principais  foram  desenvolvidas: 

1.  A  meta  final  de  uma  rotação  QUARTIMAX  é  simplificar 
as  linhas  de  uma  matriz  fatorial;  ou  seja,  QUARTIMAX  se 
concentra  em  rotacionar  o  fator  inicial  de  modo  que  uma 
variável  tenha  carga  alta  em  um  fator  e  cargas  tão  baixas 
quanto  possível  em  todos  os  outros  fatores.  Nessas  rotações, 
muitas  variáveis  podem  ter  carga  alta  no  mesmo  fator,  pois 
a  técnica  se  concentra  em  simplificar  as  linhas.  O  método 
QUARTIMAX  não  tem  se  mostrado  bem-sucedido  na 
produção  de  estruturas  mais  simples.  Sua  dificuldade  é  que 
ele  tende  a  produzir  um  fator  geral  como  o  primeiro  fator, 
no  qual  a  maioria  das  variáveis,  se  não  todas,  tem  cargas 
altas.  Independentemente  de  qualquer  conceito  do  que  é 
uma  estrutura  “mais  simples”,  ela  inevitavelmente  envolve 
lidar  com  agrupamentos  de  variáveis;  um  método  que  tende 


118  Análise  Multivariada  de  Dados 


Fator  II 

não-rotaclonado  ^  ^  ,, 

Fator  II 

r  /rotaclonado 


Fator  I 
rotaclonado 


-1,0 


FIGURA  3-7  Rotação  fatorial  ortogonal. 


a  criar  um  grande  fator  geral  (isto  é,  QUARTIMAX)  não 
está  de  acordo  com  os  propósitos  de  rotação. 

2.  Diferentemente  de  QUARTIMAX,  o  critério  VARIMAX 
se  concentra  na  simplificação  das  colunas  da  matriz  fatorial. 
Com  a  abordagem  rotacional  VARIMAX,  a  simplificação 
máxima  possível  é  conseguida  se  houver  apenas  Is  e  Os  em 
uma  coluna.  Ou  seja,  o  método  VARIMAX  maximiza  a  soma 
de  variâncias  de  cargas  exigidas  da  matriz  fatorial.  Lembre-se 
que,  nas  abordagens  QUARTIMAX,  muitas  variáveis  podem 


ter  cargas  altas  ou  próximas  de  altas  no  mesmo  fator,  pois  a 
técnica  se  concentra  em  simplificar  as  linhas.  Com  a  aborda¬ 
gem  rotacional  VARIMAX,  há  uma  tendência  para  algumas 
cargas  altas  (isto  é,  próximas  de  -1  ou  +1)  e  algumas  cargas 
próximas  de  0  em  cada  coluna  da  matriz.  A  lógica  é  que  a  in¬ 
terpretação  é  mais  fácil  quando  as  correlações  variável-fator 
são  (1)  próximas  de  +1  ou  -1,  indicando  assim  uma  clara  as¬ 
sociação  positiva  ou  negativa  entre  a  variável  e  o  fator;  ou  (2) 
próximas  de  0,  apontando  para  uma  clara  falta  de  associa- 


Fator  II  Rotação 

não-rotaclonado  ortogonal: 


FIGURA  3-8  Rotação  fatorial  oblíqua. 
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TABELA  3-1  Comparação  entre  cargas  fatoriais  rotacionadas  e  não-rotacionadas 


Variáveis 

Cargas  fatoriais 
não-rotacionadas 

Cargas  fatoriais 
rotacionadas 

i 

ii 

i 

ii 

0,50 

0,80 

0,03 

0,94 

0,60 

0,70 

0,16 

0,90 

0,90 

-0,25 

0,95 

0,24 

0,80 

-0,30 

0,84 

0,15 

0,60 

-0,50 

0,76 

-0,13 

ção.  Essa  estrutura  é  fundamentalmente  simples.  Apesar  de 
a  solução  QUARTIMAX  ser  analiticamente  mais  simples  do 
que  a  VARIMAX,  esta  parece  fornecer  uma  separação  mais 
clara  dos  fatores.  Em  geral,  o  experimento  de  Kaiser  [22,  23] 
indica  que  o  padrão  fatorial  obtido  por  rotação  VARIMAX 
tende  a  ser  mais  invariante  do  que  o  obtido  pelo  método 
QUARTIMAX  quando  diferentes  subconjuntos  de  variáveis 
são  analisados.  O  método  VARIMAX  tem  sido  muito  bem- 
sucedido  como  uma  abordagem  analítica  para  a  obtenção  de 
uma  rotação  ortogonal  de  fatores. 

3.  O  método  EQUIMAX  é  uma  espécie  de  meio-termo  entre 
QUARTIMAX  e  VARIMAX.  Em  vez  de  se  concentrar  na 
simplificação  de  linhas  ou  de  colunas,  ele  tenta  atingir  um 
pouco  de  cada.  EQUIMAX  não  tem  obtido  ampla  aceita¬ 
ção  e  é  pouco  usado. 

Métodos  de  rotação  oblíqua.  As  rotações  oblíquas  são 
semelhantes  às  ortogonais,  porém  as  oblíquas  permitem  fa¬ 
tores  correlacionados  em  vez  de  manterem  independência 
entre  os  fatores  rotacionados.  Porém,  enquanto  há  várias 
escolhas  entre  abordagens  ortogonais,  há  apenas  escolhas 
limitadas  na  maioria  dos  pacotes  estatísticos  para  rotações 
oblíquas.  Por  exemplo,  SPSS  fornece  OBLIMIN;  SAS 
tem  PROMAX  e  ORTHOBLIQUE;  e  BMDP  fornece 
DQUART,  DOBLIMIN  e  ORTHOBLIQUE.  Os  objeti¬ 
vos  de  simplificação  são  comparáveis  aos  métodos  ortogo¬ 
nais,  com  a  característica  extra  de  fatores  correlacionados. 
Com  a  possibilidade  de  fatores  correlacionados,  o  pesquisa¬ 
dor  deve  ter  o  cuidado  extra  de  validar  fatores  rotacionados 
obUquamente,  uma  vez  que  eles  têm  uma  maneira  adicional 
(não-ortogonaUdade)  de  se  tornarem  específicos  à  amostra 
e  não-generaHzáveis,  particularmente  com  pequenas  amos¬ 
tras  ou  pequenas  proporções  de  casos  por  variáveis. 

Seleção  entre  métodos  rotacíonais.  Nenhuma  regra  espe¬ 
cífica  foi  desenvolvida  para  guiar  o  pesquisador  na  seleção 
de  uma  técnica  rotacional  ortogonal  ou  oblíqua  em  particu¬ 
lar.  Na  maioria  dos  casos,  o  pesquisador  simplesmente  uti¬ 
liza  a  técnica  rotacional  dada  pelo  programa  de  computa¬ 
dor.  A  maioria  dos  programas  tem  como  padrão  de  rotação 
o  VARIMAX,  mas  todos  os  métodos  rotacionais  mais  im¬ 
portantes  estão  amplamente  disponíveis.  No  entanto,  não 
há  razão  analítica  para  favorecer  um  método  rotacional  em 
detrimento  de  outro.  A  escolha  de  uma  rotação  ortogonal 
ou  oblíqua  deveria  ser  feita  com  base  nas  necessidades  par¬ 
ticulares  de  um  dado  problema  de  pesquisa.  Para  essa  fi¬ 


nalidade,  diversas  considerações  (nas  Regras  Práticas  3-4) 
devem  orientar  a  seleção  do  método  rotacional. 

Julgamento  da  significância  de  cargas  fatoriais 

Ao  interpretar  fatores,  é  preciso  tomar  uma  decisão  sobre 
quais  cargas  fatoriais  vale  a  pena  considerar.  A  discussão 
a  seguir  detalha  questões  relativas  à  significância  prática  e 
estatística,  bem  como  ao  número  de  variáveis,  que  afetam 
a  interpretação  de  cargas  fatoriais. 

Garantia  de  significância  prática.  A  primeira  orientação 
não  é  baseada  em  qualquer  proposição  matemática,  mas  se 
refere  mais  à  significância  prática  ao  fazer  um  exame  pre¬ 
liminar  da  matriz  fatorial  em  termos  das  cargas  fatoriais. 
Como  uma  carga  fatorial  é  a  correlação  da  variável  e  do 
fator,  a  carga  ao  quadrado  é  a  quantia  de  variância  total 
da  variável  explicada  pelo  fator.  Assim,  uma  carga  de  0,30 
reflete  aproximadamente  10%  de  explicação,  e  uma  carga 
de  0,50  denota  que  25%  da  variância  é  explicada  pelo  fator. 
A  carga  deve  exceder  0,70  para  que  o  fator  explique  50% 
da  variância  de  uma  variável.  Logo,  quanto  maior  o  valor 
absoluto  da  carga  fatorial,  mais  importante  a  carga  na  in¬ 
terpretação  da  matriz  fatorial.  Usando  significância  prática 
como  critério,  podemos  avaliar  as  cargas  como  se  segue: 

•  Cargas  fatoriais  na  faixa  de  ±  0,30  a  ±  0,40  são  considera¬ 
das  como  atendendo  o  nível  mínimo  para  interpretação  de 
estrutura. 

•  Cargas  de  ±  0,50  ou  maiores  são  tidas  como  praticamente 
significantes. 

•  Cargas  excedendo  +  0,70*  são  consideradas  indicativas  de  es¬ 
trutura  bem  definida  e  são  a  meta  de  qualquer  análise  fatorial. 

O  pesquisador  deve  perceber  que  cargas  extremamen¬ 
te  altas  (0,80  ou  superiores)  não  são  comuns  e  que  a  signi¬ 
ficância  prática  das  cargas  é  um  critério  importante.  Essas 
orientações  são  aplicáveis  quando  o  tamanho  da  amostra 
é  de  100  ou  maior  e  onde  a  ênfase  é  a  significância  prática, 
e  não  estatística. 

Avaliação  da  significância  estatística.  Como  anteriormen¬ 
te  observado,  uma  carga  fatorial  representa  a  correlação 
entre  uma  variável  original  e  seu  fator.  Ao  determinar  um 
nível  de  significância  para  a  interpretação  de  cargas,  uma 
abordagem  semelhante  à  determinação  da  significância 


*  N.  de  R.  T.:  O  texto  correto  seria  “±0,70”. 
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-  REGRAS  PRÁTICAS  3-4  - 

Escolha  de  métodos  de  rotação  fatorial 

•  Métodos  de  rotação  ortogonal 

•  São  os  mais  empregados 

•  São  os  métodos  preferidos  quando  o  objetivo  da 
pesquisa  é  redução  de  dados  a  um  número  menor 
de  variáveis  ou  a  um  conjunto  de  medidas  nâo- 
correlacionadas  para  uso  subseqüente  em  outras 
técnicas  multivariadas 

•  Métodos  de  rotação  oblíqua 

•  São  mais  adequados  ao  objetivo  de  se  obter  diversos 
fatores  ou  construtos  teoricamente  relevantes, 
pois,  realisticamente  falando,  poucos  construtos  no 
mundo  são  não-correlacionados 


estatística  de  coeficientes  de  correlação  poderia  ser  usada. 
Entretanto,  pesquisas  [14]  têm  demonstrado  que  as  cargas 
fatoriais  têm  erros-padrão  substancialmente  maiores  do  que 
as  correlações  normais.  Assim,  as  cargas  fatoriais  devem  ser 
avaliadas  em  níveis  consideravelmente  mais  restritos.  O 
pesquisador  pode  empregar  o  conceito  de  poder  estatístico 
discutido  no  Capítulo  1  para  especificar  cargas  fatoriais  con¬ 
sideradas  significantes  para  diferentes  tamanhos  de  amos¬ 
tra.  Com  o  objetivo  estabelecido  de  conseguir  um  nível  de 
poder  de  80%,  o  uso  de  um  nível  de  significância  de  0,05  e  a 
inflação  proposta  dos  erros  padrão  de  cargas  fatoriais,  a  Ta¬ 
bela  3-2  contém  os  tamanhos  de  amostra  necessários  para 
cada  valor  de  carga  fatorial  ser  considerado  significante. 


Por  exemplo,  em  uma  amostra  de  100  respondentes,  as 
cargas  fatoriais  de  0,55  ou  mais  são  significantes.  No  en¬ 
tanto,  em  uma  amostra  de  50,  é  exigida  uma  carga  fa¬ 
torial  de  0,75  para  significância.  Em  comparação  com  a 
regra  prática  anterior,  que  denotava  todas  as  cargas  de 
0,30  como  tendo  significância  prática,  essa  abordagem 
consideraria  cargas  de  0,30  como  significantes  somente 
para  amostras  de  350  ou  maiores. 


Essas  são  orientações  muito  conservadoras  quando 
comparadas  com  as  da  seção  anterior  ou  mesmo  com  ní¬ 
veis  estatísticos  associados  aos  coeficientes  de  correlação 
convencionais.  Assim,  essas  orientações  devem  ser  usadas 
como  ponto  de  partida  na  interpretação  de  cargas  fato¬ 
riais,  sendo  as  cargas  menores  consideradas  significantes  e 
acrescentadas  à  interpretação  com  base  em  outras  consi¬ 
derações.  A  seção  a  seguir  detalha  o  processo  de  interpre¬ 
tação,  bem  como  o  papel  de  outras  considerações. 

Ajustes  baseados  no  número  de  variáveis.  Uma  des¬ 
vantagem  das  duas  abordagens  anteriores  é  que  o  número 
de  variáveis  analisadas  e  o  fator  específico  em  exame  não 
são  considerados.  Foi  mostrado  que  quando  o  pesquisa¬ 
dor  se  move  do  primeiro  fator  para  fatores  posteriores. 


TABELA  3-2  Diretrizes  para  identificação  de  cargas  fatoriais 
significantes  com  base  em  tamanho  de  amostra 


Carga  fatorial 

Tamanho  da  amostra 
necessário  para  significância^ 

0,30 

350 

0,35 

250 

0,40 

200 

0,45 

150 

0,50 

120 

0,55 

100 

0,60 

85 

0,65 

70 

0,70 

60 

0,75 

50 

“Significância  se  baseia  em  um  nível  de  significância  (a)  de  0,05,  um  nível  de 
poder  de  80%,  e  erros-padrão  considerados  como  o  dobro  daqueles  de  coefi¬ 
cientes  de  correlação  convencionais 


Fonte-,  Cálculos  feitos  com  SOLO  Power  Analysis,  BMDP  Statistical  Software, 
Inc.,  1993. 

O  nível  aceitável  para  que  uma  carga  seja  julgada  signi¬ 
ficante  deve  aumentar.  O  fato  de  que  a  variância  única 
e  a  variância  do  erro  começam  a  surgir  em  fatores  pos¬ 
teriores  significa  que  algum  ajuste  para  cima  no  nível  de 
significância  deve  ser  incluído  [22j.  O  número  de  variáveis 
em  análise  também  é  importante  na  decisão  sobre  quais 
cargas  são  significantes.  A  medida  que  o  número  de  variá¬ 
veis  em  análise  aumenta,  o  nível  aceitável  para  considerar 
uma  carga  significante  diminui.  O  ajuste  para  o  número  de 
variáveis  é  cada  vez  mais  importante  à  medida  que  se  vai 
do  primeiro  fator  extraído  para  fatores  posteriores. 

As  Regras  Práticas  3-5  resumem  os  critérios  para  sig¬ 
nificância  prática  ou  estatística  de  cargas  fatoriais. 

-  REGRAS  PRÁTICAS  3-5  - 

Avaliação  de  cargas  fatoriais 

•  Apesar  de  cargas  fatoriais  de  ±  0,30  a  ±  0,40  serem 
minimamente  aceitáveis,  valores  maiores  que  ±  0,50  são 
geralmente  considerados  necessários  para  significância 
prática 

•  A  ser  considerado  significante: 

•  Uma  carga  menor  com  uma  amostra  maior  ou  um 
número  maior  de  variáveis  sob  análise 

•  Uma  carga  maior  faz-se  necessária  com  uma 
solução  fatorial  com  um  número  maior  de  fatores, 
especialmente  na  avaliação  de  cargas  em  fatores 
posteriores 

•  Testes  estatísticos  de  significância  para  cargas 
fatoriais  são  geralmente  conservadores  e  devem 
ser  considerados  apenas  como  pontos  de  partida 
necessários  para  inclusão  de  uma  variável  para  futura 
consideração 
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Interpretação  de  uma  matriz  fatorial 

A  tarefa  de  interpretar  uma  matriz  de  cargas  fatoriais  para 
identificar  a  estrutura  entre  as  variáveis  pode  parecer  à 
primeira  vista  muito  complicada.  O  pesquisador  deve  clas¬ 
sificar  todas  as  cargas  fatoriais  (lembre-se,  cada  variável 
tem  uma  carga  sobre  cada  fator)  para  identificar  as  mais 
indicativas  da  estrutura  latente.  Mesmo  uma  análise  rela¬ 
tivamente  simples  de  15  variáveis  sobre  4  fatores  precisa 
de  avaliação  e  interpretação  de  60  cargas  fatoriais.  Usan¬ 
do  os  critérios  para  interpretação  de  cargas  descritos  na 
seção  anterior,  o  pesquisador  descobre  aquelas  variáveis 
distintas  para  cada  fator  e  procura  uma  correspondência 
com  a  fundamentação  conceituai  ou  as  expectativas  ad¬ 
ministrativas  depositadas  na  pesquisa  para  avaliar  signi- 
ficância  prática.  Logo,  interpretar  as  complexas  relações 
representadas  em  uma  matriz  fatorial  exige  uma  combi¬ 
nação  da  aplicação  de  critérios  objetivos  com  julgamento 
gerencial.  Seguindo-se  o  procedimento  de  cinco  etapas 
delineado  a  seguir,  o  processo  pode  ser  simplificado  consi¬ 
deravelmente.  Depois  da  discussão  sobre  o  processo,  um 
breve  exemplo  será  usado  para  ilustrá-lo. 

Etapa  1:  Examine  a  matriz  fatorial  de  cargas.  A  matriz 
de  cargas  fatoriais  contém  a  carga  fatorial  de  cada  variável 
em  cada  fator.  Elas  podem  ser  cargas  rotacionadas  ou  não- 
rotacionadas,  mas,  como  anteriormente  discutido,  cargas 
rotacionadas  são  geralmente  empregadas  na  interpretação 
fatorial  a  menos  que  a  redução  de  dados  seja  o  único  obje¬ 
tivo.  Tipicamente,  os  fatores  são  dispostos  como  colunas; 
assim,  cada  coluna  de  números  representa  as  cargas  de  um 
único  fator.  Se  uma  rotação  oblíqua  foi  usada,  duas  matri¬ 
zes  fatoriais  de  cargas  são  fornecidas.  A  primeira  é  a  ma¬ 
triz  de  padrão  fatorial,  a  qual  tem  cargas  que  representam 
a  contribuição  única  de  cada  variável  ao  fator.  A  segun¬ 
da  é  a  matriz  de  estrutura  fatorial,  a  qual  tem  correlações 
simples  entre  variáveis  e  fatores,  mas  essas  cargas  contêm 
tanto  a  variância  única  entre  variáveis  e  fatores  quanto  a 
correlação  entre  fatores.  A  medida  que  a  correlação  entre 
fatores  se  torna  maior,  fica  mais  difícil  distinguir  quais  va¬ 
riáveis  têm  cargas  únicas  em  cada  fator  na  matriz  de  estru¬ 
tura  fatorial.  Logo,  a  maioria  dos  pesquisadores  relata  os 
resultados  da  matriz  de  padrão  fatorial. 

Etapa  2:  Identifique  a(s)  carga(s)  sígníficante($)  para  cada 
variável.  A  interpretação  deve  começar  com  a  primeira 
variável  no  primeiro  fator  e  se  mover  horizontalmente  da 
esquerda  para  a  direita,  procurando  a  carga  mais  alta  para 
aquela  variável  em  qualquer  fator.  Quando  a  maior  car¬ 
ga  (em  valor  absoluto)  é  identificada,  deve  ser  sublinha¬ 
da  se  for  significante  como  determinado  pelos  critérios 
anteriormente  discutidos.  A  atenção  agora  se  dirige  para 
a  segunda  variável,  e,  novamente  movendo-se  horizon¬ 
talmente  da  esquerda  para  a  direita,  procura-se  a  maior 
carga  para  aquela  variável  em  qualquer  fator,  e  a  mesma 
deve  ser  sublinhada.  Esse  procedimento  deve  continuar 
para  cada  variável  até  que  todas  as  variáveis  tenham  sido 
revistas  quanto  às  suas  maiores  cargas  em  um  fator. 


Entretanto,  a  maioria  das  soluções  fatoriais  não  resulta 
em  uma  estrutura  simples  (uma  única  carga  alta  para  cada 
variável  em  um  único  fator).  Logo,  o  pesquisador  continu¬ 
ará,  depois  de  sublinhar  a  carga  mais  alta  de  uma  variável, 
a  avaliar  a  matriz  fatorial,  sublinhando  todas  as  cargas  sig- 
nificantes  para  uma  carga  em  todos  os  fatores.  O  processo 
de  interpretação  seria  extremamente  simplificado  se  cada 
variável  tivesse  apenas  uma  variável*  significante.  Na  prá¬ 
tica,  no  entanto,  o  pesquisador  pode  descobrir  que  uma 
ou  mais  variáveis  tem  cargas  de  tamanho  moderado  sobre 
diversos  fatores,  todas  significantes,  e  o  trabalho  de  inter¬ 
pretar  fatores  torna-se  muito  mais  difícil.  Quando  uma 
variável  demonstra  ter  mais  de  uma  carga  significante,  ela 
é  chamada  de  carga  cruzada. 

A  dificuldade  surge  porque  uma  variável  com  diversas 
cargas  significantes  (uma  carga  cruzada)  deve  ser  usada 
na  rotulação  de  todos  os  fatores  nos  quais  ela  tem  uma 
carga  significante.  No  entanto,  como  os  fatores  podem  ser 
distintos  e  potencialmente  representar  conceitos  separa¬ 
dos  quando  eles  “compartilham”  variáveis?  Em  última 
análise,  o  objetivo  é  minimizar  o  número  de  cargas  sig¬ 
nificantes  sobre  cada  linha  da  matriz  fatorial  (i.e.,  fazer 
com  que  cada  variável  se  associe  com  um  único  fator).  Q 
pesquisador  pode  descobrir  que  diferentes  métodos  de  ro¬ 
tação  eliminam  cargas  cruzadas  e,  portanto,  definem  uma 
estrutura  simples.  Se  uma  variável  persiste  em  ter  cargas 
cruzadas,  ela  se  torna  candidata  à  eliminação. 

Etapa  3:  Avalie  as  comunalídades  das  variáveis.  Uma 

vez  que  todas  as  cargas  significantes  tenham  sido  identifi¬ 
cadas,  o  pesquisador  deve  procurar  por  variáveis  que  não 
sejam  adequadamente  explicadas  pela  solução  fatorial. 
Uma  abordagem  simples  é  identificar  variáveis  nas  quais 
faltam  pelo  menos  uma  carga  significante.  Qutro  método  é 
examinar  a  comunalidade  de  cada  variável,  representando 
a  quantia  de  variância  explicada  pela  solução  fatorial  para 
cada  variável.  Q  pesquisador  deve  ver  as  comunalidades 
para  avaliar  se  as  variáveis  atendem  níveis  aceitáveis  de 
explicação.  Por  exemplo,  um  pesquisador  pode  especificar 
que  pelo  menos  metade  da  variância  de  cada  variável  deve 
ser  levada  em  conta.  Usando  essa  diretriz,  o  pesquisador 
identificaria  todas  as  variáveis  com  comunalidades  meno¬ 
res  que  0,50  como  não  tendo  explicação  suficiente. 

Etapa  4:  Reespecífique  o  modelo  fatorial  se  neces-sá- 

rio.  Uma  vez  que  todas  as  cargas  significantes  tenham 
sido  identificadas  e  as  comunalidades,  examinadas,  o  pes¬ 
quisador  pode  encontrar  diversos  problemas:  (a)  uma 
variável  não  tem  cargas  significantes;  (b)  mesmo  com 
uma  carga  significante,  a  comunalidade  de  uma  variável 
é  considerada  muito  baixa,  ou  (c)  uma  variável  tem  uma 
carga  cruzada.  Nesta  situação,  o  pesquisador  pode  execu¬ 
tar  qualquer  combinação  das  seguintes  ações  corretivas, 
listadas  da  menos  para  a  mais  extrema: 


*  N.  de  R.  T.:  A  frase  correta  seria  “se  cada  variável  tivesse  apenas 
uma  carga  significante”. 
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•  Ignorar  aquelas  variáveis  problemáticas  e  interpretar  a  solu¬ 
ção  como  ela  é,  o  que  é  apropriado  se  o  objetivo  é  somente 
redução  de  dados,  mas  o  pesquisador  deve  ainda  observar 
que  as  variáveis  em  questão  são  pobremente  representadas 
na  solução  fatorial. 

•  Avaliar  cada  uma  daquelas  variáveis  para  possível  eliminação, 
dependendo  da  contribuição  geral  da  variável  para  a  pesqui¬ 
sa,  bem  como  de  seu  índice  de  comunalidade.  Se  a  variável  é 
de  menor  importância  para  o  objetivo  do  estudo  ou  tem  um 
valor  inaceitável  de  comunalidade,  ela  pode  ser  eliminada,  e  o 
modelo  pode  então  ser  reespecificado  pela  derivação  de  uma 
nova  solução  fatorial  com  aquelas  variáveis  eliminadas. 

•  Empregar  um  método  alternativo  de  rotação,  particular¬ 
mente  um  método  oblíquo,  caso  apenas  métodos  ortogonais 
tenham  sido  usados. 

•  Diminuir/aumentar  o  número  de  fatores  mantidos  para  ver 
se  uma  estrutura  fatorial  menor/maior  representará  aquelas 
variáveis  problemáticas. 

•  Modificar  o  tipo  de  modelo  fatorial  usado  (componentes 
versus  fatores  comuns)  para  avaliar  se  mudanças  do  tipo  de 
variância  considerada  afetam  a  estrutura  fatorial. 

Quaisquer  que  sejam  as  opções  escolhidas  pelo  pesquisa¬ 
dor,  o  objetivo  final  deve  sempre  ser  a  obtenção  de  uma 
estrutura  fatorial  com  apoio  tanto  empírico  quanto  con¬ 
ceituai.  Como  vimos,  muitos  “truques”  podem  ser  utili¬ 
zados  para  melhorar  a  estrutura,  mas  a  responsabilidade 
final  está  com  o  pesquisador  e  com  a  fundamentação  con¬ 
ceituai  subjacente  à  análise. 

Etapa  5:  Rotule  os  fatores.  Quando  é  obtida  uma  solu¬ 
ção  fatorial  aceitável  na  qual  todas  as  variáveis  têm  uma 
carga  significante  em  um  fator,  o  pesquisador  tenta  desig¬ 
nar  algum  significado  para  o  padrão  de  cargas  fatoriais. 
As  variáveis  com  cargas  mais  altas  são  consideradas  mais 
importantes  e  têm  maior  influência  sobre  o  nome  ou  ró¬ 
tulo  selecionado  para  representar  um  fator.  Assim,  o  pes¬ 
quisador  examina  todas  as  variáveis  significantes  para 
um  fator  particular  e,  enfatizando  aquelas  variáveis  com 
maiores  cargas,  tenta  designar  um  nome  ou  rótulo  para 
um  fator  que  reflita  com  precisão  as  variáveis  com  carga 
naquele  fator.  Qs  sinais  são  interpretados  simplesmente 
como  quaisquer  outros  coeficientes  de  correlação.  Em 
cada  fator,  sinais  concordantes  significam  que  as  variáveis 
estão  positivamente  relacionadas,  e  sinais  opostos  signi¬ 
ficam  que  as  variáveis  estão  negativamente  relacionadas. 
Em  soluções  ortogonais,  os  fatores  são  independentes  uns 
dos  outros.  Portanto,  os  sinais  para  cargas  fatoriais  rela- 
cionam-se  apenas  com  o  fator  no  qual  elas  aparecem,  e 
não  com  outros  fatores  na  solução. 

Esse  rótulo  não  é  determinado  ou  designado  pelo  pro¬ 
grama  computacional  que  realiza  a  análise  fatorial;  em 
vez  disso,  o  rótulo  é  desenvolvido  intuitivamente  pelo 
pesquisador  com  base  em  sua  adequação  para  represen¬ 
tar  as  dimensões  latentes  de  um  fator  particular.  Segue-se 
esse  procedimento  para  cada  fator  extraído.  Q  resultado 
final  será  um  nome  ou  rótulo  que  represente  cada  fator 
determinado  da  melhor  maneira  possível. 


Como  discutido  anteriormente,  a  seleção  de  um  núme¬ 
ro  específico  de  fatores  e  o  método  de  rotação  são  inter- 
relacionados.  Várias  tentativas  adicionais  de  rotações 
podem  ser  executadas,  e,  comparando  as  interpretações 
fatoriais  para  diversas  tentativas  de  rotações  diferentes,  o 
pesquisador  pode  selecionar  o  número  de  fatores  a  extrair. 
Em  resumo,  a  habilidade  de  designar  algum  significado 
aos  fatores,  ou  de  interpretar  a  natureza  das  variáveis,  se 
torna  uma  consideração  extremamente  importante  ao  se 
determinar  o  número  de  fatores  a  serem  extraídos. 

Um  exemplo  de  interpretação  fatorial.  Para  servir  como 
ilustração  de  interpretação  fatorial,  nove  medidas  foram 
obtidas  em  um  teste  piloto  baseado  em  uma  amostra  de 
202  respondentes.  Após  a  estimação  dos  resultados  iniciais, 
análises  posteriores  indicaram  que  uma  solução  com  três 
fatores  era  adequada.  Logo,  agora  o  pesquisador  tem  a  ta¬ 
refa  de  interpretar  as  cargas  fatoriais  das  nove  variáveis. 


A  Tabela  3-3  contém  uma  série  de  matrizes  de  cargas 
fatoriais.  A  primeira  a  ser  considerada  é  a  matriz  fatorial 
não-rotacionada  (parte  a).  Examinaremos  as  matrizes  de 
cargas  fatoriais  não-rotacionadas  e  rotacionadas  através 
do  processo  de  cinco  etapas  anteriormente  descrito. 

Etapas  1  e  2:  Examinar  a  matriz  de  cargas  fatoriais  e 
identificar  cargas  significantes.  Dado  o  tamanho  da 
amostra  de  202,  cargas  fatoriais  de  0,40  ou  mais  serão 
consideradas  significantes  para  fins  de  interpretação. 
Usando  esse  padrão  para  as  cargas  fatoriais,  podemos 
ver  que  a  matriz  não-rotacionada  contribui  pouco  para 
se  identificar  qualquer  forma  de  estrutura  simples.  Cinco 
das  nove  variáveis  têm  cargas  cruzadas,  e  para  muitas 
das  outras  variáveis  as  cargas  significantes  são  relativa¬ 
mente  baixas.  Nesta  situação,  rotação  pode  melhorar 
nossa  compreensão  da  relação  entre  as  variáveis. 

Como  mostrado  na  Tabela  3-3b,  a  rotação  VARI- 
MAX  melhora  consideravelmente  a  estrutura  de  duas 
maneiras  notáveis.  Primeiro,  as  cargas  são  melhoradas 
para  quase  todas  as  variáveis,  com  as  mesmas  mais  pro¬ 
ximamente  alinhadas  ao  objetivo  de  se  ter  uma  elevada 
carga  sobre  um  único  fator.  Segundo,  agora  somente 
uma  variável  (Vj)  tem  uma  carga  cruzada. 

Etapa  3:  Avaliar  comunalidades.  Apenas  Vj  tem  uma 

comunalidade  que  é  baixa  (0,299).  Para  nossos  propósi¬ 
tos  Vj  será  mantida,  mas  um  pesquisador  pode  conside¬ 
rar  a  eliminação  de  tais  variáveis  em  outros  contextos 
de  pesquisa.  Isso  ilustra  o  caso  em  que  uma  variável  tem 
uma  carga  significante,  mas  pode  ainda  ser  pobremente 
explicada  pela  solução  fatorial. 

Etapa  4:  Reespeciíicar  o  modelo  fatorial  se  necessário. 

Se  estabelecemos  um  valor  de  referência  de  0,40  para 
significância  de  carga  e  novamente  arranjamos  as  variá¬ 
veis  de  acordo  com  cargas,  emerge  o  padrão  exibido  na 

(Continua) 
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(Continuação) 

Tabela  3-3c.  As  variáveis  V,,  V,  e  Vg  têm  cargas  elevadas 
sobre  o  fator  1,  o  fator  2  é  caracterizado  pelas  variáveis 
Vj,  Vj  e  Vj,  e  o  fator  3  tem  duas  características  distintas 
(V4  e  Vg).  Somente  Vj  é  problemática,  com  cargas  signi- 
ficantes  sobre  os  fatores  1  e  3.  Sabendo  que  pelo  menos 
duas  variáveis  são  dadas  sobre  esses  dois  fatores,  Vj  é 
eliminada  da  análise  e  as  cargas  são  novamente  calcu¬ 
ladas. 

Etapa  5:  Rotular  os  fatores.  Como  mostrado  na  Tabela 
3-3d,  a  estrutura  fatorial  para  as  oito  variáveis  remanes¬ 
centes  é  agora  muito  bem  definida,  representando  três 
grupos  distintos  de  variáveis  que  o  pesquisador  pode 
agora  utilizar  em  pesquisas  posteriores. 


Como  se  mostra  no  exemplo  anterior,  o  processo  de 
interpretação  de  fatores  envolve  julgamentos  tanto  obje¬ 
tivos  quanto  subjetivos.  O  pesquisador  deve  considerar 
uma  vasta  gama  de  questões  o  tempo  todo,  nunca  perden¬ 
do  de  vista  a  meta  final  de  definir  a  melhor  estrutura  do 
conjunto  de  variáveis.  Apesar  de  muitos  detalhes  estarem 
envolvidos,  alguns  dos  princípios  gerais  são  encontrados 
nas  Regras  Práticas  3-6. 

-  REGRAS  PRÁTICAS  3-6  - 

Interpretação  dos  fatores 

•  Existe  uma  estrutura  ótima  quando  todas  as  variáveis 
têm  cargas  altas  em  um  único  fator 

•  Variáveis  com  carga  cruzada  (cargas  elevadas  sobre 
dois  ou  mais  fatores)  são  geralmente  eliminadas 

a  menos  que  sejam  teoricamente  justificadas  ou  o 
objetivo  seja  apenas  redução  de  dados. 

•  Variáveis  em  geral  deveriam  ter  comunalidades 
maiores  que  0,50  para  serem  mantidas  na  análise. 

•  Reespecificação  de  uma  análise  fatorial  pode  incluir 
opções  como  as  que  se  seguem: 

•  Eliminar  uma  ou  mais  variáveis 

•  Mudar  os  métodos  de  rotação 

•  Aumentar  ou  diminuir  o  número  de  fatores 


Estágio  6:  Validação  da  análise  fatorial 

O  sexto  estágio  envolve  a  avaliação  do  grau  de  generalida¬ 
de  dos  resultados  para  a  população  e  da  influência  poten¬ 
cial  de  casos  ou  respondentes  individuais  sobre  os  resulta¬ 
dos  gerais.  A  questão  da  generalidade  é  crítica  para  todo 
método  multivariado,  mas  é  especialmente  relevante  nos 
métodos  de  interdependência,  pois  eles  descrevem  uma 
estrutura  de  dados  que  também  deve  ser  representativa  da 
população.  No  processo  de  validação,  o  pesquisador  deve 
abordar  várias  questões  na  área  de  delineamento  de  pes¬ 
quisa  e  características  de  dados,  como  discutido  a  seguir. 


Uso  de  uma  perspectiva  confirmatória 

O  método  mais  direto  para  validar  os  resultados  é  partir 
para  uma  perspectiva  confirmatória  e  avaliar  a  repetitivi- 
dade  dos  resultados,  seja  com  uma  amostra  particionada  no 
conjunto  de  dados  originais,  seja  com  uma  amostra  separa¬ 
da.  A  comparação  de  dois  ou  mais  resultados  de  um  modelo 
fatorial  sempre  é  problemática.  No  entanto,  existem  várias 
opções  para  realizar  uma  comparação  objetiva.  A  emer¬ 
gência  da  análise  fatorial  confirmatória  (CFA)  por  meio 
da  modelagem  de  equações  estruturais  tem  fornecido  uma 
opção,  mas  geralmente  é  mais  complicada  e  exige  pacotes 
computacionais  adicionais,  como  LISREL  ou  EQS  [4,21]. 
Os  Capítulos  10  e  11  discutem  a  análise  fatorial  confirma¬ 
tória  de  forma  mais  detalhada.  Além  da  CFA,  diversos  ou¬ 
tros  métodos  têm  sido  propostos,  variando  de  um  simples 
índice  de  emparelhamento  [10]  a  programas  (FMATCH) 
projetados  especificamente  para  avaliar  a  correspondência 
entre  matrizes  fatoriais  [34].  Esses  métodos  têm  tido  uso 
esporádico,  devido  em  parte  (1)  à  sua  percebida  falta  de 
sofisticação  e  (2)  à  indisponibilidade  de  softwares  ou  pro¬ 
gramas  analíticos  para  automatizar  as  comparações.  Assim, 
quando  a  CFA  não  é  adequada,  esses  métodos  fornecem 
alguma  base  objetiva  para  a  comparação. 

Avaliação  da  estabilidade  da  estrutura  fatorial 

Um  outro  aspecto  da  generalidade  é  a  estabilidade  dos 
resultados  do  modelo  fatorial.  A  estabilidade  fatorial 
depende  principalmente  do  tamanho  da  amostra  e  do 
número  de  casos  por  variável.  O  pesquisador  sempre  é 
encorajado  a  obter  a  maior  amostra  possível  e  a  desenvol¬ 
ver  modelos  parcimoniosos  para  aumentar  a  proporção 
casos-por-variáveis.  Se  o  tamanho  da  amostra  permite, 
o  pesquisador  pode  querer  particionar  aleatoriamente  a 
amostra  em  dois  subconjuntos  e  estimar  modelos  fatoriais 
para  cada  um.  A  comparação  das  duas  matrizes  fatoriais 
resultantes  fornecerá  uma  avaliação  da  robustez  da  solu¬ 
ção  ao  longo  das  amostras. 

Detecção  de  observações  influentes 

Além  da  generabilidade,  uma  outra  questão  importante 
para  a  validação  da  análise  fatorial  é  a  detecção  de  obser¬ 
vações  influentes.  Discussões  no  Capítulo  2  sobre  a  iden¬ 
tificação  de  observações  atípicas,  bem  como  no  Capítulo 
4  sobre  as  observações  influentes  em  regressão,  encon¬ 
tram  aplicabilidade  em  análise  fatorial.  O  pesquisador  é 
encorajado  a  estimar  o  modelo  com  e  sem  observações 
identificadas  como  atípicas  para  avaliar  seu  impacto  nos 
resultados.  Se  a  omissão  das  observações  atípicas  é  jus¬ 
tificada,  os  resultados  deveriam  ter  maior  generalidade. 
Além  disso,  como  discutido  no  Capítulo  4,  diversas  medi¬ 
das  de  influência  que  refletem  a  posição  de  uma  observa¬ 
ção  relativa  a  todas  as  outras  (por  exemplo,  proporção  de 
covariância)  são  igualmente  aplicáveis  à  análise  fatorial. 
Finalmente,  a  complexidade  dos  métodos  propostos  para 
identificação  de  observações  influentes  específicas  à  análi¬ 
se  fatorial  [11]  limita  a  aplicação  dos  mesmos. 


124  Análise  Multivariada  de  Dados 


TABELA  3-3  Interpretação  de  uma  matriz  hipotética  de  cargas  fatoriais 


(a)  Matriz  de  cargas  fatoriais  não-rotacionada 

(b)  Matriz  VARiMAX  de  cargas  fatoriais  rotacionada 

Fator 

Fator 

1 

2 

3 

1 

2 

3 

Comunalidade 

0,611 

0,250 

-0,204 

0,462 

0,099 

0,505 

0,477 

V, 

0,614 

-0,446 

0,264 

Ve 

0,101 

0,778 

0,173 

0,644 

V, 

0,295 

-0,447 

0,107 

Ve 

-0,134 

0,517 

0,114 

0,299 

V, 

0,561 

-0,176 

-0,550 

V, 

-0,005 

0,184 

0,784 

0,648 

Vs 

0,589 

-0,467 

0,314 

Ve 

0,087 

0,801 

0,119 

0,664 

Ve 

0,630 

-0,102 

-0,285 

Ve 

0,180 

0,302 

0,605 

0,489 

Vr 

0,498 

0,611 

0,160 

V, 

0,795 

-0,032 

0,120 

0,647 

Ve 

0,310 

0,300 

0,649 

Ve 

0,623 

0,293 

-0,366 

0,608 

Ve 

0,492 

0,597 

-0,094 

Ve 

0,694 

-0,147 

0,323 

0,608 

(c)  Matriz  simpiificada  de  cargas  fatoriais 
rotacionada' 

(d)  Matriz  de  cargas  fatoriais  rotacionada  com  1/, 
eliminada^ 

Componente 

Fator 

1 

2 

3 

1 

2 

3 

Vr 

0,795 

Ve 

0,807 

Ve 

0,694 

Ve 

0,803 

Ve 

0,623 

Ve 

0,524 

Ve 

0,801 

V, 

0,802 

Ve 

0,778 

Ve 

0,686 

Ve 

0,517 

Ve 

0,655 

V, 

0,784 

V, 

0,851 

Ve 

0,605 

Ve 

0,717 

V, 

0,462 

0,505 

'  Cargas  menores  que  0,40  não  são  exibidas,  e  variãveis 
são  ordenadas  pelas  maiores  cargas 

^  V,  eiiminada  da  anáiise,  cargas  menores  que  0,40  não  são 
exibidas,  e  variáveis  são  ordenadas  peias  maiores  cargas 

Estágio  7:  Usos  adicionais  dos 
resultados  da  análise  fatorial 

Dependendo  dos  objetivos  da  aplicação  da  análise  fato¬ 
rial,  o  pesquisador  pode  parar  com  a  interpretação  fato¬ 
rial  ou  utilizar-se  de  um  dos  métodos  para  redução  de  da¬ 
dos.  Se  o  objetivo  é  simplesmente  identificar  combinações 
lógicas  de  variáveis  e  entender  melhor  as  inter-relações 
entre  variáveis,  então  a  interpretação  fatorial  basta.  Isso 
fornece  uma  base  empírica  para  julgar  a  estrutura  das  va¬ 
riáveis  e  o  impacto  dessa  estrutura  quando  se  interpretam 
os  resultados  a  partir  de  outras  técnicas  multivariadas.  Se 
o  objetivo,  porém,  é  identificar  variáveis  apropriadas  para 
a  aplicação  subseqüente  em  outras  técnicas  estatísticas, 
então  alguma  forma  de  redução  de  dados  será  emprega¬ 
da.  As  duas  opções  incluem  o  seguinte: 

•  Selecionar  a  variável  com  a  maior  carga  fatorial  como  uma 
representativa  substituta  para  uma  dimensão  fatorial  par¬ 
ticular 


•  Substituir  o  conjunto  original  de  variáveis  por  um  conjunto 
menor  e  inteiramente  novo,  criado  a  partir  de  escalas  múlti¬ 
plas  ou  escores  fatoriais. 

Qualquer  opção  fornecerá  novas  variáveis  para  uso, 
por  exemplo,  como  variáveis  independentes  em  uma  aná¬ 
lise  de  regressão  ou  discriminante,  variáveis  dependentes 
em  análise  multivariada  de  variância,  ou  mesmo  as  variá¬ 
veis  de  agrupamento  em  análise  de  agrupamentos.  Discu¬ 
timos  cada  uma  dessas  opções  para  redução  de  dados  nas 
seções  seguintes. 

Seleção  de  variáveis  substitutas 
para  análise  subseqüente 

Se  a  meta  do  pesquisador  é  simplesmente  identificar  variá¬ 
veis  apropriadas  para  a  aplicação  subseqüente  com  outras 
técnicas  estatísticas,  o  pesquisador  tem  a  opção  de  exami¬ 
nar  a  matriz  fatorial  e  selecionar  a  variável  com  a  maior 
carga  fatorial  em  cada  fator  para  atuar  como  uma  variável 
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substituta  representativa  daquele  fator.  Essa  é  uma  abor¬ 
dagem  simples  e  direta  somente  quando  uma  variável  tem 
uma  carga  fatorial  bem  maior  do  que  todas  as  demais.  Em 
muitos  casos,  porém,  o  processo  de  seleção  é  mais  difícil 
porque  duas  ou  mais  variáveis  têm  cargas  significantes  e 
bastante  próximas  umas  das  outras,  ainda  que  apenas  uma 
seja  escolhida  como  representativa  de  uma  dimensão  em 
particular.  Essa  decisão  deve  ser  baseada  no  conhecimento 
a  priori  que  o  pesquisador  tem  da  teoria,  que  pode  sugerir 
que  uma  variável,  mais  que  as  outras,  seria  logicamente  re¬ 
presentativa  da  dimensão.  Além  disso,  o  pesquisador  pode 
ter  conhecimento  sugerindo  que  uma  variável  com  carga  le¬ 
vemente  inferior  é  de  fato  mais  confiável  do  que  a  variável 
com  carga  fatorial  maior.  Nesses  casos,  o  pesquisador  pode 
escolher  a  variável  com  carga  ligeiramente  menor  como  a 
melhor  variável  para  representar  um  fator  particular. 

O  método  de  selecionar  uma  única  variável  substitu¬ 
ta  como  representativa  do  fator  -  apesar  de  ser  simples  e 
manter  a  variável  original  -  tem  várias  desvantagens  po¬ 
tenciais. 

•  Não  aborda  a  questão  do  erro  de  medida  encontrada  quando 
se  usam  medidas  únicas  (ver  a  seção  seguinte  para  uma  dis¬ 
cussão  mais  detalhada). 

•  Também  corre-se  o  risco  de  resultados  potencialmente  enga¬ 
nadores  pela  seleção  de  somente  uma  variável  para  represen¬ 
tar  um  resultado  que  talvez  seja  mais  complexo.  Por  exemplo, 
suponha  que  variáveis  que  representem  a  competitividade 
de  preço,  a  qualidade  de  produto  e  o  valor  fossem  encon¬ 
tradas  com  elevadas  cargas  em  um  único  fator.  A  seleção 
de  uma  dessas  variáveis  em  separado  criaria  interpretações 
muito  diferentes  em  qualquer  análise  posterior,  ainda  que 
todas  possam  estar  tão  intimamente  relacionadas  a  ponto  de 
tornar  qualquer  distinção  definitiva  impossível. 

Em  casos  nos  quais  diversas  cargas  elevadas  complicam 
a  seleção  de  uma  única  variável,  o  pesquisador  pode  não 
ter  escolha  a  não  ser  empregar  a  análise  fatorial  como  a 
base  para  calcular  uma  escala  múltipla  ou  escores  fatoriais 
para  uso  como  uma  variável  substituta.  O  objetivo,  como 
no  caso  da  seleção  de  uma  única  variável,  é  representar 
melhor  a  natureza  básica  do  fator  ou  do  componente. 

Criação  de  escalas  múltiplas 

O  Capítulo  1  introduziu  o  conceito  de  uma  escala  múl¬ 
tipla,  a  qual  é  formada  pela  combinação  de  diversas  va¬ 
riáveis  individuais  em  uma  única  medida  composta.  Em 
termos  simples,  todas  as  variáveis  com  cargas  elevadas  em 
um  fator  são  combinadas,  e  o  total  -  ou,  mais  comumente, 
o  escore  médio  das  variáveis  -  é  usado  como  uma  variável 
de  substituição.  Uma  escala  múltipla  apresenta  dois  bene¬ 
fícios  específicos. 

•  Fornece  um  meio  de  superar  consideravelmente  o  erro  de 
medida  inerente  em  todas  as  variáveis  medidas.  Erro  de  me¬ 
dida  é  o  grau  em  que  os  valores  observados  não  são  repre¬ 
sentativos  dos  valores  “reais”  devido  a  diversas  razões,  que 
variam  de  erros  reais  (p.ex.,  erros  na  entrada  de  dados)  à  fal¬ 
ta  de  habilidade  de  indivíduos  fornecerem  informações  pre¬ 


cisas.  O  impacto  do  erro  de  medida  é  mascarar  parcialmen¬ 
te  relações  (p.ex.,  correlações  ou  comparações  de  médias  de 
grupos)  e  dificultar  a  estimação  de  modelos  multivariados. 
A  escala  múltipla  reduz  o  erro  de  medida  usando  indicado¬ 
res  (variáveis)  múltiplos  para  reduzir  a  dependência  de  uma 
única  resposta.  Usando  a  resposta  média  ou  típica  de  um 
conjunto  de  variáveis  relacionadas,  o  erro  de  medida  que 
poderia  ocorrer  em  uma  única  questão  será  reduzido. 

•  Um  segundo  benefício  da  escala  múltipla  é  sua  habilidade 
de  representar  os  múltiplos  aspectos  de  um  conceito  com  uma 
medida  única.  Muitas  vezes,  empregamos  mais  variáveis  em 
nossos  modelos  multivariados  como  uma  tentativa  de  re¬ 
presentar  as  muitas  facetas  de  um  conceito  que  sabemos  ser 
muito  complexo.  Entretanto,  ao  fazer  isso,  complicamos  a 
interpretação  dos  resultados  por  causa  da  redundância  nos 
itens  associados  ao  conceito.  Logo,  gostaríamos  de  não  ape¬ 
nas  acomodar  as  descrições  mais  ricas  de  conceitos  usando 
múltiplas  variáveis,  mas  também  de  manter  a  parcimônia  no 
número  de  variáveis  em  nossos  modelos  multivariados.  A 
escala  múltipla,  quando  corretamente  construída,  combina 
os  múltiplos  indicadores  em  uma  só  medida  que  representa 
o  que  acontece  em  comum  no  conjunto  de  medidas. 

O  processo  de  construção  de  escala  tem  fundamentos 
teóricos  e  empíricos  em  diversas  disciplinas,  incluindo  a 
teoria  psicométrica,  a  sociologia  e  o  marketing.  Apesar  de 
um  tratamento  completo  das  técnicas  e  questões  envolvidas 
estarem  além  do  escopo  deste  livro,  existem  várias  fontes 
excelentes  para  leitura  complementar  sobre  esse  assunto 
[2,12,20,30,31].  Além  disso,  há  uma  série  de  compilações  de 
escalas  existentes  que  podem  ser  aplicadas  em  várias  situa¬ 
ções  [3,7,32].  Discutimos  aqui,  porém,  quatro  questões  bási¬ 
cas  para  a  construção  de  qualquer  escala  múltipla:  definição 
conceituai,  dimensionalidade,  confiabihdade  e  validade. 

Definição  conceituai.  O  ponto  de  partida  para  criar 
qualquer  escala  múltipla  é  sua  definição  conceituai.  A  de¬ 
finição  conceituai  especifica  a  base  teórica  para  a  escala 
múltipla  definindo  o  conceito  a  ser  representado  em  ter¬ 
mos  aplicáveis  ao  contexto  de  pesquisa.  Na  pesquisa  aca¬ 
dêmica,  as  definições  teóricas  são  baseadas  em  pesquisa 
prévia  que  define  o  caráter  e  a  natureza  de  um  conceito. 
Em  um  contexto  gerencial,  conceitos  específicos  podem 
ser  definidos  de  modo  que  se  relacionem  a  objetivos  pro¬ 
postos,  como  imagem,  valor  ou  satisfação.  Em  qualquer 
caso,  a  criação  de  uma  escala  múltipla  sempre  é  orientada 
pela  definição  conceituai,  especificando  o  tipo  e  o  caráter 
dos  itens  que  são  candidatos  à  inclusão  na  escala. 

A  validade  de  conteúdo  é  a  avaliação  da  correspondência 
das  variáveis  a  serem  incluídas  em  uma  escala  múltipla  e 
sua  definição  conceituai.  Essa  forma  de  validade,  também 
conhecida  como  validade  de  expressão,  avalia  subjeti¬ 
vamente  a  correspondência  entre  os  itens  individuais  e 
o  conceito  por  meio  de  avaliações  de  especialistas,  pré- 
testes  com  múltiplas  subpopulações  ou  outros  meios.  O 
objetivo  é  garantir  que  a  seleção  de  itens  de  escala  aborde 
não  apenas  questões  empíricas,  mas  também  inclua  consi¬ 
derações  práticas  e  teóricas  [12,31]. 
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Dímensíonalidade.  Uma  suposição  inerente  e  exigência 
essencial  para  a  criação  de  uma  escala  múltipla  é  que  os 
itens  sejam  unidimensionais,  significando  que  eles  estão 
fortemente  associados  um  com  o  outro  e  representam 
um  só  conceito  [20,24].  A  análise  fatorial  tem  um  papel 
essencial  na  realização  de  uma  avaliação  empírica  da  di- 
mensionalidade  de  um  conjunto  de  itens,  pela  determi¬ 
nação  do  número  de  fatores  e  das  cargas  de  cada  variável 
nos  mesmos.  O  teste  de  unidimensionalidade  significa 
que  cada  escala  múltipla  deve  consistir  de  itens  com  car¬ 
gas  altas  em  um  único  fator  [1,20,24,28].  Se  uma  escala 
múltipla  é  proposta  como  tendo  múltiplas  dimensões, 
cada  dimensão  deve  ser  refletida  por  um  fator  separado. 
O  pesquisador  pode  avaliar  unidimensionalidade  com 
análise  fatorial  exploratória,  como  discutido  neste  capí¬ 
tulo,  ou  com  análise  fatorial  confirmatória,  como  descrito 
nos  Capítulos  10  e  11. 

Confiabilidade.  Confiabilidade  é  uma  avaliação  do  grau 
de  consistência  entre  múltiplas  medidas  de  uma  variável. 
Uma  forma  de  confiabilidade  é  teste/reteste,  pelo  qual  a 
consistência  é  medida  entre  as  respostas  para  um  indiví¬ 
duo  em  dois  pontos  no  tempo.  O  objetivo  é  garantir  que 
as  respostas  não  sejam  muito  variadas  durante  períodos 
de  tempo,  de  modo  que  uma  medida  tomada  em  qualquer 
instante  seja  confiável.  Uma  segunda  medida  de  confiabi¬ 
lidade,  mais  comumente  usada,  é  a  consistência  interna,  a 
qual  avalia  a  consistência  entre  as  variáveis  em  uma  escala 
múltipla.  A  idéia  da  consistência  interna  é  que  os  itens  ou 
indicadores  individuais  da  escala  devem  medir  o  mesmo 
construto,  e  assim  serem  altamente  intercorrelacionados 
[12,28]. 

Como  nenhum  item  isolado  é  uma  medida  perfeita  de 
um  conceito,  devemos  confiar  em  várias  medidas  diagnós¬ 
ticas  para  avaliar  consistência  interna. 

•  As  primeiras  medidas  que  consideramos  se  relacionam  a 
cada  item  separado,  incluindo  a  correlação  item-com-total 
(a  correlação  do  item  com  o  escore  da  escala  múltipla)  e  a 
correlação  inter-itens  (a  correlação  entre  itens).  Regras  prá¬ 
ticas  sugerem  que  as  correlações  item-com-total  excedam 
0,50  e  que  as  correlações  inter-itens  excedam  0,30  [31]. 

•  O  segundo  tipo  de  medida  diagnóstica  é  o  coeficiente  de  con¬ 
fiabilidade  que  avalia  a  consistência  da  escala  inteira,  sendo 
o  alfa  de  Cronbach  [15,28,29]  a  medida  mais  amplamente 
usada.  O  limite  inferior  para  o  alfa  de  Cronbach  geralmente 
aceito  é  de  0,70  [31,32],  apesar  de  poder  diminuir  para  0,60 
em  pesquisa  exploratória  [31].  Uma  questão  na  avaliação 
do  alfa  de  Cronbach  é  sua  relação  positiva  com  o  número 
de  itens  na  escala.  Como  o  aumento  do  número  de  itens, 
mesmo  com  grau  igual  de  intercorrelação,  aumenta  o  valor 
de  confiabilidade,  os  pesquisadores  devem  fazer  exigências 
mais  severas  para  escalas  com  muitos  itens. 

•  Também  estão  disponíveis  as  medidas  de  confiabilidade 
determinadas  a  partir  da  análise  fatorial  confirmatória.  In¬ 
cluídas  nessas  medidas  estão  a  confiabilidade  composta  e  a 
variância  média  extraída,  discutidas  mais  detalhadamente 
no  Capítulo  11. 


Cada  um  dos  principais  programas  estatísticos  agora 
tem  módulos  ou  programas  de  avaliação  de  confiabili¬ 
dade,  de  modo  que  o  pesquisador  dispõe  de  uma  análise 
completa  tanto  das  medidas  específicas  de  itens  quanto  de 
medidas  gerais  de  confiabilidade.  Qualquer  escala  múlti¬ 
pla  deve  ter  sua  confiabilidade  analisada  para  garantir  sua 
adequação  antes  de  se  proceder  a  uma  avaliação  de  sua 
validade. 

Validade.  Após  garantir  que  uma  escala  (1)  está  de 
acordo  com  sua  definição  conceituai,  (2)  é  unidimensio¬ 
nal  e  (3)  atende  aos  níveis  necessários  de  confiabilidade, 
o  pesquisador  deve  fazer  uma  avaliação  final:  validade 
da  escala.  Validade  é  o  grau  em  que  uma  escala  ou  um 
conjunto  de  medidas  representa  com  precisão  o  conceito 
de  interesse.  Já  vimos  uma  forma  de  validade  -  validade 
de  conteúdo  ou  expressão  -  na  discussão  sobre  definições 
conceituais.  Outras  formas  de  validade  são  medidas  em¬ 
piricamente  pela  correlação  entre  conjuntos  de  variáveis 
teoricamente  definidos.  As  três  formas  mais  amplamente 
aceitas  de  validade  são  a  convergente,  a  discriminante  e  a 
nomológica  [8,30]. 

•  A  validade  convergente  avalia  o  grau  em  que  duas  medidas 
do  mesmo  conceito  estão  correlacionadas.  Neste  ponto,  o 
pesquisador  pode  procurar  medidas  alternativas  de  um  con¬ 
ceito  e  então  correlacioná-las  com  a  escala  múltipla.  Corre¬ 
lações  altas  indicam  que  a  escala  está  medindo  seu  conceito 
pretendido. 

•  A  validade  discriminante  é  o  grau  em  que  dois  conceitos 
similares  são  distintos.  O  teste  empírico  é  novamente  a 
correlação  entre  medidas,  mas  dessa  vez  a  escala  múltipla 
está  correlacionada  com  uma  medida  semelhante,  mas  con- 
ceitualmente  distinta.  Agora,  a  correlação  deve  ser  baixa, 
demonstrando  que  a  escala  múltipla  é  suficientemente  dife¬ 
rente  do  outro  conceito  semelhante. 

•  Finalmente,  a  validade  nomológica  refere-se  ao  grau  em  que 
a  escala  múltipla  faz  previsões  precisas  de  outros  conceitos 
em  um  modelo  teórico.  O  pesquisador  deve  identificar  rela¬ 
ções  teóricas  a  partir  de  pesquisa  anterior  ou  de  princípios 
aceitos  e  então  avaliar  se  a  escala  tem  relações  correspon¬ 
dentes.  Em  resumo,  a  validade  convergente  confirma  que  a 
escala  está  correlacionada  com  outras  medidas  conhecidas 
do  conceito;  a  validade  discriminante  garante  que  a  escala  é 
suficientemente  diferente  de  outros  conceitos  semelhantes 
para  ser  distinta;  e  a  validade  nomológica  determina  se  a  es¬ 
cala  demonstra  as  relações  mostradas  como  existentes,  com 
base  em  teoria  ou  pesquisa  prévia. 

Vários  métodos  para  avaliar  a  validade  estão  dispo¬ 
níveis,  variando  de  matrizes  multitraço,  multimétodo 
(MTMM)  a  abordagens  de  equações  estruturais.  Apesar 
de  estar  além  do  escopo  deste  texto,  diversas  fontes  dispo¬ 
níveis  abordam  vários  métodos  e  as  questões  envolvidas 
nas  técnicas  específicas  [8,21,30]. 

Cálculo  de  escalas  múltiplas.  O  cálculo  de  escalas  múlti¬ 
plas  é  um  processo  direto  no  qual  os  itens  compreendendo 
a  escala  múltipla  (i.e.,  os  itens  com  cargas  altas  da  análise 
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fatorial)  são  somados  ou  têm  suas  médias  calculadas.  A 
abordagem  mais  comum  é  considerar  a  média  dos  itens  na 
escala,  o  que  fornece  ao  pesquisador  um  controle  comple¬ 
to  sobre  o  cálculo  e  facilita  o  uso  em  análises  posteriores. 

Sempre  que  variáveis  têm  cargas  positivas  e  negativas 
dentro  do  mesmo  fator,  ou  as  variáveis  com  cargas  positi¬ 
vas,  ou  aquelas  com  cargas  negativas  devem  ter  seus  dados 
revertidos.  Tipicamente,  as  variáveis  com  as  cargas  nega¬ 
tivas  são  revertidas  no  escore,  de  modo  que  correlações  e 
cargas  são  agora  todas  positivas  no  mesmo  fator.  Escore 
reverso  é  o  processo  pelo  qual  os  valores  dos  dados  para 
uma  variável  são  revertidos  de  forma  que  suas  correlações 
com  outras  variáveis  são  revertidas  (i.e.,  passam  de  nega¬ 
tivas  para  positivas).  Por  exemplo,  em  nossa  escala  de  0  a 
10,  revertemos  o  escore  de  uma  variável  subtraindo  o  valor 
original  de  10  (ou  seja,  escore  reverso  =  10  -  valor  origi¬ 
nal).  Desse  modo,  escores  originais  de  10  e  0  agora  têm  os 
valores  revertidos  de  0  e  10.  Todas  as  características  de  dis¬ 
tribuição  são  mantidas;  apenas  a  distribuição  é  revertida. 

A  meta  do  escore  reverso  é  prevenir  um  anulamento 
de  variáveis  com  cargas  positivas  e  negativas.  Usemos  um 
exemplo  de  duas  variáveis  com  correlação  negativa. 


Estamos  interessados  em  combinar  U  e  V2,  com  U  tendo 
carga  positiva,  e  V2,  negativa.  Se  10  é  o  escore  máximo  em 
Uj,  o  máximo  em  U  0-  Agora  considere  dois  casos. 
No  caso  1,  U  tem  um  valor  igual  a  10  e  Vj  tem  valor  0 
(o  melhor  caso).  No  segundo  caso,  tem  um  valor  0  e 
V2  tem  valor  10  (o  pior  caso).  Se  V2  não  é  escore  reverti¬ 
do,  então  o  escore  calculado  pela  soma  das  duas  variáveis 
para  ambos  os  casos  é  10,  mostrando  nenhuma  diferen¬ 
ça,  apesar  de  sabermos  que  o  caso  1  é  melhor  e  o  2  é  o 
pior.  Não  obstante,  se  revertemos  o  escore  Vj,  a  situação 
muda.  Agora  o  caso  1  tem  valores  10  e  10  em  U  e  V2,  res¬ 
pectivamente,  e  o  caso  2  tem  valores  0  e  0.  Os  escores  de 
escala  múltipla  são  agora  20  para  o  caso  1  e  0  para  o  caso 
2,  o  que  os  distingue  como  a  melhor  e  a  pior  situação. 


Resumo.  As  escalas  múltiplas,  um  dos  desenvolvimentos 
recentes  em  pesquisa  acadêmica,  estão  encontrando  apli¬ 
cação  crescente  em  pesquisa  aplicada  e  gerencial  também. 
A  habilidade  da  escala  múltipla  de  representar  conceitos 
complexos  em  uma  única  medida  e  ainda  reduzir  erros 
de  medida  a  torna  uma  valiosa  ferramenta  em  qualquer 
análise  multivariada.  A  análise  fatorial  fornece  ao  pesqui¬ 
sador  uma  avaliação  empírica  das  inter-relações  entre  va¬ 
riáveis,  essencial  na  formação  do  fundamento  conceituai 
e  empírico  de  uma  escala  múltipla  por  meio  da  avaliação 
da  validade  de  conteúdo  e  da  dimensionalidade  da  escala 
(ver  Regras  Práticas  3-7). 

Cálculo  de  escores  fatoriais 

A  terceira  opção  para  criar  um  conjunto  menor  de  va¬ 
riáveis  para  substituir  o  conjunto  original  é  o  cálculo  de 
escores  fatoriais.  Escores  fatoriais  também  são  medidas 


-  REGRAS  PRÁTICAS  3-7  - 

Escalas  múltiplas 

•  Uma  escala  múltipla  é  apenas  tão  boa  quanto  os 
itens  usados  para  representar  o  construto;  ainda  que 
possa  passar  em  todos  os  testes  empíricos,  é  inútil  sem 
justificativa  teórica 

•  Nunca  crie  uma  escala  múltipla  sem  primeiro 
avaliar  sua  unidimensionalidade  com  análise  fatorial 
exploratória  ou  confirmatória 

•  Uma  vez  que  uma  escala  é  considerada  unidimensional, 
seu  escore  de  confiabilidade,  medido  pelo  alfa  de 
Cronbach: 

•  Deve  exceder  uma  referência  de  0,70,  apesar  de 
um  nível  de  0,60  poder  ser  utilizado  em  pesquisa 
exploratória 

•  Deve  ter  seu  valor  de  referência  aumentado 
à  medida  que  o  número  de  itens  aumenta, 
especialmente  quando  o  número  de  itens  se 
aproxima  de  10  ou  mais 

•  Com  a  confiabilidade  estabelecida,  a  validade  deve  ser 
avaliada  em  termos  de: 

•  Validade  convergente  -  a  escala  se  correlaciona  com 
outras  escalas  semelhantes 

•  Validade  discriminante  -  a  escala  é  suficientemente 
diferente  de  outras  escalas  relacionadas 

•  Validade  nomológica  -  a  escala  “prevê”  como 
teoricamente  sugerido 


compostas  de  cada  fator  computadas  para  cada  indivíduo. 
Conceitualmente,  o  escore  fatorial  representa  o  grau  em 
que  cada  indivíduo  tem  escore  elevado  no  grupo  de  itens 
que  têm  cargas  elevadas  em  um  fator.  Assim,  valores  mais 
altos  nas  variáveis  com  cargas  elevadas  em  um  fator  resul¬ 
tam  em  um  escore  fatorial  superior.  A  característica-chave 
que  diferencia  um  escore  fatorial  de  uma  escala  múltipla 
é  que  o  escore  fatorial  é  computado  com  base  nas  cargas 
fatoriais  de  todas  as  variáveis  no  fator,  enquanto  a  escala 
múltipla  é  calculada  combinando-se  apenas  variáveis  se¬ 
lecionadas.  Portanto,  apesar  de  o  pesquisador  ser  capaz 
de  caracterizar  um  fator  pelas  variáveis  com  as  maiores 
cargas,  ele  também  deve  considerar  as  cargas  das  outras 
variáveis,  embora  menores,  e  sua  influência  no  escore  fa¬ 
torial. 

A  maioria  dos  programas  estatísticos  computa  facil¬ 
mente  escores  fatoriais  para  cada  respondente.  Selecio- 
nando-se  a  opção  de  escore  fatorial,  esses  escores  são  sal¬ 
vos  para  uso  em  análises  posteriores.  A  desvantagem  dos 
escores  fatoriais  é  que  eles  não  são  facilmente  repetidos 
em  estudos,  pois  são  baseados  na  matriz  fatorial,  a  qual  é 
determinada  separadamente  em  cada  estudo.  A  repetição 
da  mesma  matriz  fatorial  em  estudos  requer  substancial 
programação  computacional. 
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Seleção  entre  os  três  métodos 

Para  escolher  entre  as  três  opções  de  redução  de  dados, 
o  pesquisador  deve  tomar  várias  decisões,  ponderando  as 
vantagens  e  desvantagens  de  cada  abordagem  com  os  ob¬ 
jetivos  da  pesquisa.  As  diretrizes  nas  Regras  Práticas  3-8 
abordam  as  condições  fundamentais  associadas  com  cada 
método. 

A  regra  de  decisão  é,  portanto,  a  seguinte: 

•  Se  dados  são  usados  somente  na  amostra  original  ou  se  ortogo- 
nalidade  deve  ser  mantida,  escores  fatoriais  são  adequados. 

•  Se  generalidade  ou  capacidade  de  transferência  são  dese¬ 
jáveis,  então  escalas  múltiplas  ou  variáveis  substitutas  são 
mais  apropriadas.  Se  a  escala  múltipla  é  um  instrumento 
bem  construído,  válido  e  confiável,  então  é  provavelmente 
a  melhor  alternativa. 

•  Se  a  escala  múltipla  não  é  testada  e  é  exploratória,  com 
pouca  ou  nenhuma  evidência  de  confiabilidade  ou  valida¬ 
de,  variáveis  substitutas  deverão  ser  consideradas  caso  uma 
análise  adicional  não  seja  possível  para  melhorar  a  escala 
múltipla. 

-  REGRAS  PRÁTICAS  3-8  - 

Representação  da  análise  fatorial 
em  ontras  análises 

•  A  variável  substituta  única 

Vantagens 

•  Simples  de  administrar  e  interpretar 
Desvantagens 

•  Não  representa  todas  as  “facetas”  de  um  fator 

•  Suscetível  a  erro  de  medida 

•  Escores  fatoriais 

Vantagens 

•  Representam  todas  as  variáveis  com  cargas 
naquele  fator 

•  Melhor  método  para  completa  redução  de  dados 

•  São  naturalmente  ortogonais  e  podem  evitar 
complicações  provocadas  por  multicolinearidade 

Desvantagens 

•  Interpretação  mais  difícil,  pois  todas  as  variáveis 
contribuem  com  as  cargas 

•  Difícil  de  repetir  em  estudos 

•  Escalas  múltiplas 

Vantagens 

•  Conciliação  entre  a  variável  substituta  e  opções 
de  escore  fatorial 

•  Reduzem  erro  de  medida 

•  Representam  múltiplas  facetas  de  um  conceito 

•  Facilmente  replicáveis  em  estudos 
Desvantagens 

•  Incluem  apenas  as  variáveis  com  cargas  elevadas 
sobre  o  fator  e  excluem  aquelas  com  impacto 
pequeno  ou  periférico 

•  Não  há  necessariamente  ortogonalidade 

•  Exigem  análise  extensiva  de  questões  de 
confiabilidade  e  validade 


UM  EXEMPLO  ILUSTRATIVO 

Nas  seções  anteriores,  as  questões  mais  importantes  re¬ 
ferentes  à  aplicação  de  análise  fatorial  foram  discutidas 
dentro  da  estrutura  de  construção  de  modelos  introdu¬ 
zida  no  Capítulo  1.  Para  melhor  esclarecer  esses  tópicos, 
usamos  um  exemplo  ilustrativo  da  aplicação  de  análise  fa¬ 
torial  baseado  em  informações  da  base  de  dados  apresen¬ 
tada  no  Capítulo  1.  Nossa  discussão  do  exemplo  empírico 
também  segue  o  processo  de  construção  de  modelo  em 
seis  estágios.  Os  três  primeiros  estágios,  comuns  à  aná¬ 
lise  de  componentes  ou  à  análise  de  fatores  comuns,  são 
discutidos  primeiramente.  Em  seguida,  os  estágios  4  a  6, 
de  análise  de  componentes,  serão  discutidos,  juntamente 
com  exemplos  do  uso  adicional  de  resultados  fatoriais. 
Concluímos  com  um  exame  das  diferenças  em  relação  à 
análise  de  fatores  comuns  nos  estágios  4  e  5. 

Estágio  1:  Objetivos  da  análise  fatorial 

A  análise  fatorial  pode  identificar  a  estrutura  de  um  con¬ 
junto  de  variáveis,  bem  como  fornecer  um  processo  para 
a  redução  de  dados.  Em  nosso  exemplo,  as  percepções  da 
HB  AT  sobre  13  atributos  (X^  a  são  examinadas  pelos 
seguintes  motivos: 


•  Entender  se  essas  percepções  podem  ser  “agrupadas”. 
Mesmo  o  número  relativamente  pequeno  de 
percepções  examinadas  aqui  apresenta  um  complexo 
quadro  de  78  correlações  distintas.  Agrupando  as 
percepções,  a  HBAT  será  capaz  de  exibir  o  quadro 
geral  em  termos  de  compreensão  de  seus  clientes  e  o 
que  os  mesmos  pensam  sobre  a  HBAT. 

•  Reduzir  as  13  variáveis  a  um  número  menor.  Se  as  13 
variáveis  podem  ser  representadas  em  um  número 
menor  de  variáveis  compostas,  então  as  outras  técnicas 
multivariadas  podem  se  tornar  mais  parcimoniosas.  É 
claro  que  essa  abordagem  considera  que  exista  algum 
arranjo  latente  nos  dados  em  análise. 


Qualquer  um  ou  ambos  os  objetivos  podem  ser  encon¬ 
trados  em  uma  questão  de  pesquisa,  tornando  a  análise 
fatorial  aplicável  a  uma  vasta  gama  de  questões.  Além 
disso,  como  a  base  para  o  desenvolvimento  de  escalas 
múltiplas,  ela  tem  conquistado  cada  vez  maior  uso  nos 
últimos  anos. 

Estágio  2:  Planejamento  de 
nma  análise  fatorial 

Compreender  a  estrutura  das  percepções  de  variáveis  re¬ 
quer  análise  fatorial  do  tipo  R  e  uma  matriz  de  correla¬ 
ções  entre  variáveis,  não  respondentes.  Todas  as  variáveis 
são  métricas  e  constituem  um  conjunto  homogêneo  de 
percepções  adequado  à  análise  fatorial. 
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O  tamanho  da  amostra  neste  exemplo  tem  uma  propor¬ 
ção  de  8:1  na  razão  entre  observações  e  variáveis,  o  que 
está  dentro  de  limites  aceitáveis.  Além  disso,  o  tamanho 
da  amostra  de  100  fornece  uma  base  adequada  para  o 
cálculo  das  correlações  entre  variáveis. 


Estágio  3:  Suposições  em  análise  fatorial 

As  suposições  estatísticas  subjacentes  causam  um  impacto 
na  análise  fatorial,  no  sentido  de  que  afetam  as  correlações 
determinadas.  Desvios  da  normalidade,  homocedasticida- 
de  e  linearidade  podem  diminuir  as  correlações  entre  va¬ 
riáveis.  Essas  suposições  são  examinadas  no  Capítulo  2, 
e  convidamos  o  leitor  a  rever  os  resultados  das  investiga¬ 
ções.  O  pesquisador  também  deve  avaliar  a  viabilidade  da 
análise  fatorial  a  partir  da  matriz  de  correlação.  O  primei¬ 
ro  passo  é  um  exame  visual  das  correlações,  identificando 
as  que  são  estatisticamente  significantes. 


A  Tabela  3-4  mostra  a  matriz  de  correlação  para  as  13 
percepções  da  HBAT.  A  inspeção  da  matriz  de  correla¬ 
ção  revela  que  29  das  78  correlações  (37%)  são  signifi¬ 
cantes  no  nível  0,01,  o  que  fornece  uma  base  adequada 
a  seguir  para  um  exame  empírico  da  adequação  para  a 
análise  fatorial  tanto  em  uma  base  geral  quanto  para  cada 
variável.  A  tabulação  do  número  de  correlações  signifi¬ 
cantes  por  variável  apresenta  um  intervalo  de  0  (A^j)  a  9 
(Ajy).  Apesar  de  não  existirem  limites  sobre  o  que  é  alto 
ou  baixo  demais,  variáveis  sem  correlações  significantes 
podem  não  ser  parte  de  qualquer  fator,  e  se  uma  variável 
tem  um  grande  número  de  correlações,  ela  pode  ser  par¬ 
te  de  diversos  fatores.  Podemos  observar  esses  padrões  e 
ver  como  eles  são  refletidos  à  medida  que  a  análise  pros¬ 
segue. 


O  pesquisador  pode  avaliar  a  significância  geral  da 
matriz  de  correlação  com  o  teste  de  Bartlett  e  a  fatorabili- 
dade  do  conjunto  geral  de  variáveis  e  variáveis  individuais 
usando  a  medida  de  adequação  de  amostra  (MS A).  Como 
a  análise  fatorial  sempre  gera  fatores,  o  objetivo  é  garantir 
um  nível  de  referência  de  correlação  estatística  dentro  do 
conjunto  de  variáveis,  de  modo  que  a  estrutura  fatorial 
resultante  tenha  alguma  base  objetiva. 


Neste  exemplo,  o  teste  de  Bartlett  revela  que  as  corre¬ 
lações,  quando  tomadas  coletivamente,  são  significantes 
no  nível  de  0,0001  (ver  Tabela  3-4).  Este  teste  indica 
apenas  a  presença  de  correlações  não-nulas,  e  não  o 
padrão  dessas  correlações.  A  medida  de  adequação  da 
amostra  (MSA)  olha  não  apenas  as  correlações,  mas 
seus  padrões  entre  variáveis.  Nessa  situação,  o  valor  ge¬ 
ral  MSA  está  no  nível  aceitável  (acima  de  0,50),  com  um 
valor  de  0,609.  O  exame  dos  valores  para  cada  variável, 


porém,  identifica  três  variáveis  (Ajj,  e  Aj,)  que  têm 
valores  MSA  abaixo  de  0,50.  Como  Ajj  tem  o  menor  va¬ 
lor  MSA,  essa  variável  será  omitida  na  tentativa  de  obter 
um  conjunto  de  variáveis  que  possam  exceder  os  níveis 
MSA  mínimos  aceitáveis.  Recalculando  os  valores  MSA, 
percebe-se  que  ainda  tem  um  valor  MSA  individual 
abaixo  de  0,50,  e  portanto  também  é  eliminada  da  análi¬ 
se.  Devemos  observar  neste  ponto  que  Ajj  e  eram  as 
duas  variáveis  com  o  número  de  correlações  signiflcan- 
tes  mais  baixo  e  o  mais  elevado,  respectivamente. 

A  Tabela  3-5  contém  a  matriz  de  correlação  para  o 
conjunto  revisado  de  variáveis  (Ajj  e  Aj,  eliminadas)  jun¬ 
to  com  as  medidas  de  adequação  da  amostra  e  o  valor 
do  teste  de  Bartlett.  Na  matriz  de  correlação  reduzida, 
20  das  55  correlações  são  estatisticamente  significantes. 
Como  no  caso  do  conjunto  completo  de  variáveis,  o  teste 
de  Bartlett  mostra  que  as  correlações  não-nulas  existem 
no  nível  de  significância  de  0,0001.  O  conjunfo  reduzi¬ 
do  de  variáveis  atende  coletivamente  à  base  necessária 
de  adequação  da  amostra  com  um  valor  MSA  de  0,653. 
Cada  variável  também  excede  o  valor  base,  indicando 
que  o  conjunto  reduzido  de  variáveis  atende  aos  requi¬ 
sitos  fundamentais  para  a  análise  fatorial.  Finalmente,  o 
exame  das  correlações  parciais  mostra  apenas  cinco  com 
valores  maiores  que  0,50  (Aj-Ajj,A7-Aj2,Ag-Aj4,A5-Aj8,  e 
Aji-Aig),  que  é  outro  indicador  da  força  das  relações  en¬ 
tre  as  variáveis  no  conjunto  reduzido.  Vale  observar  que 
ambas  Ajj  e  Ajg  estão  envolvidas  em  duas  das  correlações 
parciais  elevadas.  Coletivamente,  todas  essas  medidas  in¬ 
dicam  que  o  conjunto  reduzido  de  variáveis  é  adequado 
à  análise  fatorial,  e  a  análise  pode  prosseguir  para  os  pró¬ 
ximos  estágios. 


Análise  fatorial  de  componentes:  estágios  4  a  7 

Como  anteriormente  observado,  os  procedimentos  da 
análise  fatorial  são  baseados  na  computação  inicial  de 
uma  tabela  completa  de  intercorrelações  entre  as  variá¬ 
veis  (matriz  de  correlação).  A  matriz  de  correlação  é  en¬ 
tão  transformada  por  meio  de  estimação  de  um  modelo 
fatorial  para  obter  uma  matriz  fatorial  contendo  cargas 
fatoriais  para  cada  variável  em  cada  fator  obtido.  As  car¬ 
gas  de  cada  variável  nos  fatores  são  então  interpretadas 
para  identificar  a  estrutura  latente  das  variáveis,  nesse 
caso,  percepções  da  HBAT.  Esses  passos  de  análise  fa¬ 
torial,  contidos  nos  estágios  de  4  a  7,  são  examinados  pri¬ 
meiramente  para  análise  de  componentes.  Em  seguida, 
uma  análise  de  fatores  comuns  é  executada,  e  são  feitas 
comparações  entre  os  dois  modelos  fatoriais. 

Estágio  4:  Determinação  de  fatores 
e  avaliação  do  ajuste  geral 

Sabendo-se  que  o  método  de  componentes  para  extra¬ 
ção  será  usado  primeiro,  a  próxima  decisão  é  escolher  o 
número  de  componentes  a  ser  retido  para  posterior  aná- 


TABELA  3-4  Avaliação  da  adequação  da  anãlise  fatorial:  correlações,  medidas  de  adequação  da  amostra,  e  correlações  parciais  entre  variãveis 

Correlações  entre  variáveis 
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lise.  Como  anteriormente  discutido,  o  pesquisador  deve 
empregar  diversos  critérios  distintos  para  determinar  o 
número  de  fatores  a  serem  mantidos  para  interpretação, 
variando  dos  mais  subjetivos  (p.ex.,  escolha  a  priori  de  um 
número  de  fatores  ou  especificação  do  percentual  de  va¬ 
riância  extraída)  aos  mais  objetivos  (critério  da  raiz  laten¬ 
te  ou  teste  scree). 


A  Tabela  3-6  contém  a  informação  sobre  os  11  fatores 
possíveis  e  seu  poder  explanatório  relativo  expresso  por 
seus  autovalores.  Além  da  avaliação  da  importância  de 
cada  componente,  também  podemos  usar  os  autova¬ 
lores  para  auxiliar  na  seleção  do  número  de  fatores.  O 
pesquisador  não  está  limitado  a  opiniões  prévias  sobre 
o  número  de  fatores  que  devem  ser  mantidos,  mas  por 
razões  práticas  de  se  desejarem  múltiplas  medidas  por 
fator  que  sugerem  que  entre  3  e  5  fatores  seriam  melhor 
associados  às  11  variáveis  sob  análise.  Se  aplicarmos  o 
critério  da  raiz  latente  para  manter  fatores  com  autova¬ 
lores  maiores  do  que  1,0,  quatro  fatores  serão  mantidos. 
O  teste  scree  (Figura  3-9),  porém,  indica  que  cinco  fa¬ 
tores  podem  ser  apropriados  quando  se  consideram  as 
mudanças  em  autovalores  (i.e.,  identificar  o  “ângulo” 
nos  autovalores).  Ao  ver  o  autovalor  para  o  quinto  fa¬ 
tor,  determinou-se  que  seu  baixo  valor  (0,61)  em  relação 
ao  valor  1,0  do  critério  da  raiz  latente  inviabiliza  sua  in¬ 
clusão.  Se  o  autovalor  estivesse  bem  próximo  de  1,  en¬ 
tão  poderia  também  ser  considerado  para  inclusão.  Os 
quatro  fatores  retidos  representam  79,6%  da  variância 
das  11  variáveis,  considerado  suficiente  em  termos  de 
variância  total  explicada.  Combinar  todos  esses  critérios 
conduz  à  conclusão  de  manter  quatro  fatores  para  poste¬ 
rior  análise.  Mais  importante,  esses  resultados  ilustram  a 
necessidade  por  critérios  múltiplos  de  decisão  na  defini¬ 
ção  do  número  de  componentes  a  serem  mantidos. 


Estágio  5:  Interpretação  dos  fatores 

Com  quatro  fatores  a  serem  analisados,  o  pesquisador 
agora  se  volta  à  interpretação  dos  fatores.  Uma  vez  que 
a  matriz  fatorial  de  cargas  tenha  sido  calculada,  o  proces¬ 
so  de  interpretação  prossegue  com  o  exame  de  matrizes 
não-rotacionadas  e  em  seguida  as  rotacionadas,  para  de¬ 
tectar  cargas  significantes  e  comunalidades  adequadas.  Se 
deficiências  são  encontradas,  reespecificação  dos  fatores  é 
considerada.  Uma  vez  que  os  fatores  estejam  finalizados, 
eles  podem  ser  descritos  com  base  nas  cargas  fatoriais  sig¬ 
nificantes  caracterizando  cada  fator. 

Etapa  1:  Examine  a  matriz  fatorial  de  cargas  para  a  matriz 
fatorial  não-rotacionada.  Cargas  fatoriais,  sejam  em  ma¬ 
trizes  não-rotacionadas  ou  rotacionadas,  representam  o 
grau  de  associação  (correlação)  de  cada  variável  com  cada 
fator.  As  cargas  desempenham  um  papel  importante  na 
interpretação  dos  fatores,  particularmente  se  elas  forem 
usadas  de  maneiras  que  exijam  caracterização  quanto  ao 


TABELA  3-6  Resultados  para  a  extração  de  fatores  componentes 


Autovalores 

Componente 

Total 

Percentual  de 
variância 

Percentual 

cumulativo 

1 

3,43 

31,2 

31,2 

2 

2,55 

23,2 

54,3 

3 

1,69 

15,4 

69,7 

4 

1,09 

9,9 

79,6 

5 

0,61 

5,5 

85,1 

6 

0,55 

5,0 

90,2 

7 

0,40 

3,7 

93,8 

8 

0,25 

2,2 

96,0 

9 

0,20 

1,9 

97,9 

10 

0,13 

1,2 

99,1 

11 

0,10 

0,9 

100,0 

significado  substantivo  dos  fatores  (p.ex.,  como  variáveis 
preditoras  em  uma  relação  de  dependência).  O  objetivo 
da  análise  fatorial  nesses  casos  é  maximizar  a  associação 
de  cada  variável  com  um  único  fator,  muitas  vezes  por 
meio  de  rotação  da  matriz  fatorial.  O  pesquisador  deve 
julgar  quanto  à  adequação  da  solução  neste  estágio  e  sua 
representação  da  estrutura  de  variáveis  e  a  habilidade  de 
atender  às  metas  da  pesquisa.  Examinamos  primeiramen¬ 
te  a  solução  sem  rotação  e  determinamos  se  o  uso  da  solu¬ 
ção  com  rotação  é  necessário. 


A  Tabela  3-7  apresenta  a  matriz  fatorial  não-rotacionada 
da  análise  de  componentes.  Para  iniciar  a  análise,  expli¬ 
quemos  os  números  incluídos  na  tabela.  Cinco  colunas 
de  números  são  mostradas.  As  quatro  primeiras  são  os 
resultados  para  os  quatro  fatores  extraídos  (ou  seja,  car¬ 
gas  fatoriais  de  cada  variável  em  cada  fator).  A  quinta 
coluna  fornece  estatísticas  resumidas  detalhando  quão 
bem  cada  variável  é  explicada  pelas  quatro  componen¬ 
tes,  as  quais  são  discutidas  na  próxima  seção.  A  primeira 
linha  de  números  na  parte  inferior  de  cada  coluna  é  a 
soma  da  coluna  de  cargas  fatoriais  ao  quadrado  (autova¬ 
lores)  e  indica  a  importância  relativa  de  cada  fator  na  ex¬ 
plicação  da  variância  associada  ao  conjunto  de  variáveis. 
Note  que  as  somas  dos  quadrados  para  os  quatro  fatores 
são  3,427,  2,551,  1,691  e  1,087,  respectivamente.  Como 
esperado,  a  solução  fatorial  extrai  os  fatores  na  ordem 
de  sua  importância,  com  fator  1  explicando  a  maior  par¬ 
te  da  variância,  o  fator  2  ligeiramente  menos,  e  assim  por 
diante  ao  longo  de  todos  os  11  fatores.  Na  extremidade 
à  direita  da  linha  está  o  número  8,756,  que  representa  o 
total  dos  quatro  autovalores  (3,427-h2,551-h1, 691+1,087). 
O  total  de  autovalores  representa  a  quantia  total  de  va¬ 
riância  extraída  pela  solução  fatorial. 
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Fator 

FIGURA  3-9  Teste  scree  para  análise  de  componentes. 


A  quantia  total  de  variância  explicada  por  um  fator  ou 
pela  solução  fatorial  geral  pode  ser  comparada  com  a  va¬ 
riação  total  no  conjunto  de  variáveis  que  é  representada 
pelo  traço  da  matriz  fatorial.  O  traço  é  a  variância  total  a 
ser  explicada  e  é  igual  à  soma  dos  autovalores  do  conjunto 
de  variáveis.  Em  análise  de  componentes,  o  traço  é  igual 
ao  número  de  variáveis,  visto  que  cada  variável  tem  um 
autovalor  possível  de  1,0.  Acrescentando  os  percentuais 
de  traço  para  cada  um  dos  fatores  (ou  dividindo  o  total 
de  autovalores  dos  fatores  pelo  traço),  obtemos  o  percen¬ 
tual  total  de  traço  extraído  para  a  solução  fatorial.  Esse 
total  é  usado  como  um  índice  para  determinar  o  quão 
bem  uma  solução  fatorial  em  particular  explica  aquilo  que 
todas  as  variáveis  juntas  representam.  Se  as  variáveis  são 
todas  muito  diferentes  umas  das  outras,  esse  índice  será 
pequeno.  Se  as  variáveis  recaem  em  um  ou  mais  grupos 
altamente  redundantes  ou  relacionados,  e  se  os  fatores 
extraídos  explicam  todos  os  grupos,  o  índice  se  aproxima¬ 
rá  de  100%. 


Os  percentuais  de  traço  explicados  por  cada  um  dos 
quatro  fatores  (31,15%,  23,19%,  15,37%  e  9,88%)  são 
mostrados  como  a  última  linha  de  valores  da  Tabela 
3-7.  O  percentual  de  traço  é  obtido  dividindo-se  a  soma 
de  quadrados  (autovalores)  de  cada  fator  pelo  traço 
para  o  conjunto  de  variáveis  analisado.  Por  exemplo, 
dividir  a  soma  de  quadrados  de  3,427  para  o  fator  1 
pelo  traço  de  11,0  resulta  no  percentual  de  traço  de 
31,154%  para  o  fator  1.  O  índice  para  a  solução  ge¬ 
ral  mostra  que  79,59%  da  variância  total  (8,756/11,0) 
é  representado  pela  informação  contida  na  matriz  fa¬ 
torial  da  solução  em  termos  de  quatro  fatores.  Logo, 
o  índice  para  essa  solução  é  alto,  e  as  variáveis  estão 
na  realidade  estreitamente  relacionadas  umas  com  as 
outras. 


Etapa  2:  Identifique  as  cargas  significantes  na  matriz  fa¬ 
torial  não-rotacionada  Após  definir  os  vários  elementos 
da  matriz  fatorial  não-rotacionada,  examinemos  os  pa¬ 
drões  de  cargas  fatoriais.  Como  discutido  anteriormente, 
as  cargas  fatoriais  permitem  a  descrição  de  cada  fator  e  da 
estrutura  no  conjunto  de  variáveis. 


Como  antecipado,  o  primeiro  fator  explica  a  maior  quan¬ 
tia  de  variância  na  Tabela  3-7.  O  segundo  fator  é  de  al¬ 
gum  modo  um  fator  geral,  com  metade  das  variáveis 
tendo  cargas  elevadas  (cargas  altas  são  definidas  como 
sendo  maiores  que  0,40).  O  terceiro  fator  tem  duas  cargas 
altas,  enquanto  o  quarto  tem  apenas  uma  carga  elevada. 
Com  base  nesse  padrão  de  cargas  fatoriais  com  um  nú¬ 
mero  relativamente  grande  de  cargas  elevadas  no  fator 
2  e  somente  uma  no  fator  4,  a  interpretação  seria  difícil 
e  teoricamente  menos  significativa.  Portanto,  o  pesqui¬ 
sador  deve  rotacionar  a  matriz  fatorial  para  redistribuir 
a  variância  dos  primeiros  fatores  para  os  seguintes.  Ro¬ 
tação  deve  resultar  em  um  padrão  fatorial  mais  simples 
e  teoricamente  mais  significativo.  No  entanto,  antes  de 
proceder  com  o  processo  de  rotação,  devemos  examinar 
as  comunalidades  para  ver  se  quaisquer  variáveis  têm  co- 
munalidades  tão  baixas  que  elas  devam  ser  eliminadas. 


Etapa  3:  Avalie  as  comunalidades  das  variáveis  na  matriz 
fatorial  não-rotacionada.  A  soma  em  linha  de  cargas  fa¬ 
toriais  quadradas,  conhecida  como  comunalidade,  mostra 
a  quantia  de  variância  em  uma  variável  que  é  explicada 
pelos  dois*  fatores  tomados  juntos.  O  tamanho  da  comu¬ 
nalidade  é  um  índice  útil  para  avaliar  o  quanto  de  variân¬ 
cia  em  uma  variável  particular  é  explicado  pela  solução 
fatorial.  Valores  mais  altos  de  comunalidade  indicam 
que  uma  grande  quantia  da  variância  em  uma  variável 
foi  extraída  pela  solução  fatorial.  Comunalidades  peque¬ 
nas  mostram  que  uma  porção  substancial  da  variância  da 
variável  não  é  explicada  pelos  fatores.  A  despeito  de  ne¬ 
nhuma  diretriz  estatística  indicar  exatamente  o  que  é  “pe¬ 
queno”  ou  “grande”,  considerações  práticas  sugerem  um 
nível  mínimo  de  0,50  para  comunalidades  nesta  análise. 


As  comunalidades  na  Tabela  3-7  são  mostradas  no  ex¬ 
tremo  direito  da  tabela.  Por  exemplo,  a  comunalidade 
de  0,576  para  a  variável  indica  que  ela  tem  menos  em 
comum  com  as  outras  variáveis  incluídas  na  análise  do 
que  Xg,  a  qual  tem  uma  comunalidade  de  0,893.  Ambas 
as  variáveis,  porém,  ainda  compartilham  mais  da  meta¬ 
de  de  sua  variância  com  os  quatro  fatores.  Todas  as  co¬ 
munalidades  são  suficientemente  altas  para  se  proceder 
com  a  rotação  da  matriz  fatorial. 


*  N.  de  R.  T.:  A  frase  correta  seria  “pelos  quatro  fatores  tomados 
juntos”. 
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TABELA  3-7  Matriz  de  análise  fatorial  de  componentes  não-rotacionada 


Fator 

Variáveis 

1 

2 

3 

4 

Comunaiidade 

Xe 

Qualidade  do  produto 

0,248 

-0,501 

-0,081 

0,670 

0,768 

Comércio  eletrônico 

0,307 

0,713 

0,306 

0,284 

0,777 

Suporte  técnico 

0,292 

-0,369 

0,794 

-0,202 

0,893 

Solução  de  reclamações 

0,871 

0,031 

-0,274 

-0,215 

0,881 

Anúncio 

0,340 

0,581 

0,115 

0,331 

0,576 

Linha  de  produto 

0,716 

-0,455 

-0,151 

0,212 

0,787 

Imagem  da  equipe  de  venda 

0,377 

0,752 

0,314 

0,232 

0,859 

Preço  competitivo 

-0,281 

0,660 

-0,069 

-0,348 

0,641 

Garantia  e  reclamações 

0,394 

-0,306 

0,778 

-0,193 

0,892 

Encomenda  e  cobrança 

0,809 

0,042 

-0,220 

-0,247 

0,766 

>í,8 

Velocidade  de  entrega 

0,876 

0,117 

-0,302 

-0,206 

0,914 

Total 

Soma  de  quadrados  (autovalor) 

3,427 

2,551 

1,691 

1,087 

8,756 

Percentual  de  traço“ 

31,15 

23,19 

15,37 

9,88 

79,59 

“Traço  =11,0  (soma  de  autovalores) 


Aplicação  de  uma  rotação  ortogonal  (VARIMAX).  Sa- 

bendo-se  que  a  matriz  fatorial  não-rotacionada  não  tinha 
um  conjunto  de  cargas  fatoriais  completamente  limpo  (ou 
seja,  tinha  cargas  cruzadas  substanciais  ou  não  maximiza¬ 
va  as  cargas  de  cada  variável  em  um  fator),  uma  técnica 
de  rotação  pode  ser  aplicada  para,  com  sorte,  melhorar  a 
interpretação.  Nesse  caso,  a  rotação  VARIMAX  é  usada, 
e  seu  impacto  sobre  a  solução  fatorial  geral  e  as  cargas 
fatoriais  é  descrito  a  seguir. 


A  matriz  fatorial  da  análise  de  componentes  rotaciona- 
da  VARIMAX  é  mostrada  na  Tabela  3-8.  Note  que  a 
quantia  total  de  variância  extraída  na  solução  rotaciona- 
da  é  a  mesma  da  não-rotacionada,  79,6%.  Além  disso,  as 
comunalidades  para  cada  variável  não  mudam  quando 
uma  técnica  de  rotação  é  empregada.  Entretanto,  duas 
diferenças  são  visíveis.  Primeiro,  a  variância  é  redis¬ 
tribuída  de  modo  que  o  padrão  de  cargas  fatoriais  e  o 
percentual  de  variância  para  cada  fator  é  ligeiramente 
diferente.  Especificamente,  na  solução  fatorial  rotacio- 
nada  VARIMAX,  o  primeiro  fator  explica  26,3%  da  va¬ 
riância,  comparado  com  31,2%  da  solução  não-rotacio¬ 


nada.  De  modo  semelhante,  os  outros  fatores  também 
mudam,  sendo  que  a  maior  mudança  ocorre  no  quarto, 
aumentando  de  9,9%  na  solução  não-rotacionada  para 
16,1%  na  rotacionada.  Assim,  o  poder  explicativo  mu¬ 
dou  ligeiramente  para  uma  distribuição  mais  equilibrada 
por  causa  da  rotação.  Segundo,  a  interpretação  da  matriz 
fatorial  é  simplificada.  Como  será  discutido  na  próxima 
seção,  as  cargas  fatoriais  para  cada  variável  são  maximi¬ 
zadas  para  cada  uma  sobre  um  fator,  exceto  em  casos  de 
cruzamento  de  cargas. 


Etapas  2  e  3:  Avalie  as  cargas  fatoriais  significantes  e  co¬ 
munalidades  da  matriz  fatorial  rotacionada.  Com  a  rota¬ 
ção  completa,  o  pesquisador  agora  examina  a  matriz  fato¬ 
rial  rotacionada  quanto  a  padrões  de  cargas  significantes, 
esperando  encontrar  uma  estrutura  simplificada.  Se  ainda 
persistirem  problemas  (i.e.,  cargas  não-significantes  para 
uma  ou  mais  variáveis,  cargas  cruzadas  ou  comunalidades 
inaceitáveis),  o  pesquisador  deve  considerar  reespecifica- 
ção  da  análise  fatorial  através  do  conjunto  de  opções  dis¬ 
cutidas  anteriormente. 
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TABELA  3-8  Matrizes  de  análise  fatorial  de  componentes  rotacionadas  por  VARIMAX:  conjuntos  completos  e 
reduzidos  de  variáveis 


CARGAS  ROTACIONADAS  POR  VARIMAX"* 
Fator 


Conjunto  completo  de  variáveis 

1 

2 

3 

4 

Comunalidade 

X,g  Velocidade  de  entrega 

0,938 

0,914 

Xg  Solução  de  reclamação 

0,926 

0,881 

X,5  Encomenda  &  cobrança 

0,864 

0,766 

X,2  Imagem  da  equipe  de  venda 

0,900 

0,859 

X,  Comércio  eletrônico 

0,871 

0,777 

X,o  Anúncio 

0,742 

0,576 

Xg  Suporte  técnico 

0,939 

0,893 

X,4  Garantia  e  reclamações 

0,931 

0,892 

Xg  Qualidade  do  produto 

0,876 

0,768 

X,3  Preço  competitivo 

-0,723 

0,641 

X,,  Linha  de  produto 

0,591 

0,642 

0,787 

Total 

Soma  de  quadrados  (autovalor) 

2,893 

2,234 

1,855 

1,774 

8,756 

Percentual  de  traço 

26,30 

20,31 

16,87 

16,12 

79,59 

"  Cargas  fatoriais  menores  que  0,40  não  foram  impressas,  e  as  variáveis  foram  agrupadas  por  cargas  em  cada  fator. 

CARGAS  ROTACIQNADAS  PQR  VARIMAX"* 

Conjunto  reduzido  de  variáveis 

Fator 

1 

2 

3 

4 

Comunalidade 

(Xu  eliminada) 

Xg  Solução  de  reclamação 

0,933 

0,890 

X,g  Velocidade  de  entrega 

0,931 

0,894 

X,g  Encomenda  &  cobrança 

0,886 

0,806 

X,2  Imagem  da  equipe  de  venda 

0,898 

0,860 

X,  Comércio  eletrônico 

0,868 

0,780 

X,„  Anúncio 

0,743 

0,585 

Xg  Suporte  técnico 

0,940 

0,894 

X„  Garantia  e  reclamações 

0,933 

0,891 

Xg  Qualidade  do  produto 

0,892 

0,798 

X,3  Preço  competitivo 

-0,730 

0,661 

Total 

Soma  de  quadrados  (autovalor) 

2,589 

2,216 

1,846 

1,406 

8,057 

Percentual  de  traço 

25,89 

22,16 

18,46 

14,06 

80,57 

“  Cargas  fatoriais  menores  que  0,40  não  foram  impressas,  e  as  variáveis  foram  agrupadas  por  cargas  em  cada  fator. 


Na  solução  fatorial  rotacionada  (Tabela  3-8),  cada  uma 
das  variáveis  tem  cargas  significantes  (definidas  como 
um  valor  acima  de  0,40)  sobre  apenas  um  fator,  exceto 
para  que  cruza  sobre  dois  fatores  (1  e  4).  Além  disso, 
todas  as  cargas  estão  acima  de  0,70,  o  que  significa  que 
mais  da  metade  da  variância  é  explicada  pelas  cargas  em 
um  só  fator.  Com  todas  as  comunalidades  de  tamanho 
suficiente  para  garantir  inclusão,  a  única  decisão  que  fica 
é  determinar  a  ação  a  ser  tomada  em 


Etapa  4:  Reespecífique  o  modelo  fatorial,  se  neces¬ 
sário.  Ainda  que  a  matriz  fatorial  rotacionada  tenha 
melhorado  a  simplicidade  das  cargas  fatoriais,  as  cargas 
cruzadas  de  X^^  nos  fatores  1  e  4  exigem  ação.  As  ações 


possíveis  incluem  ignorar  o  cruzamento  de  cargas,  elimi¬ 
nar  Xjj  para  evitar  o  cruzamento,  usar  outra  técnica  de  ro¬ 
tação,  ou  diminuir  o  número  de  fatores.  A  discussão  que 
se  segue  aborda  essas  opções  e  o  curso  de  ação  escolhido. 


O  exame  da  matriz  de  correlação  na  Tabela  3-5  mostra 
que  Au  tem  elevadas  correlações  com  Ag  (parte  do  fator 
4),  Ag  (parte  do  fator  1)  e  A^  (parte  do  fator  2).  Logo, 
não  surpreende  que  ela  possa  ter  várias  cargas  elevadas. 
Com  as  cargas  de  0,642  (fator  4)  e  0,591  (fator  1)  quase 
idênticas,  o  cruzamento  de  cargas  é  tão  substancial  que 
não  pode  ser  ignorado.  Quanto  a  empregar  outra  técnica 
de  rotação,  análise  adicional  mostrou  que  os  outros  mé- 

(Continua) 
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todos  ortogonais  (QUARTIMAX  e  EQUIMAX)  ainda 
têm  este  problema  fundamental.  Além  disso,  o  número 
de  fatores  não  deve  diminuir  devido  à  variância  explica¬ 
da  relativamente  grande  (16,1%)  para  o  quarto  fator. 

Assim,  o  curso  de  ação  a  ser  tomado  é  a  eliminação 
de  Ajj  da  análise,  deixando  10  variáveis.  A  matriz  fato¬ 
rial  rotacionada  e  outras  informações  para  o  conjunto 
reduzido  de  10  variáveis  são  também  exibidas  na  Tabela 
3-8.  Como  vemos,  as  cargas  fatoriais  para  as  10  variáveis 
permanecem  quase  idênticas,  exibindo  o  mesmo  padrão 
e  quase  os  mesmos  valores  para  as  cargas.  A  quantia  de 
variância  explicada  aumenta  ligeiramente  para  80,6%. 
Com  o  padrão  simplificado  de  cargas  (todas  em  níveis 
significantes),  todas  as  comunalidades  acima  de  50%  (e 
a  maioria  muito  maiores),  e  o  nível  geral  de  variância  ex¬ 
plicada  suficientemente  alto,  a  solução  com  10  variáveis 
e  4  fatores  é  aceita,  com  a  etapa  final  sendo  a  descrição 
dos  fatores. 


Etapa  5:  Nomeação  dos  fatores.  Quando  uma  solução 
fatorial  satisfatória  foi  determinada,  o  pesquisador  em 
seguida  tenta  atribuir  algum  significado  aos  fatores.  O 
processo  envolve  substantiva  interpretação  do  padrão  de 
cargas  fatoriais  para  as  variáveis,  incluindo  seus  sinais,  em 
um  esforço  para  nomear  cada  fator.  Antes  da  interpreta¬ 
ção,  um  nível  mínimo  aceitável  de  significância  para  car¬ 
gas  fatoriais  deve  ser  selecionado.  Em  seguida,  todas  as 
cargas  fatoriais  significantes  tipicamente  são  utilizadas  no 
processo  de  interpretação.  Variáveis  com  cargas  maiores 
influenciam  mais  a  seleção  de  nome  ou  rótulo  para  repre¬ 
sentar  um  fator. 


Examinemos  os  resultados  na  Tabela  3-8  para  ilustrar 
esse  procedimento.  A  solução  fatorial  foi  determinada 
a  partir  da  análise  de  componentes  com  uma  rotação 
VARIMAX  das  10  percepções  da  HBAT.  O  ponto  de 
corte  para  fins  de  interpretação  neste  exemplo  é  todas 
as  cargas  de  ±  0,40  ou  acima  (ver  Tabela  3-2).  Esse  é  um 
ponto  de  corte  relativamente  baixo  para  ilustrar  o  pro¬ 
cesso  de  interpretação  fatorial  com  tantas  cargas  signi¬ 
ficantes  quanto  possível.  Contudo,  em  nosso  exemplo, 
todas  as  cargas  recaem  bem  acima  ou  abaixo  dessa  refe¬ 
rência,  tornando  a  interpretação  bastante  direta. 

A  interpretação  substantiva  é  baseada  nas  cargas 
significantes.  Na  Tabela  3-8,  cargas  abaixo  de  0,40  não 
foram  impressas,  e  as  variáveis  são  agrupadas  por  suas 
cargas  sobre  cada  fator.  Um  padrão  de  variáveis  com 
cargas  elevadas  para  cada  fator  torna-se  evidente.  Os 
fatores  1  e  2  têm  três  variáveis  com  cargas  significan¬ 
tes,  e  os  fatores  3  e  4  têm  duas.  Cada  fator  pode  ser 
nomeado  com  base  nas  variáveis  com  cargas  signifi¬ 
cantes: 


1.  Fator  1  Atendimento  pós-venda:  -  soluções  de  re¬ 
clamação,  Ajg  -  velocidade  de  entrega  e  X^^  -  enco¬ 
menda  e  cobrança 

2.  Fator  2  Marketing:  X^^  “  imagem  da  equipe  de  venda, 
Xy  -  presença  de  comércio  eletrônico  e  -  anúncio 

3.  Fator  3  Suporte  técnico:  Xg  -  suporte  técnico  e  - 
garantia  e  reclamações 

4.  Fator  4  Valor  do  produto:  X^  -  qualidade  do  produto 
e  Ay  -  preço  competitivo 

Uma  questão  em  particular  deve  ser  observada:  No 
fator  4,  preço  competitivo  (Ay)  e  qualidade  do  produ¬ 
to  (Aj)  têm  sinais  opostos.  Isso  significa  que  qualidade 
de  produto  e  preço  competitivo  variam  juntos,  mas  se 
movem  em  sentidos  opostos  um  em  relação  ao  outro. 
Percepções  são  mais  positivas  se  a  qualidade  do  produto 
aumenta  ou  o  preço  cai.  O  balanço  dessas  duas  situações 
opostas  leva  ao  nome  do  fator,  valor  do  produto.  Quan¬ 
do  variáveis  têm  sinais  diferentes,  o  pesquisador  precisa 
ser  cuidadoso  na  compreensão  das  relações  entre  variá¬ 
veis  antes  de  nomear  os  fatores  e  deve  também  executar 
ações  especiais  se  calcular  escalas  múltiplas  (ver  discus¬ 
são  anterior  sobre  escore  reverso). 

Três  variáveis  (Ay,  Ay  e  Ay)  não  foram  incluídas  na 
análise  fatorial  final.  Quando  as  interpretações  de  car¬ 
gas  fatoriais  são  apresentadas,  deve  ser  observado  que 
essas  variáveis  não  foram  incluídas.  Se  os  resultados  são 
usados  em  outras  análises  multivariadas,  essas  três  pode¬ 
riam  ser  incluídas  como  variáveis  separadas,  apesar  de 
não  se  poder  garantir  sua  ortogonalidade  em  relação  aos 
escores  fatoriais. 


Q  processo  de  nomear  fatores  se  baseia  principalmen¬ 
te  na  opinião  subjetiva  do  pesquisador.  Em  muitos  casos, 
diferentes  pesquisadores  sem  dúvida  designarão  diferen¬ 
tes  nomes  aos  mesmos  resultados  por  causa  de  diferenças 
em  suas  experiências  e  treinamento.  Por  esse  motivo,  o 
processo  de  nomear  fatores  está  sujeito  a  consideráveis 
críticas.  Se  for  possível  designar  um  nome  lógico  que  re¬ 
presente  a  natureza  latente  dos  fatores,  isso  geralmente 
facilitará  a  apresentação  e  a  compreensão  da  solução  fato¬ 
rial  e,  portanto,  tem-se  um  procedimento  justificável. 

Aplicação  de  uma  rotação  oblíqua.  A  rotação  VARI- 
MAX  é  ortogonal,  o  que  significa  que  os  fatores  perma¬ 
necem  sem  correlação  ao  longo  do  processo  de  rotação. 
Mas  em  muitas  situações,  os  fatores  não  precisam  ser  não- 
correlacionados  e  podem  mesmo  ser  conceitualmente  li¬ 
gados,  o  que  exige  correlação  entre  eles.  Q  pesquisador 
deve  sempre  considerar  a  aplicação  de  um  método  de  ro¬ 
tação  não-ortogonal  e  avaliar  sua  comparabilidade  com  os 
resultados  ortogonais. 


Em  nosso  exemplo,  é  muito  razoável  esperar  que  dimen¬ 
sões  perceptuais  sejam  correlacionadas;  assim,  a  aplica- 
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ção  de  uma  rotação  oblíqua  não-ortogonal  é  justificada. 
A  Tabela  3-9  contém  as  matrizes  padrão  e  de  estrutura 
com  as  cargas  fatoriais  para  cada  variável  em  cada  fator. 
Como  discutido  anteriormente,  a  matriz  padrão  geral¬ 
mente  é  usada  para  fins  de  interpretação,  especialmente 
se  os  fatores  têm  uma  substancial  correlação  entre  os  mes¬ 
mos.  Nesse  caso,  a  mais  alta  correlação  entre  os  fatores  é 
de  apenas  -0,241  (fatores  1  e  2),  de  forma  que  as  matrizes 
padrão  e  de  estrutura  têm  cargas  bastante  comparáveis. 
Examinando  as  variáveis  com  cargas  altas  em  cada  fator, 
notamos  que  a  interpretação  é  exatamente  a  mesma  en¬ 
contrada  com  a  rotação  VARIMAX.  A  única  diferença  é 
que  todas  as  três  cargas  no  fator  2  são  negativas,  de  modo 
que  se  as  variáveis  estão  reversamente  codificadas,  as  cor¬ 
relações  entre  fatores  reverterão  sinais  também. 


Estágio  6:  Validação  de  análise  fatorial 

A  validação  de  qualquer  resultado  de  análise  fatorial  é 
essencial,  particularmente  quando  se  tenta  definir  uma 
estrutura  latente  entre  as  variáveis.  De  um  ponto  de  vis¬ 
ta  ideal,  sempre  usaríamos  após  a  análise  fatorial  alguma 
forma  de  análise  fatorial  confirmatória,  como  a  modela¬ 
gem  de  equações  estruturais  (ver  Capítulo  11),  mas  isso 
raramente  é  viável.  Devemos  olhar  para  outros  meios, 
como  análise  de  amostra  repartida  ou  aplicação  a  amos¬ 
tras  inteiramente  novas. 


Neste  exemplo,  repartimos  a  amostra  em  duas  amostras 
iguais  de  50  respondentes  e  reestimamos  os  modelos  fato¬ 
riais  para  testar  por  comparação.  A  Tabela  3-10  contém 
as  rotações  VARIMAX  para  os  modelos  de  dois*  fatores, 
junto  com  as  comunalidades.  Como  pode  ser  visto,  as  duas 
rotações  VARIMAX  são  bastante  comparáveis  em  termos 
de  cargas  e  comunalidades  para  todas  as  seis**  percepções. 
A  única  ocorrência  notável  é  a  presença  de  um  leve  cru¬ 
zamento  de  cargas  para  na  subamostra  1,  apesar  de  a 
grande  diferença  de  cargas  (0,445  versus  -0,709)  tornar  a 
designação  de  somente  apropriada  ao  fator  4. 


Com  isso,  podemos  ficar  mais  seguros  de  que  os  re¬ 
sultados  são  estáveis  em  nossa  amostra.  Se  possível,  sem¬ 
pre  gostaríamos  de  realizar  um  trabalho  extra,  juntando 
respondentes  adicionais  e  garantindo  que  os  resultados  se 
generalizem  na  população  ou  gerem  novas  subamostras 
para  análise  e  avaliação  de  comparabilidade. 

Estágio  7:  Usos  adicionais  dos 
resultados  da  análise  fatorial 

O  pesquisador  tem  a  opção  de  usar  a  análise  fatorial  não 
apenas  como  uma  ferramenta  de  resumo  de  dados,  como 
visto  na  discussão  anterior,  mas  também  como  uma  fer- 

*  N.  de  R.  T.:  A  frase  correta  seria  “para  os  modelos  de  quatro  fatores”. 

**  N.  de  R.  T.:  A  frase  correta  seria  “para  todas  as  dez  percepções”. 


ramenta  de  redução  de  dados.  Neste  contexto,  a  análise 
fatorial  ajudaria  na  redução  do  número  de  variáveis,  pela 
seleção  de  um  conjunto  de  variáveis  substitutas,  uma  por 
fator,  ou  pela  criação  de  novas  variáveis  compostas  para 
cada  fator.  As  seções  seguintes  detalham  as  questões  so¬ 
bre  redução  de  dados  para  este  exemplo. 

Seleção  de  variáveis  substitutas  para  auálise  subseqüeu- 

te.  Devemos  primeiramente  esclarecer  o  procedimento 
para  seleção  de  variáveis  substitutas.  Ao  selecionar  uma 
única  variável  para  representar  um  fator  inteiro,  é  preferí¬ 
vel  usar  uma  rotação  ortogonal  de  modo  a  garantir  que  as 
variáveis  selecionadas,  tanto  quanto  possível,  sejam  não- 
correlacionadas  umas  com  as  outras.  Assim,  nessa  análise, 
a  solução  ortogonal  (Tabela  3-8)  será  usada  no  lugar  dos 
resultados  oblíquos. 


Assumindo  que  queremos  selecionar  apenas  uma  variá¬ 
vel  para  uso  posterior,  a  atenção  estará  na  magnitude 
das  cargas  fatoriais  (Tabela  3-8),  independente  do  sinal 
(positivo  ou  negativo).  Concentrando-nos  nas  cargas 
fatoriais  dos  fatores  1  e  3,  percebemos  que  a  primeira 
e  a  segunda  carga,  mais  alta,  são  essencialmente  idênti¬ 
cas  (0,933  para  Aj  e  0,931  para  A^g  no  fator  1,  0,940  para 
Ag  e  0,933  para  no  fator  3).  Se  não  temos  qualquer 
evidência  a  priori  para  sugerir  que  a  confiabilidade  ou 
validade  para  uma  das  variáveis  é  melhor  do  que  para 
a  outra,  e  se  nenhuma  é  teoricamente  mais  significativa 
para  a  interpretação  do  fator,  selecionaríamos  a  variá¬ 
vel  com  a  mais  alta  carga  (Ag  e  Ag  para  os  fatores  1  e 
3,  respectivamente).  No  entanto,  o  pesquisador  deve  ser 
cauteloso  para  não  permitir  que  essas  medidas  isoladas 
forneçam  a  única  interpretação  para  o  fator,  pois  cada 
fator  é  uma  dimensão  muito  mais  complexa  do  que  po¬ 
deria  ser  representado  em  qualquer  variável  específica. 
A  diferença  entre  a  primeira  e  a  segunda  carga  mais  alta 
para  os  fatores  2  e  4  é  muito  maior,  tornando  a  seleção 
das  variáveis  Ajj  (fator  2)  e  A^  (fator  4)  mais  fácil  e  mais 
direta.  Para  todos  os  quatro  fatores,  porém,  nenhuma 
variável  única  “representa”  melhor  a  componente;  as¬ 
sim,  os  escores  fatoriais  ou  a  escala  múltipla  seria(m) 
mais  apropriada(os),  se  possível. 


Criação  de  escalas  múltiplas.  Uma  escala  múltipla  é  um 
valor  composto  para  um  conjunto  de  variáveis  calculado 
por  procedimentos  simples,  como  a  média  das  variáveis 
na  escala.  Isso  é  muito  parecido  com  as  variáveis  estatís¬ 
ticas  em  outras  técnicas  multivariadas,  exceto  em  que  os 
pesos  para  cada  variável  são  considerados  iguais  no  pro¬ 
cedimento  de  cálculo  de  média.  Desse  modo,  cada  respon- 
dente  teria  quatro  novas  variáveis  (escalas  múltiplas  para 
os  fatores  1,  2,  3  e  4)  que  poderiam  ser  substitutas  das  13 
variáveis  originais  em  outras  técnicas  multivariadas.  A 
análise  fatorial  ajuda  na  construção  da  escala  múltipla  pela 
identificação  das  dimensionalidades  das  variáveis  (definin- 
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do  OS  fatores),  que  formam  então  a  base  para  os  valores 
compostos  se  elas  atendem  certos  critérios  conceituais  e 
empíricos.  Após  a  efetiva  construção  das  escalas  múltiplas, 
o  que  inclui  escores  reversos  de  variáveis  com  sinais  opos¬ 
tos  (ver  discussão  anterior),  as  escalas  devem  também  ser 
avaliadas  quanto  a  confiabilidade  e  validade,  se  possível. 


Neste  exemplo,  a  solução  com  quatro  fatores  sugere  que 
quatro  escalas  múltiplas  deveriam  ser  construídas.  Os 
quatro  fatores,  discutidos  anteriormente,  correspondem 
a  dimensões  que  podem  ser  nomeadas  e  relacionadas 
a  conceitos  com  validade  de  conteúdo  adequada.  A  di- 
mensionalidade  de  cada  escala  é  sustentada  pela  inter¬ 
pretação  limpa  de  cada  fator,  com  cargas  fatoriais  altas 
de  cada  variável  em  apenas  um  fator.  A  confiabilidade 
das  escalas  múltiplas  é  melhor  medida  pelo  alfa  de  Cron- 
bach,  que  nesse  caso  é  0,90  para  a  escala  1,  0,78  para  a 
escala  2,  0,80  para  a  escala  3  e  0,57  para  a  escala  4.  Ape¬ 
nas  a  escala  4,  representando  o  fator  Valor  do  Produto, 
tem  confiabilidade  abaixo  do  nível  recomendado  de  0,70. 
Ela  será  mantida  para  uso  posterior  com  a  advertência 
de  ter  uma  confiabilidade  menor  e  a  necessidade  de  um 
futuro  desenvolvimento  de  medidas  adicionais  para  re¬ 
presentar  tal  conceito. 

Apesar  de  não  haver  qualquer  teste  direto  para  ava¬ 
liar  a  validade  das  escalas  múltiplas  na  base  de  dados 
HBAT,  uma  abordagem  é  comparar  as  escalas  múltiplas 
com  as  variáveis  de  substituição  para  ver  se  emergem 
padrões  consistentes.  A  Tabela  3-lÍ  ilustra  o  uso  de  es¬ 
calas  múltiplas  como  substitutas  das  variáveis  originais, 
comparando  as  diferenças  nas  variáveis  de  substituição 
ao  longo  das  duas  regiões  (EU A/ América  do  Norte  ver¬ 
sus  restante  do  mundo)  de  At  com  aquelas  diferenças 
das  escalas  múltiplas  correspondentes. 

Quando  vemos  os  dois  grupos  de  podemos  per¬ 
ceber  que  o  padrão  de  diferenças  é  consistente.  A2  ®  ^6 
(as  variáveis  substitutas  para  os  fatores  2  e  4)  e  as  esca¬ 
las  2  e  4  (as  escalas  múltiplas  para  os  fatores  2  e  4)  têm 
todas  diferenças  significantes  entre  as  duas  regiões,  en¬ 
quanto  as  medidas  para  o  primeiro  e  o  terceiro  fator  (A 
e  Xg,  escalas  1  e  3,  e  escores  fatoriais  1  e  3)  não  mostram 
diferenças.  As  escalas  múltiplas  e  as  variáveis  substitutas 
mostram  todas  os  mesmos  padrões  de  diferenças  entre 
as  duas  regiões,  demonstrando  algum  nível  de  validade 
convergente  entre  essas  duas  medidas. 


Uso  de  escores  fatoriais.  Em  vez  de  calcular  escalas  múl¬ 
tiplas,  poderíamos  calcular  escores  fatoriais  para  cada  um 
dos  quatro  fatores  em  nossa  análise  de  componentes.  Os 
escores  fatoriais  diferem  das  escalas  múltiplas  no  sentido 
de  que  os  primeiros  são  diretamente  baseados  nas  cargas 
fatoriais,  o  que  significa  que  cada  variável  contribui  para  o 
escore  fatorial  com  base  no  tamanho  de  sua  carga  (ao  in¬ 
vés  de  calcular  o  escore  de  escala  múltipla  como  a  média 
de  variáveis  selecionadas  com  altas  cargas). 


O  primeiro  teste  de  comparabilidade  de  escores  fatoriais  é 
semelhante  àquele  executado  com  escalas  múltiplas  na  ava¬ 
liação  do  padrão  de  diferenças  encontrado  em  A 
variáveis  substitutas  e  agora  os  escores  fatoriais.  Exatamen¬ 
te  como  visto  nas  escalas  múltiplas,  os  padrões  de  diferenças 
foram  idênticos,  com  diferenças  sobre  escores  fatoriais  2  e  4 
correspondendo  às  diferenças  nas  variáveis  substitutas  para 
os  fatores  2  e  4,  sem  diferenças  para  os  demais. 

A  consistência  entre  escores  fatoriais  e  escalas  múlti¬ 
plas  é  também  vista  nas  correlações  da  Tabela  3-11.  Sabe¬ 
mos  que  os  escores  fatoriais,  uma  vez  rotacionados  com 
uma  técnica  VARIMAX,  são  ortogonais  (não-correlacio- 
nados).  Mas  quão  próximas  estão  as  escalas  múltiplas  dos 
escores  fatoriais?  A  segunda  parte  da  Tabela  3-11  exibe  as 
correlações  entre  escalas  múltiplas  e  escores  fatoriais.  A 
primeira  parte  da  tabela  mostra  que  as  escalas  são  relativa¬ 
mente  não-correlacionadas  entre  si  (a  mais  alta  correlação 
é  de  0,260),  o  que  se  encaixa  perfeitamente  numa  solução 
ortogonal.  Esse  padrão  também  combina  com  a  solução 
oblíqua  mostrada  na  Tabela  3-9  (note  que  o  segundo  fator 
na  solução  oblíqua  tinha  todas  as  cargas  negativas,  o  que 
explica  a  diferença  entre  correlações  positivas  e  negativas 
entre  os  fatores).  Finalmente,  a  segunda  matriz  de  corre¬ 
lação  mostra  um  elevado  grau  de  similaridade  entre  os 
escores  fatoriais  e  os  escores  múltiplos,  com  correlações 
variando  de  0,964  a  0,987.  Esses  resultados  apoiam  em  se¬ 
guida  o  uso  de  escalas  múltiplas  como  substitutos  válidos 
para  escores  fatoriais  se  assim  se  quiser. 


Seleção  do  método  de  redução  de  dados.  Se  as  variá¬ 
veis  originais  precisarem  ser  substituídas  por  variáveis 
substitutas,  escores  fatoriais  ou  escalas  múltiplas,  deve-se 
decidir  qual  usar.  Essa  decisão  é  baseada  na  necessidade 
de  simplicidade  (o  que  favorece  as  variáveis  substitutas), 
repetição  em  outros  estudos  (o  que  favorece  o  uso  de  es¬ 
calas  múltiplas)  versus  o  desejo  por  ortogonalidade  das 
medidas  (o  que  favorece  os  escores  fatoriais).  Apesar  de 
ser  tentador  o  emprego  de  variáveis  substitutas,  a  prefe¬ 
rência  entre  pesquisadores  hoje  em  dia  é  o  uso  de  esca¬ 
las  múltiplas  ou,  em  menor  grau,  escores  fatoriais.  De  um 
ponto  de  vista  empírico,  as  duas  medidas  compostas  são 
essencialmente  idênticas.  As  correlações  na  Tabela  3-11 
demonstram  a  elevada  correspondência  de  escores  fato¬ 
riais  com  escalas  múltiplas  e  as  baixas  correlações  entre  as 
escalas  múltiplas,  aproximando-se  da  ortogonalidade  dos 
escores  fatoriais.  No  entanto,  a  decisão  final  fica  com  o 
pesquisador  e  a  necessidade  por  ortogonalidade  versus  a 
repetitividade  na  seleção  de  escores  fatoriais  versus  esca¬ 
las  múltiplas. 

Análise  de  fatores  comuns:  estágios  4  e  5 

A  análise  de  fatores  comuns  é  o  segundo  modelo  analíti¬ 
co  fatorial  mais  importante  que  discutimos.  A  principal 
distinção  entre  a  análise  de  componentes  e  a  análise  de 
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TABELA  3-9  Rotação  oblíqua  da  matriz  de  análise  fatorial  de  componentes 


MATRIZ  PADRÃO 

CARGAS  RQTACICNADAS  CBLÍQUAS“ 

Fator 

12  3  4 

Comunaiidade'’ 

Xg  Solução  de  reclamação 

0,943 

0,890 

Ag  Velocidade  de  entrega 

0,942 

0,894 

Ag  Encomenda  e  cobrança 

0,895 

0,806 

A2  Imagem  da  equipe  de  venda 

-0,897 

0,860 

A.  Comércio  eletrônico 

-0,880 

0,780 

Ao  Anúncio 

-0,756 

0,585 

Ai  Suporte  técnico 

0,946 

0,894 

A4  Garantia  e  reclamações 

0,936 

0,891 

Ai  Qualidade  do  produto 

0,921 

0,798 

Ao  Preço  competitivo 

-0,702 

0,661 

MATRIZ  DE  ESTRUTURA 

CARGAS  RQTACICNADAS  QBLÍQUAS® 

Fator 

12  3  4 

A)  Solução  de  reclamação 

0,943 

As  Velocidade  de  entrega 

0,942 

Ag  Encomenda  e  cobrança 

0,897 

A2  Imagem  da  equipe  de  venda 

-0,919 

A.  Comércio  eletrônico 

-0,878 

Ao  Anúncio 

-0,750 

Ai  Suporte  técnico 

0,944 

A4  Garantia  e  reclamações 

0,940 

Xg  Qualidade  do  produto 

0,884 

Ao  Preço  competitivo 

-0,773 

MATRIZ  DE  CQRRELAÇÃQ  FATQRIAL 

Fator  1  2 

3  4 

1  1 ,000 

2  -0,241  1 ,000 

3  0,118  0,021 

1,000 

4  0,121  0,190 

0,165  1,000 

“  Cargas  fatoriais  inferiores  a  0,40  não  foram  impressas,  e  as  variáveis  foram  agrupadas  por  suas  cargas  em  cada  fator. 
^  Valores  de  comunaiidade  não  são  iguais  à  soma  das  cargas  ao  quadrado  devido  à  correlação  dos  fatores. 


fatores  comuns  é  que  a  última  considera  somente  a  va¬ 
riância  comum  associada  a  um  conjunto  de  variáveis.  Essa 
meta  é  alcançada  fatorando-se  uma  matriz  de  correlação 
“reduzida”  com  comunalidades  iniciais  estimadas  na  dia¬ 
gonal  em  vez  de  unidades.  As  diferenças  entre  as  análises 
de  componentes  e  de  fatores  comuns  ocorrem  apenas  nos 
estágios  de  estimação  e  interpretação  de  fatores  (estágios 
4  e  5).  Após  as  comunalidades  serem  substituídas  na  dia¬ 
gonal,  o  modelo  dos  fatores  comuns  extrai  fatores  de  um 
modo  semelhante  à  análise  de  componentes.  O  pesquisa¬ 
dor  usa  os  mesmos  critérios  para  seleção  e  interpretação 
dos  fatores.  Para  ilustrar  as  diferenças  que  podem  ocorrer 


entre  as  análises  de  fatores  comuns  e  de  componentes,  as 
seções  seguintes  detalham  a  extração  e  interpretação  de 
uma  análise  de  fatores  comuns  das  13  percepções  HBAT 
usadas  na  análise  de  componentes. 

Estágio  4:  Determinação  de  fatores 
e  avaliação  do  ajuste  geral 

A  matriz  de  correlação  reduzida  com  comunalidades  na 
diagonal  foi  empregada  na  análise  de  fatores  comuns. 
Lembrando  os  procedimentos  empregados  na  análise  de 
componentes,  as  13  variáveis  originais  foram  reduzidas  a 
11  devido  aos  baixos  valores  MS  A  para  e 
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TABELA  3-10  Validação  da  análise  fatorial  de  componentes  por  estimação  de  subamostras  com  rotação  VARIMAX 


Subamostra  1 

CARGAS  RQTACIQNADAS  CQM  VARIMAX 

Fator 

12  3  4 

Comunalidade 

Xg  Solução  de  reclamação 

0,924 

0,901 

X,g  Velocidade  de  entrega 

0,907 

0,878 

X,s  Encomenda  e  cobrança 

0,901 

0,841 

X,2  Imagem  da  equipe  de  venda 

0,885 

0,834 

Xj  Comércio  eletrônico 

0,834 

0,733 

X,g  Anúncio 

0,812 

0,668 

Xg  Suporte  técnico 

0,927 

0,871 

X,4  Garantia  e  reclamações 

0,876 

0,851 

Xg  Qualidade  do  produto 

0,884 

0,813 

X,3  Preço  competitivo 

0,445  -0,709 

0,709 

CARGAS  RQTACIQNADAS  CQM  VARIMAX 

Fator 

Subamostra  2 

1 

2  3  4 

Comunalidade 

Xg  Solução  de  reclamação 

0,943 

0,918 

X,8  Velocidade  de  entrega 

0,935 

0,884 

X,8  Encomenda  e  cobrança 

0,876 

0,807 

X,2  Imagem  da  equipe  de  venda 

0,902 

0,886 

Xj  Comércio  eletrônico 

0,890 

0,841 

X,g  Anúncio 

0,711 

0,584 

Xg  Suporte  técnico 

0,958 

0,932 

X„  Garantia  e  reclamações 

0,951 

0,916 

Xg  Qualidade  do  produto 

0,889 

0,804 

X,3  Preço  competitivo 

-0,720 

0,699 

O  primeiro  passo  é  determinar  o  número  de  fatores  a 
manter  para  exame  e  possível  rotação.  A  Tabela  3-12 
mostra  as  estatísticas  de  extração.  Se  fôssemos  empre¬ 
gar  o  critério  da  raiz  latente  com  um  valor  de  corte  de 
1,0  para  o  autovalor,  quatro  fatores  seriam  mantidos.  No 
entanto,  a  análise  scree  indica  que  cinco  fatores  devem 
ser  mantidos  (ver  Figura  3-10).  Ao  combinar  esses  dois 
critérios,  manteremos  quatro  fatores  para  análise  poste¬ 
rior  por  causa  do  autovalor  baixo  do  quinto  fator  e  para 
manter  a  comparabilidade  com  a  análise  de  componen¬ 
tes.  Note  que  este  mesmo  conjunto  de  circunstâncias  foi 
encontrado  na  análise  de  componentes.  Como  na  análise 
de  componentes  examinada  anteriormente,  o  pesquisa¬ 
dor  deve  empregar  uma  combinação  de  critérios  para 
determinar  o  número  de  fatores  a  serem  mantidos,  e 
pode  até  mesmo  querer  examinar  a  solução  de  três  fato¬ 
res  como  uma  alternativa. 


Como  o  modelo  final  de  fatores  comuns  às  vezes  difere 
das  estimativas  de  extração  iniciais  (p.ex.,  ver  a  discussão 
da  Tabela  3-12  que  se  segue),  o  pesquisador  deve  se  asse¬ 
gurar  de  avaliar  a  estatística  de  extração  para  o  modelo  fi¬ 


nal  de  fatores  comuns.  Lembre  que,  em  análise  de  fatores 
comuns,  apenas  a  variância  em  “comum”  ou  compartilha¬ 
da  é  usada.  Assim,  o  traço  (soma  de  todos  os  autovalo¬ 
res)  e  os  autovalores  para  todos  os  fatores  serão  menores 
quando  apenas  a  variância  comum  é  considerada.  Como 
tal,  um  pesquisador  pode  querer  ser  mais  liberal  ao  fa¬ 
zer  julgamentos  sobre  questões  como  variância  extraída 
ou  o  valor  base  do  critério  de  raiz  latente.  Se  o  pesqui¬ 
sador  estiver  insatisfeito  com  a  variância  total  explicada, 
por  exemplo,  as  ações  corretivas  discutidas  anteriormente 
ainda  estão  disponíveis  (como  a  extração  de  um  ou  mais 
fatores  para  aumentar  a  variância  explicada).  Além  disso, 
comunalidades  também  devem  ser  examinadas  para  ga¬ 
rantir  que  um  nível  adequado  é  mantido  após  a  extração. 


Como  também  mostrado  na  Tabela  3-12,  os  autovalo¬ 
res  para  fatores  extraídos  podem  ser  reestabelecidos  em 
termos  do  processo  de  extração  de  fator  comum.  Como 
exibido  na  Tabela  3-12,  os  valores  para  os  fatores  extraí¬ 
dos  ainda  suportam  quatro  fatores,  pois  o  percentual  de 
variância  total  explicada  ainda  é  70%.  A  única  diferen- 
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TABELA  3-1 1  Avaliação  da  substituição  das  variáveis  originais  por  escores  fatoriais  ou  escalas  múltiplas 


DIFERENÇA  DE  MÉDIA  ENTRE  GRUPOS  DE  RESPONDENTES  COM  BASE  EM  X, REGIÃO 

Teste  estatístico 

Escores  médios 

Teste-t 

Medida 

Grupo  1: 

EUA/América  do  Norte 

Grupo  2: 

Fora  da  América  do  Norte 

Valor  t 

Significância 

Variáveis  representativas  de 
cada  fator 

Xg  -  Solução  de  reclamação 

5,456 

5,433 

0,095 

0,925 

-  Imagem  da  equipe  de 
venda 

4,587 

5,466 

-4,341 

0,000 

Xg  -  Suporte  técnico 

5,697 

5,152 

1,755 

0,082 

Xg  -  Oualidade  do  produto 

8,705 

7,238 

5,951 

0,000 

Escores  fatoriais 

Fator  1  -  Atendimento 

-0,031 

0,019 

-0,248 

0,805 

Fator  2  -  Marketing 

-0,308 

0,197 

-2,528 

0,013 

Fator  3  -  Suporte  técnico 

0,154 

-0,098 

1,234 

0,220 

Fator  4  -  Valor  do  produto 

0,741 

-0,474 

7,343 

0,000 

Escalas  múltiplas 

Escala  1  -  Atendimento 

4,520 

4,545 

-0,140 

0,889 

Escala  2  -  Marketing 

3,945 

4,475 

-3,293 

0,001 

Escala  3  -  Suporte  técnico 

5,946 

5,549 

1,747 

0,084 

Escala  4  -  Valor  do  produto 

6,391 

4,796 

8,134 

0,000 

Correlações  entre  escalas  múltiplas 

Escala  1 

Escala  2 

Escala  3 

Escala  4 

Escala  1 

1,000 

Escala  2 

0,260** 

1,000 

Escala  3 

0,113 

0,010 

1,000 

Escala  4 

0,126 

-0,225* 

0,228* 

1,000 

Correlações  entre  escores  fatoriais  e  escalas  múltiplas 

Fator  1 

Fator  2 

Fator  3 

Fator  4 

Escala  1 

0,987** 

0,127 

0,057 

0,060 

Escala  2 

0,147 

0,976** 

0,008 

-0,093 

Escala  3 

0,049 

0,003 

0,984** 

0,096 

Escala  4 

0,082 

-0,150 

0,148 

0,964** 

*  Significante  no  nível  0,05 
**  Significante  no  nível  0,01 


TABELA  3-1 2  Resultados  para  a  extração  de  fatores  comuns:  método  de  extração  -  fatoração  do  eixo  principal 


Fator 

Autovalores  iniciais 

Extração  de  somas  de  cargas  quadradas 

Total 

Percentual  de 
variância 

Percentual 

cumulativo 

Total 

Percentual  de 
variância 

Percentual 

cumulativo 

1 

3,427 

31,154 

31,154 

3,215 

29,231 

29,231 

2 

2,551 

23,190 

54,344 

2,225 

20,227 

49,458 

3 

1,691 

15,373 

69,717 

1,499 

13,630 

63,088 

4 

1,087 

9,878 

79,595 

0,678 

6,167 

69,255 

5 

0,609 

5,540 

85,135 

6 

0,552 

5,017 

90,152 

7 

0,402 

3,650 

93,802 

8 

0,247 

2,245 

96,047 

9 

0,204 

1,850 

97,898 

10 

0,133 

1,208 

99,105 

11 

0,098 

0,895 

100,000 
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ça  substantiva  é  para  o  autovalor  do  fator  4,  o  qual  fica 
abaixo  do  valor  de  referência  de  1,0.  No  entanto,  ele  é 
mantido  para  esta  análise  devido  ao  fato  de  que  o  teste 
scree  ainda  suporta  os  quatro  fatores  e  para  manter  com- 
parabilidade  com  a  análise  de  componente. 

A  matriz  fatorial  não-rotacionada  (Tabela  3-13) 
mostra  que  as  comunalidades  de  cada  variável  são  com¬ 
paráveis  àquelas  encontradas  na  análise  de  componente. 
Como  diversas  variáveis  estão  abaixo  de  uma  comuna- 
lidade  de  0,50,  um  modelo  de  cinco  fatores  poderia  ser 
construído  em  uma  tentativa  de  aumentar  as  comunali¬ 
dades,  bem  como  a  variância  geral  explicada.  Para  nos¬ 
sos  propósitos  aqui,  no  entanto,  interpretamos  a  solução 
de  quatro  fatores. 


Estágio  5:  Interpretação  dos  fatores 

Com  os  fatores  extraídos  e  o  número  de  fatores  finalizado, 
procedemos  à  interpretação  dos  fatores. 


Examinando  as  cargas  não-rotacionadas  (ver  Tabela 
3-13),  notamos  a  necessidade  de  uma  rotação  de  matriz 
fatorial,  exatamente  como  encontramos  na  análise  de 
componentes.  Cargas  fatoriais  não  foram  geralmente  tão 
altas  quanto  se  desejava,  e  duas  variáveis  {X^  e  Xjj)  exi¬ 
biram  cargas  cruzadas.  Voltando  então  à  matriz  fatorial 
rotacionada  VARIMAX  para  análise  de  fatores  comuns 
(Tabela  3-14),  a  informação  dada  é  a  mesma  fornecida 
na  solução  da  análise  de  componentes  (p.ex.,  somas  de 
quadrados,  percentuais  de  variância,  comunalidades,  so¬ 
mas  totais  de  quadrados  e  variâncias  totais  extraídas). 

A  comparação  da  informação  fornecida  na  matriz 
fatorial  rotacionada  da  análise  de  fatores  comuns  e  da 
análise  de  componentes  mostra  uma  similaridade  im¬ 
pressionante.  Ajj  tem  cargas  cruzadas  substanciais  nos 
fatores  1  e  4  em  ambas  as  análises  (Tabelas  3-8  e  3-14). 
Quando  é  eliminada  da  análise,  a  solução  em  termos 
de  quatro  fatores  é  quase  idêntica  à  análise  de  compo¬ 
nentes.  As  diferenças  principais  entre  as  duas  análises 
são  as  cargas  geralmente  menores  na  análise  de  fatores 
comuns,  devido  principalmente  às  comunalidades  me¬ 
nores  das  variáveis  usadas  na  análise  de  fatores  comuns. 
Entretanto,  mesmo  com  essas  pequenas  diferenças  nos 
padrões  de  cargas,  as  interpretações  básicas  são  idênticas 
entre  as  análises  de  componentes  e  de  fatores  comuns. 


Uma  visão  gerencial  dos  resultados 

Tanto  a  análise  de  componentes  quanto  a  de  fatores  co¬ 
muns  fornecem  ao  pesquisador  diversas  idéias-chave  sobre 
a  estrutura  das  variáveis  e  opções  para  redução  de  dados. 
Primeiro,  no  que  se  refere  à  estrutura  das  variáveis,  há  ni¬ 
tidamente  quatro  dimensões  distintas  e  separadas  de  ava¬ 
liação  usadas  pelos  clientes  da  HBAT.  Essas  dimensões 


Fator 

FIGURA  3-10  Teste  scree  para  análise  de  fatores  comuns. 


englobam  uma  vasta  gama  de  elementos  na  experiência 
do  cliente,  desde  os  atributos  tangíveis  do  produto  (Va¬ 
lor  do  Produto)  até  a  relação  com  a  firma  (Atendimento 
e  Suporte  Técnico),  e  até  mesmo  esforços  que  vão  além 
(Marketing)  por  parte  da  HBAT.  Os  administradores  da 
HBAT  agora  podem  discutir  planos  em  torno  dessas  qua¬ 
tro  áreas,  em  vez  de  lidar  com  as  variáveis  em  separado. 

A  análise  fatorial  também  fornece  a  base  para  a  re¬ 
dução  de  dados  por  meio  de  escalas  múltiplas  ou  escores 
fatoriais.  O  pesquisador  agora  tem  um  método  para  com¬ 
binar  as  variáveis  dentro  de  cada  fator  em  um  único  es¬ 
core  que  pode  substituir  o  conjunto  original  de  variáveis 
por  quatro  novas  variáveis  compostas.  Ao  se  procurar  por 
diferenças,  como  entre  regiões,  essas  novas  variáveis  com¬ 
postas  podem  ser  usadas  de  modo  que  apenas  diferenças 
para  escores  compostos  sejam  analisadas,  ao  invés  de  di¬ 
ferenças  entre  variáveis  individuais. 

Resumo 

A  técnica  estatística  multivariada  de  análise  fatorial  foi 
apresentada  em  amplos  termos  conceituais.  Diretrizes 
básicas  para  interpretar  os  resultados  foram  incluídas 
para  melhor  esclarecer  os  conceitos  metodológicos.  Um 
exemplo  de  aplicação  de  análise  fatorial  foi  apresentado, 
sustentado  na  base  de  dados  HBAT.  Este  capítulo  ajuda 
você  a  fazer  o  seguinte: 

Distinguir  técnicas  de  análise  fatorial  de  outras  técnicas 
multivariadas.  Análise  fatorial  exploratória  (EFA)  pode 
ser  uma  técnica  estatística  multivariada  útil  e  poderosa 
para  efetivamente  extrair  informação  de  grandes  ban¬ 
cos  de  dados  inter-relacionados.  Quando  variáveis  estão 
correlacionadas,  o  pesquisador  precisa  de  maneiras  para 
gerenciar  essas  variáveis:  agrupando  variáveis  altamente 
correlacionadas,  rotulando  ou  nomeando  os  grupos,  e  tal¬ 
vez  até  criando  uma  nova  medida  composta  que  possa  re¬ 
presentar  cada  grupo  de  variáveis.  O  objetivo  principal  da 
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TABELA  3-1 3  Matriz  de  cargas  de  fatores  comuns  não-rotacionada 


Fatoi^ 

1 

2 

3 

4 

Comunalidade 

X,g  Velocidade  de  entrega 

0,895 

0,942 

Xg  Solução  de  reclamação 

0,862 

0,843 

X,g  Encomenda  e  cobrança 

0,747 

0,622 

X,,  Linha  de  produto 

0,689 

-0,454 

0,800 

X,2  Imagem  da  equipe  de  venda 

0,805 

0,990 

X7  Presença  de  comércio  eletrônico 

0,657 

0,632 

X,3  Preço  competitivo 

0,553 

0,443 

X,(,  Anúncio 

0,457 

0,313 

Xg  Suporte  técnico 

0,739 

0,796 

X„  Garantia  e  reclamações 

0,735 

0,812 

Xg  Qualidade  do  produto 

-0,408 

0,463 

0,424 

“  Cargas  fatoriais  inferiores  a  0,40  não  foram  impressas,  e  as  variáveis  foram  agrupadas  por  suas  cargas  em  cada  fator. 


análise  fatorial  exploratória  é  definir  a  estrutura  latente 
entre  as  variáveis  na  análise.  Como  técnica  de  interdepen¬ 
dência,  a  análise  fatorial  tenta  identificar  agrupamentos 
entre  variáveis  (ou  casos)  com  base  em  relações  represen¬ 
tadas  em  uma  matriz  de  correlações.  É  uma  poderosa  fer¬ 
ramenta  para  melhor  compreender  a  estrutura  dos  dados, 
e  também  pode  ser  usada  para  simplificar  análises  de  um 
grande  conjunto  de  variáveis  substituindo-as  por  variáveis 
compostas.  Quando  ela  funciona  bem,  acaba  apontando 
para  relações  interessantes  que  podem  não  ser  óbvias  a 
partir  dos  dados  originais,  ou  mesmo  a  partir  da  matriz  de 
correlação. 

Distinguir  entre  usos  exploratório  e  confirmatório  de  téc¬ 
nicas  de  análise  fatorial.  A  análise  fatorial,  como  discu¬ 
tida  neste  capítulo,  é  principalmente  uma  técnica  explo¬ 
ratória,  uma  vez  que  o  pesquisador  tem  pouco  controle 
sobre  a  especificação  da  estrutura  (p.ex.,  número  de  fato¬ 
res,  cargas  de  cada  variável  etc.).  Apesar  de  os  métodos 
discutidos  neste  capítulo  fornecerem  uma  visão  sobre  os 
dados,  qualquer  tentativa  de  confirmação  irá  muito  pro¬ 
vavelmente  exigir  o  emprego  de  métodos  específicos  dis¬ 
cutidos  nos  capítulos  sobre  modelagem  de  equações  es¬ 
truturais. 

Compreender  os  sete  estágios  da  aplicação  da  análise  fa¬ 
torial.  Os  sete  estágios  da  aplicação  da  análise  fatorial 
incluem  o  que  se  segue: 

1.  Esclarecer  os  objetivos  da  análise  fatorial. 

2.  Planejar  uma  análise  fatorial,  incluindo  a  seleção  de  variá¬ 
veis  e  o  tamanho  da  amostra. 

3.  Suposições  da  análise  fatorial. 

4.  Obtenção  de  fatores  e  avaliação  de  ajuste  geral,  incluindo  o 
modelo  fatorial  a  ser  usado  e  o  número  de  fatores. 

5.  Rotação  e  interpretação  de  fatores. 

6.  Validação  das  soluções  da  análise  fatorial. 

7.  Usos  adicionais  de  resultados  fatoriais,  como  seleção  de  va¬ 
riáveis  substitutas,  criação  de  escalas  múltiplas  ou  cálculo  de 
escores  fatoriais. 


Dístingnír  entre  análise  fatorial  R  e  Q.  O  principal  uso 
da  análise  fatorial  é  desenvolver  uma  estrutura  entre  va¬ 
riáveis,  chamada  de  análise  fatorial  R.  A  análise  fatorial 
pode  também  ser  empregada  para  agrupar  casos,  e  é  então 
chamada  de  análise  fatorial  Q.  Ela  é  semelhante  à  análi¬ 
se  de  agrupamentos.  A  principal  diferença  é  que  análise 
fatorial  Q  usa  correlação  como  medida  de  similaridade, 
enquanto  análise  de  agrupamentos  se  baseia  na  medida 
de  distância. 

Identificar  as  diferenças  entre  modelos  de  análise  de  com¬ 
ponentes  e  modelos  de  análise  de  fatores  comnns.  Três 
tipos  de  variância  são  considerados  quando  se  aplica  aná¬ 
lise  fatorial:  variância  comum,  variância  única  e  variância 
de  erro.  Quando  você  acrescenta  os  três  tipos  de  variân¬ 
cia,  consegue  assim  a  variância  total.  Cada  um  dos  dois 
métodos  de  desenvolvimento  de  uma  solução  fatorial 
utiliza  diferentes  tipos  de  variância.  Análise  de  compo¬ 
nentes,  também  conhecida  como  análise  de  componentes 
principais,  considera  a  variância  total  e  deriva  fatores  que 
contêm  pequenas  porções  de  variância  única  e,  em  alguns 
casos,  variância  de  erro.  A  análise  de  componentes  é  pre¬ 
ferida  quando  a  meta  principal  é  a  redução  de  dados.  Aná¬ 
lise  de  fatores  comuns  se  sustenta  somente  na  variância 
comum  (compartilhada)  e  assume  que  tanto  a  variância 
única  quanto  a  de  erro  não  são  de  interesse  na  definição 
da  estrutura  das  variáveis.  Ela  é  mais  útil  na  identificação 
de  construtos  latentes  e  quando  o  pesquisador  tem  pouco 
conhecimento  sobre  a  variância  única  e  a  de  erro.  Qs  dois 
métodos  atingem  essencialmente  os  mesmos  resultados 
em  muitas  situações  de  pesquisa. 

Dizer  como  determinar  o  número  de  fatores  a  serem 
extraídos.  Elma  decisão  crítica  em  análise  fatorial  é  o 
número  de  fatores  a  serem  mantidos  para  interpretação 
e  uso  posterior.  Ao  se  decidir  quando  parar  a  fatoração 
(i.e.,  quanto  fatores  devem  ser  extraídos),  o  pesquisador 
deve  combinar  uma  fundamentação  conceituai  (quantos 
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TABELA  3-14  Matriz  das  cargas  de  fatores  comuns  rotacionada  por  VARIMAX:  conjuntos  completo  e  reduzido  de  variáveis 


Fatof 

Conjunto  completo  de  11  variáveis 

1 

2 

3 

4 

Comunalidade 

X,g  Velocidade  de  entrega 

0,949 

0,942 

Xg  Solução  de  reclamação 

0,897 

0,843 

X,g  Encomenda  e  cobrança 

0,768 

0,622 

X,2  Imagem  da  equipe  de  venda 

0,977 

0,990 

Xj  Comércio  eletrônico 

0,784 

0,632 

X,g  Anúncio 

0,529 

0,313 

X,4  Garantia  e  reclamações 

0,884 

0,812 

Xg  Suporte  técnico 

0,884 

0,796 

X,,  Linha  de  produto 

0,525 

0,712 

0,800 

Xg  Qualidade  do  produto 

0,647 

0,424 

X,3  Preço  competitivo 

-0,590 

0,443 

Total 

Soma  de  cargas  quadradas 

(autovalor) 

2,635 

1,971 

1,641 

1,371 

7,618 

Percentual  de  traço 

23,95 

17,92 

14,92 

12,47 

69,25 

Fato^ 

Conjunto  reduzido  de  10  variáveis 

1 

2 

3 

4 

Comunalidade 

X,g  Velocidade  de  entrega 

0,925 

0,885 

Xg  Solução  de  reclamação 

0,913 

0,860 

X,g  Encomenda  e  cobrança 

0,793 

0,660 

X,2  Imagem  da  equipe  de  venda 

0,979 

0,993 

Xj  Comércio  eletrônico 

0,782 

0,631 

X,g  Anúncio 

0,531 

0,316 

Xg  Suporte  técnico 

0,905 

0,830 

X,4  Garantia  e  reclamações 

0,870 

0,778 

Xg  Qualidade  do  produto 

0,788 

0,627 

X,3  Preço  competitivo 

-0,480 

0,353 

Total 

Soma  de  cargas  quadradas 

(autovalor) 

2,392 

1,970 

1,650 

0,919 

6,932 

Percentual  de  traço 

23,92 

19,70 

16,50 

9,19 

69,32 

“  Cargas  fatoriais  inferiores  a  0,40  não  foram  impressas,  e  as  variáveis  foram  agrupadas  por  suas  cargas  em  cada  fator. 


fatores  devem  estar  na  estrutura?)  com  alguma  evidên¬ 
cia  empírica  (quantos  fatores  podem  ser  razoavelmente 
suportados?).  O  pesquisador  geralmente  começa  com 
alguns  critérios  pré-determinados,  como  o  número  geral 
de  fatores,  somados  a  alguns  valores  gerais  de  referência 
com  relevância  prática  (p.ex.,  percentual  exigido  de  va¬ 
riância  explicada).  Esses  critérios  são  combinados  com 
medidas  empíricas  da  estrutura  fatorial.  Uma  base  quan¬ 
titativa  exata  para  decidir  o  número  de  fatores  a  serem 
extraídos  ainda  não  foi  desenvolvida.  Critérios  de  para¬ 
da  para  o  número  de  fatores  a  serem  extraídos  incluem 
a  raiz  latente  ou  autovalor,  definição  a  priori,  percentual 
de  variância  e  teste  scree.  Esses  critérios  empíricos  de¬ 
vem  ser  equilibrados  com  bases  teóricas  para  estabelecer 
o  número  de  fatores. 


Explicar  o  conceito  de  rotação  de  fatores.  Talvez  a  fer¬ 
ramenta  mais  importante  na  interpretação  de  fatores  seja 
a  rotação  fatorial.  O  termo  rotação  significa  que  os  eixos 
de  referência  dos  fatores  giram  em  torno  da  origem  até 
que  outra  posição  tenha  sido  alcançada.  Dois  tipos  de  ro¬ 
tação  são  ortogonal  e  oblíquo.  Soluções  fatoriais  não-ro- 
tacionadas  extraem  fatores  na  ordem  de  sua  importância, 
com  o  primeiro  fator  sendo  de  caráter  geral,  com  quase 
todas  as  variáveis  carregando  significativamente  e  expli¬ 
cando  a  maior  quantia  de  variância.  O  segundo  fator  e  os 
subseqüentes  são  baseados  na  quantia  residual  de  variân¬ 
cia,  com  cada  um  explicando  sucessivamente  porções  cada 
vez  menores  de  variância.  O  efeito  final  da  rotação  da  ma¬ 
triz  fatorial  é  redistribuir  a  variância  dos  primeiros  fatores 
para  os  últimos,  para  conseguir  um  padrão  mais  simples 


CAPITULO  3  Análise  Fatorial  145 


e  teoricamente  mais  significativo.  Rotação  fatorial  ajuda 
na  interpretação  dos  fatores  simplificando  a  estrutura  por 
meio  da  maximização  das  cargas  significantes  de  uma  va¬ 
riável  sobre  um  único  fator.  Dessa  maneira,  as  variáveis 
mais  úteis  na  definição  do  caráter  de  cada  fator  podem  ser 
facilmente  identificadas. 

Descrever  como  nomear  um  fator.  Fatores  representam 
uma  composição  de  muitas  variáveis.  Quando  foi  obtida 
uma  solução  fatorial  aceitável  na  qual  todas  as  variáveis 
têm  uma  carga  significante  sobre  um  fator,  o  pesquisador 
tenta  designar  algum  significado  para  o  padrão  de  cargas 
fatoriais.  Variáveis  com  cargas  mais  elevadas  são  consi¬ 
deradas  mais  importantes  e  têm  maior  influência  sobre  o 
nome  ou  rótulo  selecionado  para  representar  um  fator. 
As  variáveis  significantes  para  um  fator  em  particular  são 
examinadas,  e,  colocando  maior  ênfase  sobre  aquelas  va¬ 
riáveis  com  cargas  mais  altas,  um  nome  ou  rótulo  é  desig¬ 
nado  a  um  fator  que  reflita  precisamente  as  variáveis  que 
carregam  no  mesmo.  O  pesquisador  identifica  as  variáveis 
com  a  maior  contribuição  a  um  fator  e  designa  um  “nome” 
para  representar  o  seu  significado  conceituai  dele. 

Explicar  os  usos  adícíouaís  de  auálíse  fatorial.  Depen¬ 
dendo  dos  objetivos  para  aplicar  análise  fatorial,  o  pes¬ 
quisador  pode  parar  com  a  interpretação  fatorial  ou  pros¬ 
seguir  em  um  dos  métodos  para  redução  de  dados.  Se  o 
objetivo  é  simplesmente  identificar  combinações  lógicas 
de  variáveis  e  melhor  entender  as  relações  entre  variá¬ 
veis,  então  a  interpretação  fatorial  bastará.  Se  o  objeti¬ 
vo,  porém,  é  identificar  variáveis  apropriadas  para  sub- 
seqüente  aplicação  em  outras  técnicas  estatísticas,  então 
alguma  forma  de  redução  de  dados  será  empregada.  Uma 
das  opções  para  redução  de  dados  da  análise  fatorial  é 
selecionar  uma  única  variável  (substituta)  com  a  mais  alta 
carga  fatorial.  Ao  fazer  isso,  o  pesquisador  identifica  uma 
única  variável  como  a  melhor  representante  para  todas 
as  variáveis  no  fator.  Uma  segunda  opção  para  redução 
de  dados  é  calcular  uma  escala  múltipla,  onde  variáveis 
com  as  cargas  fatoriais  mais  elevadas  são  somadas.  Um 
escore  múltiplo  representa  o  fator,  mas  somente  variáveis 
selecionadas  contribuem  para  o  escore  composto.  Uma 
terceira  opção  para  redução  de  dados  é  calcular  escores 
fatoriais  para  cada  fator,  onde  cada  variável  contribui 
para  o  escore  em  sua  carga  fatorial.  Essa  medida  única  é 
uma  variável  composta  que  reflete  as  contribuições  rela¬ 
tivas  de  todas  as  variáveis  ao  fator.  Se  a  escala  múltipla  é 
válida  e  confiável,  é  provavelmente  a  melhor  dessas  três 
alternativas  para  redução  de  dados. 

Estabelecer  as  principais  limitações  das  técnicas  analíticas 
fatoriais.  Três  das  limitações  mais  freqüentemente  cita¬ 
das  são  as  seguintes: 

1.  Como  muitas  técnicas  para  execução  de  análise  fatorial  ex¬ 
ploratória  estão  disponíveis,  existe  controvérsia  sobre  qual 
técnica  é  a  melhor. 


2.  Os  aspectos  subjetivos  da  análise  fatorial  (i.e.,  decidir 
quantos  fatores  devem  ser  extraídos,  qual  técnica  deve  ser 
empregada  para  rotacionar  os  eixos  fatoriais,  quais  cargas 
fatoriais  são  significantes)  estão  todos  sujeitos  a  muitas  dife¬ 
renças  de  opinião. 

3.  O  problema  da  confiabilidade  é  real. 

Como  qualquer  outro  procedimento  estatístico,  uma 
análise  fatorial  começa  com  um  conjunto  de  dados  im¬ 
perfeitos.  Quando  os  dados  variam  por  conta  de  mu¬ 
danças  na  amostra,  do  processo  de  coleta  de  dados  ou 
de  inúmeros  tipos  de  erros  de  medida,  os  resultados  da 
análise  também  podem  se  alterar.  Qs  resultados  de  qual¬ 
quer  análise  são,  portanto,  menos  do  que  perfeitamente 
dignos  de  confiança. 

As  aplicações  potenciais  de  análise  fatorial  explorató¬ 
ria  na  solução  de  problemas  e  na  tomada  de  decisões  em 
pesquisas  de  negócios  são  várias.  A  análise  fatorial  é  um 
assunto  muito  mais  complexo  e  complicado  do  que  pode 
estar  sugerido  aqui.  Esse  problema  é  especialmente  críti¬ 
co  porque  os  resultados  de  uma  solução  analítica  de  um  só 
fator  freqüentemente  parecem  plausíveis.  E  importante 
enfatizar  que  plausibilidade  não  é  garantia  de  validade  ou 
estabilidade. 

Questões 

1.  Quais  são  as  diferenças  entre  os  objetivos  do  resumo  de  da¬ 
dos  e  os  da  redução  de  dados? 

2.  Como  a  análise  fatorial  pode  ajudar  o  pesquisador  a  melho¬ 
rar  os  resultados  de  outras  técnicas  multivariadas? 

3.  Quais  orientações  você  pode  usar  para  determinar  o  núme¬ 
ro  de  fatores  a  serem  extraídos?  Explique  cada  uma  breve¬ 
mente. 

4.  Como  você  usa  a  matriz  de  cargas  fatoriais  para  interpretar 
o  significado  de  fatores? 

5.  Como  e  quando  você  deve  usar  escores  fatoriais  em  conjun¬ 
ção  com  outras  técnicas  estatísticas  multivariadas? 

6.  Quais  são  as  diferenças  entre  escores  fatoriais  e  escalas  múl¬ 
tiplas?  Quando  cada  um  deles  é  mais  apropriado? 

7.  Qual  é  a  diferença  entre  a  análise  fatorial  do  tipo  Q  e  a  aná¬ 
lise  de  agrupamentos? 

8.  Quando  o  pesquisador  usa  uma  rotação  oblíqua  em  vez  de 
uma  ortogonal?  Quais  são  as  diferenças  básicas  entre  elas? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  para  ilustrar  questões  e 
aplicações  da  análise  fatorial  está  disponível  na  Web  em 
www.prenhall.com/hair  (em  inglês). 
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SEÇÃO 


Técnicasi  de  Dependência 


VISÃO  GERAL 

Enquanto  o  foco  da  Seção  I  foi  a  preparação  de  dados  para 
a  análise  multivariada,  a  Seção  II  lida  com  o  que  muitos  cha¬ 
mariam  de  essência  da  análise  multivariada,  as  técnicas  de 
dependência.  Como  observado  no  Capítulo  1,  as  técnicas 
de  dependência  são  baseadas  no  uso  de  um  conjunto  de 
variáveis  independentes  para  prever  e  explicar  uma  ou  mais 
variáveis  dependentes.  O  pesquisador,  diante  de  variáveis 
dependentes  de  uma  natureza  métrica  ou  não-métrica,  tem 
à  disposição  diversos  métodos  de  dependência  para  ajudá- 
lo  no  processo  de  relacionar  variáveis  independentes  com 
dependentes.  Dada  a  natureza  multivariada  desses  méto¬ 
dos,  todas  as  técnicas  de  dependência  acomodam  múlti¬ 
plas  variáveis  independentes  e  também  permitem  múltiplas 
variáveis  dependentes  em  certas  situações.  Assim,  o  pes¬ 
quisador  tem  um  conjunto  de  técnicas  que  devem  viabilizar 
a  análise  de  praticamente  qualquer  tipo  de  questão  de  pes¬ 
quisa  que  envolva  uma  relação  de  dependência.  Elas  tam¬ 
bém  fornecem  a  oportunidade  de  se  ter  não  apenas  maior 
capacidade  de  previsão,  mas  uma  explicação  aprimorada 
da  relação  da  variável  dependente  com  as  independentes. 
A  explicação  se  torna  cada  vez  mais  importante  ã  medida 
que  as  questões  da  pesquisa  começam  a  abordar  tópicos 
sobre  como  se  dá  a  relação  entre  variáveis  dependentes  e 
independentes. 


CAPÍTULOS  DA  SEÇÃO  II 

A  Seção  II  cobre  cinco  técnicas  de  dependência:  regressão 
múltipla,  análise  discriminante,  regressão  logística,  análise 
multivariada  de  variância  e  análise  conjunta,  nos  Capítulos 
4  a  7,  respectivamente.  As  técnicas  de  dependência,  como 
observado  antehormente,  permitem  ao  pesquisador  avaliar  o 
grau  de  relação  entre  as  variáveis  dependentes  e  indepen¬ 
dentes.  Tais  técnicas  variam  no  tipo  e  na  característica  da 


relação,  como  se  reflete  nas  propriedades  de  medida  das  va¬ 
riáveis  dependentes  e  independentes  discutidas  no  Capítulo 
1 .  Por  exemplo,  a  regressão  múltipla  e  a  análise  discriminante 
acomodam  múltiplas  variáveis  independentes  métricas,  mas 
variam  de  acordo  com  o  tipo  da  variável  dependente  (análi¬ 
se  de  regressão  -  uma  métrica  e  análise  discriminante  -  uma 
não-métrica).  O  Capítulo  4,  “Análise  de  Regressão  Múltipla”, 
se  concentra  no  que  talvez  seja  a  técnica  multivariada  mais 
fundamental  e  um  construto  para  nossa  discussão  sobre  os 
outros  métodos  de  dependência.  Seja  para  avaliar  a  confor¬ 
midade  com  as  suposições  estatísticas  inerentes,  para  medir 
a  precisão  de  previsão,  ou  para  interpretar  a  variável  estatís¬ 
tica  de  variáveis  independentes,  as  questões  discutidas  no 
Capítulo  4  também  serão  vistas  como  cruciais  em  muitas  das 
outras  técnicas.  O  Capítulo  5,  “Análise  Discriminante  Múltipla 
e  Regressão  Logística”,  investiga  uma  forma  única  de  rela¬ 
ção  de  dependência  -  uma  variável  dependente  que  não  é 
métrica.  Nessa  situação,  o  pesquisador  tenta  classificar  as 
observações  em  grupos.  Isso  é  possível  por  meio  de  análise 
discriminante  ou  regressão  logística,  uma  variante  da  regres¬ 
são  planejada  para  lidar  especificamente  com  as  variáveis 
dependentes  não-métricas.  No  Capítulo  6,  “Análise  Multiva¬ 
riada  de  Variância",  a  discussão  difere  das  técnicas  anteriores 
em  diversos  aspectos;  ela  é  acomodada  à  análise  de  múlti¬ 
plas  variáveis  dependentes  métricas  e  variáveis  independen¬ 
tes  não-métricas.  Apesar  de  essa  técnica  ser  uma  extensão 
direta  da  análise  simples  de  variância,  as  múltiplas  variáveis 
dependentes  métricas  dificultam  a  previsão  e  a  explicação. 
O  Capítulo  7,  “Análise  Conjunta”,  nos  apresenta  uma  técnica 
diferente  de  qualquer  outro  método  multivariado,  em  que  o 
pesquisador  determina  os  valores  das  variáveis  não-métricas 
independentes  de  uma  maneira  quase  experimental.  Uma  vez 
feito  0  planejamento,  o  respondente  fornece  informação  rela¬ 
tiva  apenas  à  variável  dependente.  Apesar  de  atribuir  maior 
responsabilidade  ao  pesquisador,  a  análise  conjunta  fornece 
uma  poderosa  ferramenta  para  compreender  processos  com¬ 
plexos  de  decisão. 

Esta  seção  fornece  ao  pesquisador  uma  exposição  de 
uma  ampla  série  de  técnicas  de  dependência  disponíveis. 
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cada  uma  adequada  a  uma  tarefa  e  uma  relação  específicas. 
Quando  você  completar  esta  seção,  as  questões  relativas  à 
seleção  entre  esses  métodos  serão  visíveis  e  você  se  sentirá 
confortável  na  seleção  dessas  técnicas  e  na  análise  de  seus 
resultados. 

Para  leitores  familiarizados  com  edições  anteriores  ou 
que  procuram  uma  discussão  sobre  correlação  oanônica, 


indicamos  o  texto  na  Web  (www.bookman.com.br).  Aqui  dis¬ 
cutimos  a  forma  mais  generalizada  de  análise  multivariada, 
que  acomoda  múltiplas  variáveis  dependentes  e  indepen¬ 
dentes.  Em  situações  nas  quais  variáveis  estatísticas  exis¬ 
tem  para  variáveis  dependentes  e  independentes,  a  corre¬ 
lação  canônica  fornece  um  método  flexível  para  previsão  e 
explicação. 


CAPITULO 


Análise  de  Regressão  Múltipla 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Determinar  quando  a  análise  de  regressão  é  a  ferramenta  estatística  adequada  para  analisar 
um  problema. 

■  Entender  como  a  regressão  nos  ajuda  a  fazer  previsões  usando  o  conceito  de  mínimos 
quadrados. 

■  Usar  variáveis  dicotômicas  com  uma  compreensão  de  sua  interpretação. 

■  Estar  ciente  das  suposições  inerentes  à  análise  de  regressão  e  como  avaliá-las. 

■  Escolher  uma  técnica  de  estimação  e  explicar  a  diferença  entre  regressão  stepwise  e 
simultânea. 

■  Interpretar  os  resultados  da  regressão. 

■  Aplicar  os  procedimentos  diagnósticos  necessários  para  avaliar  observações  influentes. 


Apresentação  do  capítulo 

Este  capítulo  descreve  a  análise  de  regressão  múltipla  como  é  usada  para  resolver  problemas  de  pes¬ 
quisa  importantes,  particularmente  em  negócios.  A  análise  de  regressão  é  de  longe  a  técnica  de  de¬ 
pendência  mais  amplamente  usada  e  versátil,  aplicável  em  cada  faceta  da  tomada  de  decisões  em 
negócios.  Seus  usos  variam  desde  os  problemas  mais  gerais  até  os  mais  específicos,  sendo  que  em 
cada  caso  relaciona  um  fator  (ou  fatores)  a  um  resultado  específico.  Por  exemplo,  a  análise  de  regres¬ 
são  é  0  fundamento  para  os  modelos  de  previsão  em  negócios,  variando  de  modelos  econométricos 
que  prevêem  a  economia  nacional  com  base  em  certas  informações  (níveis  de  renda,  investimentos  e 
assim  por  diante)  até  modelos  de  desempenho  de  uma  empresa  em  um  mercado  se  uma  estratégia 
específica  de  marketing  for  adotada.  Os  modelos  de  regressão  também  são  empregados  para  estudar 
como  os  consumidores  tomam  decisões  ou  formam  impressões  e  atitudes.  Outras  aplicações  incluem 
a  avaliação  de  determinantes  de  efetividade  de  um  programa  (p.ex.,  quais  fatores  ajudam  a  manter  a 
qualidade)  e  a  determinação  da  viabilidade  de  um  novo  produto  ou  o  retorno  esperado  de  um  novo 
empreendimento.  Ainda  que  esses  exemplos  ilustrem  apenas  um  pequeno  subconjunto  de  todas  as 
aplicações,  eles  demonstram  que  a  análise  de  regressão  é  uma  ferramenta  analítica  poderosa  planeja¬ 
da  para  explorar  todos  os  tipos  de  relações  de  dependência. 

A  análise  de  regressão  múltipla  é  uma  técnica  estatística  geral  usada  para  analisar  a  relação  entre 
uma  única  variável  dependente  e  diversas  variáveis  independentes.  Como  observado  no  Capítulo  1, 
sua  formulação  básica  é 

Ti  =  -I-  X2  -r  -  -r  X„ 

(métrica)  (métricas) 

Este  capítulo  apresenta  diretrizes  para  avaliar  a  adequação  da  regressão  múltipla  a  vários  tipos  de 
problemas.  São  apresentadas  sugestões  para  interpretar  os  resultados  de  sua  aplicação  de  um  ponto 
de  vista  gerencial  e  estatístico.  Possíveis  transformações  dos  dados  para  remediar  violações  de  várias 
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suposições  do  modelo  são  examinadas,  paralelamente  com  vários  procedimentos  diagnósticos  que 
identificam  observações  com  especial  influência  nos  resultados.  Leitores  que  já  têm  familiaridade  com 
os  procedimentos  de  regressão  múltipla  podem  ignorar  as  partes  iniciais  do  capítulo,  mas  para  aqueles 
que  conhecem  menos  o  assunto  ele  fornece  uma  base  valiosa  para  o  estudo  da  análise  multivariada 
de  dados. 


Termos-chave 

Antes  de  começar  este  capítulo,  leia  os  termos-chave  para 
desenvolver  uma  compreensão  dos  conceitos  e  da  terminolo¬ 
gia  empregada.  Ao  longo  do  capítulo,  os  termos-chave  apa¬ 
recem  em  negrito.  Outros  pontos  que  merecem  destaque  e 
termos-chave  estão  em  itálico.  Exemplos  ilustrativos  estão  em 
quadros. 

Adição  forward  (ou  inciusão  em  avanço)  Método  de  seleção 
de  variáveis  para  inclusão  no  modelo  de  regressão,  que  co¬ 
meça  sem  qualquer  variável  no  modelo  e  então  acrescenta 
variáveis  com  base  em  sua  contribuição  na  previsão. 
Categoria  de  referência  O  nível  omitido  de  uma  variável  não- 
métrica  quando  uma  variável  dicotômica  é  formada  a  partir  da 
variável  não-métrica. 

Codificação  dos  efeitos  Método  para  especificar  a  categoria 
de  referência  para  um  conjunto  de  variáveis  dicotômicas  no 
qual  a  categoria  de  referência  recebe  um  valor  de  -1  no  con¬ 
junto  de  variáveis  dicotômicas.  Em  nosso  exemplo  de  codifi¬ 
cação  de  variável  dicotômica  para  sexo,  escolhemos  que  a 
variável  é  1  ou  0.  Mas  com  codificação  dos  efeitos,  o  valor  -1 
é  usado  no  lugar  de  0.  Com  esse  tipo  de  codificação,  os  coe¬ 
ficientes  para  as  variáveis  dicotômicas  se  tornam  desvios  de 
grupo  da  média  da  variável  dependente  em  todos  os  grupos. 
Isso  contrasta  com  a  codificação  indicadora,  na  qual  a  cate¬ 
goria  de  referência  recebe  o  valor  zero  em  todas  as  variáveis 
dicotômicas  e  os  coeficientes  representam  desvios  de  grupo 
na  variável  dependente  do  grupo  de  referência. 

Codificação  indicadora  Método  para  especificar  a  categoria 
de  referência  para  um  conjunto  de  variáveis  dicotômicas  no 
qual  a  categoria  de  referência  recebe  um  valor  zero  no  con¬ 
junto  de  variáveis  dicotômicas.  Os  coeficientes  de  repressão 
representam  as  diferenças  de  grupo  na  variável  dependente 
em  relação  ã  categoria  de  referência.  Ela  difere  da  codifica¬ 
ção  dos  efeitos,  na  qual  à  categoria  de  referência  é  dado  o 
valor  -1  em  todas  as  variáveis  dicotômicas  e  os  coeficientes 
de  regressão  representam  desvios  de  grupo  sobre  a  variável 
dependente  em  relação  á  média  geral  da  mesma. 
Coeficiente  ajustado  de  determinação  (R^  ajustado)  Medida 
modificada  do  coeficiente  de  determinação  que  considera  o 
número  de  variáveis  independentes  incluídas  na  equação  de 
regressão  e  o  tamanho  da  amostra.  Apesar  de  a  adição  de 
variáveis  independentes  sempre  fazer  com  que  o  coeficiente 
de  determinação  aumente,  o  coeficiente  ajustado  de  deter¬ 
minação  pode  cair  se  as  variáveis  independentes  acrescen¬ 
tadas  tiverem  pouco  poder  de  explicação  e/ou  se  os  graus 
de  liberdade  se  tornarem  muito  pequenos.  Essa  estatística  é 
muito  útil  para  comparação  entre  equações  com  diferentes 


números  de  variáveis  independentes,  diferentes  tamanhos  de 
amostras,  ou  ambos. 

Coeficiente  beta  Coeficiente  de  regressão  padronizado  (ver 
padronização)  que  permite  uma  comparação  direta  entre 
coeficientes  quanto  a  seus  poderes  relativos  de  explicação 
da  variável  dependente.  Ao  contrário  dos  coeficientes  de  re¬ 
gressão,  que  são  expressos  em  termos  das  unidades  da  va¬ 
riável  associada,  o  que  torna  as  comparações  inadequadas, 
os  coeficientes  beta  usam  dados  padronizados  e  podem  ser 
comparados  diretamente. 

Coeficiente  de  correiação  (r)  Coeficiente  que  indica  a  força  da 
associação  entre  quaisquer  duas  variáveis  métricas.  O  sinal 
(-r  ou  -)  indica  a  direção  da  relação.  O  valor  pode  variar  de 
-1  a  -r1,  onde  -r1  indica  uma  perfeita  relação  positiva,  0  in¬ 
dica  relação  nenhuma,  e  -1 ,  uma  perfeita  relação  negativa 
ou  reversa  (quando  uma  variável  se  torna  maior,  a  outra  fica 
menor). 

Coeficiente  de  correiação  parciai  Valor  que  mede  a  força  da 
relação  entre  a  variável  dependente  ou  critério  e  uma  única 
variável  independente  quando  os  efeitos  das  demais  variá¬ 
veis  independentes  no  modelo  são  mantidos  constantes.  Por 
exemplo,  rY,X^,X^  mede  a  variação  em  Y associada  a  X^  quan¬ 
do  0  efeito  de  em  e  Yé  mantido  constante.  Esse  valor 
é  usado  em  métodos  de  estimação  de  modelo  de  regressão 
com  seleção  seqüencial  de  variáveis  (p.  ex.,  stepwise,  adi¬ 
ção  forward  ou  eliminação  backward)  para  identificar  a  va¬ 
riável  independente  com  o  maior  poder  preditivo  incremental 
além  das  variáveis  independentes  já  presentes  no  modelo  de 
regressão. 

Coeficiente  de  determinação  (R^)  Medida  da  proporção  da  va¬ 
riância  da  variável  dependente  em  torno  de  sua  média  que 
é  explicada  pelas  variáveis  independentes  ou  preditoras.  O 
coeficiente  pode  variar  entre  0  e  1 .  Se  o  modelo  de  regres¬ 
são  é  propriamente  aplicado  e  estimado,  o  pesquisador  pode 
assumir  que  quanto  maior  o  valor  de  R^,  maior  o  poder  de 
explicação  da  equação  de  regressão  e,  portanto,  melhor  a 
previsão  da  variável  dependente. 

Coeficiente  de  regressão  {b„)  Valor  numérico  da  estimativa 
do  parâmetro  diretamente  associado  com  uma  variável  in¬ 
dependente;  por  exemplo,  no  modelo  Y  =  bç,-v  ò^X,,  o  valor 
é  0  coeficiente  de  regressão  para  a  variável  X,.  O  coefi¬ 
ciente  de  regressão  representa  o  montante  de  variação  na 
variável  dependente  em  relação  a  uma  unidade  de  variação 
na  variável  independente.  No  modelo  preditor  múltiplo  (por 
exemplo,  Y  =  bg-t-  ò^X^  -r  b^X^),  os  coeficientes  de  regres¬ 
são  são  coeficientes  parciais,  pois  cada  um  considera  não 
apenas  as  relações  entre  Ve  X,  e  entre  Y e  X^,  mas  também 
entre  X,  e  X^.  O  coeficiente  não  é  limitado  nos  valores,  já  que 
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é  baseado  tanto  no  grau  de  assooiação  quanto  nas  unida¬ 
des  de  esoala  da  variável  independente.  Por  exemplo,  duas 
variáveis  oom  a  mesma  associação  a  Y  teriam  coeficientes 
diferentes  se  uma  variável  independente  fosse  medida  em 
uma  escala  de  7  pontos  e  outra  fosse  baseada  em  uma  es¬ 
cala  de  100  pontos. 

Colinearidade  Expressão  da  relação  entre  duas  (colinearida- 
de)  ou  mais  (multicolinearidade)  variáveis  independentes. 
Diz-se  que  duas  variáveis  independentes  exibem  colineari¬ 
dade  completa  se  seu  coeficiente  de  correlação  é  1 ,  e  com¬ 
pleta  falta  de  colinearidade  se  o  coeficiente  de  correlação 
é  0.  A  multicolinearidade  ocorre  quando  qualquer  variável 
independente  é  altamente  correlacionada  com  um  conjun¬ 
to  de  outras  variáveis  independentes.  Um  caso  extremo  de 
colinearidade/multicolinearidade  é  a  singularidade,  na  qual 
uma  variável  Independente  é  perfeitamente  prevista  (ou  seja, 
correlação  de  1,0)  por  uma  outra  variável  independente  (ou 
mais  de  uma). 

Correlação  parcial  Valor  que  mede  a  força  da  relação  entre 
uma  variável  dependente  e  uma  única  variável  independente 
quando  os  efeitos  preditivos  das  demais  variáveis  indepen¬ 
dentes  no  modelo  de  regressão  são  removidos.  O  objetivo  é 
retratar  o  efeito  preditivo  único  devido  a  uma  só  variável  Inde¬ 
pendente  em  um  conjunto  de  variáveis  Independentes.  Difere 
do  coeficiente  de  correiação  parciai,  que  envolve  efeito  pre¬ 
ditivo  incremental. 

Correlação  semiparcial  Ver  coeficiente  de  correlação  parcial. 

Efeito  de  supressão  O  caso  no  qual  as  relações  esperadas 
entre  variáveis  Independentes  e  dependentes  são  ocultas  ou 
suprimidas  quando  vistas  em  uma  relação  bivariada.  Quando 
variáveis  independentes  adicionais  são  introduzidas,  a  multi¬ 
colinearidade  remove  a  variância  compartilhada  “indesejável” 
e  revela  a  “verdadeira”  relação. 

Efeito  moderador  Efeito  no  qual  uma  terceira  variável  indepen¬ 
dente  (a  variável  moderadora)  faz  com  que  a  relação  entre 
um  par  de  variáveis  dependente/independente  mude,  depen¬ 
dendo  do  valor  da  variável  moderadora.  Também  é  conhecido 
como  um  efeito  interativo  e  semelhante  ao  efeito  de  interação 
visto  em  métodos  de  análise  de  variância. 

Eliminação  backward  (ou  eliminação  retroativa)  Método  de 
seleção  de  variáveis  para  inclusão  no  modelo  de  regressão 
que  começa  incluindo  todas  as  variáveis  independentes  no 
modelo  e  então  elimina  as  que  não  oferecem  uma  contribui¬ 
ção  significativa  para  a  previsão. 

Erro  de  amostra  A  variação  esperada  em  qualquer  parâmetro 
estimado  (intercepto  ou  coeficiente  de  regressão)  que  é  devi¬ 
do  ao  uso  de  uma  amostra  no  lugar  da  população.  O  erro  de 
amostra  é  reduzido  quando  a  amostra  é  aumentada  e  usada 
para  testar  estatisticamente  se  o  parâmetro  estimado  difere 
de  zero. 

Erro  de  especificação  Erro  na  previsão  da  variável  dependente 
causado  pela  exclusão  de  uma  ou  mais  variáveis  indepen¬ 
dentes  relevantes.  Essa  omissão  pode  distorcer  os  coeficien¬ 
tes  estimados  das  variáveis  incluídas,  bem  como  diminuir  o 
poder  preditivo  geral  do  modelo  de  regressão. 


Erro  de  medida  Grau  em  que  os  valores  dos  dados  não  medem 
verdadeiramente  a  característica  representada  pela  variável. 
Por  exemplo,  quando  se  questiona  sobre  a  renda  familiar  to¬ 
tal,  há  muitas  fontes  de  erro  de  medida  (p,  ex.,  relutância  em 
responder  a  quantia  total  e  erro  na  estimativa  da  renda  total) 
que  tornam  os  valores  imprecisos. 

Erro  de  previsão  Diferença  entre  os  valores  reais  e  os  previstos 
da  variável  dependente,  para  cada  observação  na  amostra 
(ver  resíduo). 

Erro  padrão  Distribuição  esperada  de  um  coeficiente  de  re¬ 
gressão  estimado.  O  erro  padrão  é  semelhante  ao  desvio- 
padrão  de  qualquer  conjunto  de  dados,  mas  denota  a  am¬ 
plitude  esperada  do  coeficiente  em  múltiplas  amostras  dos 
dados.  É  útil  em  testes  estatísticos  de  significância  que  tes¬ 
tam  se  0  coeficiente  é  significantemente  diferente  de  zero 
(ou  seja,  se  a  amplitude  esperada  do  coeficiente  contém*  o 
valor  de  zero  em  um  dado  nível  de  confiança).  O  valor  ide 
um  coeficiente  de  regressão  é  o  coeficiente  dividido  por  seu 
erro  padrão. 

Erro  padrão  da  estimativa  (SE^)  Medida  da  variação  nos  valo¬ 
res  previstos  que  pode  ser  usada  para  desenvolver  intervalos 
de  confiança  em  torno  de  qualquer  valor  previsto.  É  análogo 
ao  desvio-padrão  de  uma  variável  em  torno  de  sua  média, 
mas  se  trata  da  distribuição  esperada  de  valores  previstos 
que  ocorreriam  se  fossem  tomadas  múltiplas  amostras  dos 
dados. 

Estatística  PRESS  Medida  de  validação  obtida  eliminando-se 
cada  observação,  uma  por  vez,  e  prevendo-se  esse  valor  de¬ 
pendente  com  0  modelo  de  regressão  estimado  a  partir  das 
demais  observações. 

Estimação  stepwise  Método  de  seleção  de  variáveis  para  in¬ 
clusão  no  modelo  de  regressão  que  começa  selecionando  o 
melhor  preditor  da  variável  dependente.  Variáveis  indepen¬ 
dentes  adicionais  são  selecionadas  em  termos  do  poder  ex¬ 
plicativo  incremental  que  podem  acrescentar  ao  modelo  de 
regressão.  Variáveis  independentes  são  acrescentadas  des¬ 
de  que  seus  coeficientes  de  correiação  parciai  se\am  estatis¬ 
ticamente  significantes.  Variáveis  independentes  também  po¬ 
dem  ser  eliminadas  se  seu  poder  preditivo  cair  para  um  nível 
não  significante  quando  uma  outra  variável  independente  for 
acrescentada  ao  modelo. 

Fator  de  inflação  de  variância  (VIF)  Indicador  do  efeito  que  as 
outras  variáveis  independentes  têm  sobre  o  erro  padrão  de 
um  coeficiente  de  regressão.  O  fator  de  inflação  de  variância 
está  diretamente**  relacionado  ao  valor  de  tolerância  (l//Fj  = 
MTOQ.  Valores  VIF  altos  também  indicam  um  alto  grau  de 
colinearidade  ou  multicolinearidade  entre  as  variáveis  inde¬ 
pendentes. 

Gráfico  de  probabilidade  normal  Comparação  gráfica  da  for¬ 
ma  da  distribuição  da  amostra  em  relação  ã  distribuição  nor¬ 
mal.  No  gráfico,  a  distribuição  normal  é  representada  por  uma 
reta  com  inclinação  de  45  graus.  A  verdadeira  distribuição  é 


*  N.  de  R.  T:  A  frase  correta  seria  “não  contém  o  valor  de  zero". 

'*  N.  de  R.  T:  A  frase  correta  seria  “inversamente  relacionado". 
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representada  em  contraste  com  essa  reta,  de  modo  que  qual¬ 
quer  diferença  é  mostrada  como  desvio  da  reta,  tornando  a 
identificação  de  diferenças  bastante  simples. 

Gráfico  de  regressão  parcial  Representação  gráfica  da  rela¬ 
ção  entre  a  variável  dependente  e  uma  única  variável  inde¬ 
pendente.  O  diagrama  de  dispersão  de  pontos  representa 
a  correlação  parcial  entre  as  duas  variáveis,  com  os  efeitos 
de  outras  variáveis  independentes  mantidos  constantes 
(ver  coeficiente  de  correlação  parcial).  Essa  representação 
é  particularmente  útil  na  avaliação  da  forma  da  relação  (li¬ 
near  versus  não-linear)  e  na  identifioação  de  observações 
infiuentes. 

Gráfico  nulo  Gráfico  de  resíduos  versus  valores  previstos  que 
exibe  um  padrão  aleatório.  Um  gráfico  nulo  é  indicativo  da 
ausência  de  violações  identificáveis  das  suposições  inerentes 
ã  análise  de  regressão. 

Graus  de  liberdade  {df,  degrees  of  freedom)  Valor  calculado 
a  partir  do  número  total  de  observações  menos  o  número  de 
parâmetros  estimados.  Essas  estimativas  de  parâmetros  são 
restrições  sobre  os  dados  porque,  uma  vez  calculadas,  elas 
definem  a  população  da  qual  se  supõe  que  os  dados  tenham 
sido  obtidos.  Por  exemplo,  ao  estimar  um  modelo  de  regres¬ 
são  com  uma  única  variável  independente,  estimamos  dois 
parâmetros,  o  intercepto  (bç)  e  um  coeficiente  de  regressão 
para  a  variável  independente  (bi).  Ao  estimar  o  erro  aleatório, 
definido  como  a  soma  dos  erros  de  previsão  (valores  depen¬ 
dentes  reais  menos  os  previstos)  para  todos  os  casos,  encon¬ 
traríamos  {n  -  2)  graus  de  liberdade.  Os  graus  de  liberdade 
nos  dão  uma  medida  de  quão  restritos  estão  os  dados  para 
alcançar  um  certo  nível  de  previsão.  Se  o  número  de  graus  de 
liberdade  é  pequeno,  a  previsão  resultante  pode  ser  menos 
generalizável  porque  todas,  exceto  algumas  observações, 
foram  incorporadas  na  previsão.  Reciprocamente,  um  valor 
alto  no  número  de  graus  de  liberdade  indica  que  a  previsão  é 
bastante  “robusta”,  no  sentido  de  ser  representativa  de  toda  a 
amostra  de  respondentes. 

Heteroscedasticidade  Ver  homooedastioidade. 

Homocedasticidade  Descrição  de  dados  para  os  quais  a  va¬ 
riância  dos  termos  de  erro  (e)  aparece  constante  no  interva¬ 
lo  de  valores  de  uma  variável  independente.  A  suposição  de 
igual  variância  do  erro  da  população  e  (onde  e  é  estimado  a 
partir  do  valor  amostrai  e)  é  essencial  à  aplicação  adequada 
de  regressão  linear.  Quando  os  termos  de  erro  têm  variância 
crescente  ou  flutuante,  diz-se  que  os  dados  são  heterosce- 
dâstioos.  A  discussão  de  resíduos  neste  capítulo  ilustra  me¬ 
lhor  essa  questão. 

Intercepto  (b„)  Valor  no  eixo  Y  (eixo  da  variável  dependente) 
onde  a  reta  definida  pela  equação  de  regressão  V'  =  Óq  + 
cruza  0  eixo.  É  descrito  pelo  termo  constante  bg  na  equação 
de  regressão.  Além  de  seu  papel  na  previsão,  o  intercepto 
pode  ter  uma  interpretação  gerencial.  Se  a  completa  ausência 
da  variável  independente  tem  significado,  então  o  intercepto 
representa  essa  quantia.  Por  exemplo,  quando  se  estimam 
vendas  a  partir  de  investimentos  ocorridos  com  anúncios,  o 
intercepto  representa  o  nível  de  vendas  esperadas  se  o  anún¬ 


cio  for  eliminado.  Contudo,  em  muitos  casos,  a  oonstante  tem 
apenas  valor  preditivo,  porque  não  há  situação  na  qual  todas 
as  variáveis  independentes  estejam  ausentes.  Um  exemplo  é 
prever  a  preferência  sobre  um  produto  com  base  em  atitudes 
de  consumidores.  Todos  os  indivíduos  têm  algum  nível  de  ati¬ 
tude,  e  assim  o  intercepto  não  tem  uso  gerencial,  mas  ainda 
auxilia  na  previsão. 

Linearidade  Termo  usado  para  expressar  o  conceito  de  que  o 
modelo  possui  as  propriedades  de  aditividade  e  homogenei¬ 
dade.  Em  um  sentido  simples,  os  modelos  lineares  prevêem 
valores  que  estão  sobre  uma  reta  que  tem  uma  taxa  constante 
de  variação  (coeficiente  angular)  da  variável  dependente  em 
relação  a  uma  variação  unitária  constante  na  variável  inde¬ 
pendente.  No  modelo  populacional  Y  =  bg  +  b^X^  +  e,  o  efeito 
de  uma  variação  de  1,0  em  será  o  acréscimo  de  b,  (uma 
constante)  unidades  em  Y. 

Mínimos  quadrados  Procedimento  de  estimação  usado  em 
regressão  simples  e  múltipla  no  qual  os  coeficientes  de  re¬ 
gressão  são  estimados  de  modo  a  minimizar  a  soma  total  dos 
quadrados  dos  resíduos. 

Muiticoiinearidade  Ver  coiinearidade 

Nívei  de  significância  (aifa)  Freqüentemente  chamado  de  nível 
de  significância  estatística,  o  nível  de  significância  representa 
a  probabilidade  que  o  pesquisador  deseja  aceitar  de  que  o 
coeficiente  estimado  seja  classificado  como  diferente  de  zero 
quando  realmente  não  é.  É  também  chamado  de  erro  Tipo  I. 
O  nível  de  significância  mais  amplamente  usado  é  0,05,  ape¬ 
sar  de  pesquisadores  utilizarem  níveis  que  variam  de  0,01 
(mais  exigentes)  até  0,10  (menos  conservador  e  mais  fácil  de 
descobrir  significância). 

Observação  atípica  Em  termos  estritos,  uma  observação  que 
tem  uma  diferença  substancial  entre  o  valor  real  para  a  variá¬ 
vel  dependente  e  o  valor  previsto.  Casos  que  são  substancial¬ 
mente  diferentes,  em  relação  ás  variáveis  dependentes  ou  ãs 
independentes,  também  são  chamados  de  atípicos.  Em  todos 
os  casos,  0  objetivo  é  identificar  as  observações  que  são  re¬ 
presentações  inadequadas  da  população  da  qual  a  amostra 
é  obtida,  de  forma  que  elas  podem  ser  ignoradas  ou  mesmo 
eliminadas  da  análise  como  não-representativas. 

Observação  influente  (ou  ponto  influente)  Uma  observação 
que  exerce  uma  influência  desproporcional  sobre  um  ou  mais 
aspectos  das  estimativas  de  regressão.  Essa  influência  pode 
ser  baseada  em  valores  extremos  das  variáveis  independen¬ 
tes  ou  da  dependente,  ou  ambas.  As  observações  influentes 
podem  ser  “boas",  reforçando  o  padrão  dos  demais  dados, 
ou  “ruins”,  quando  um  único  caso  ou  um  pequeno  conjunto  de 
casos  afeta  excessivamente  as  estimativas.  Não  é  necessário 
que  a  observação  seja  atípica,  apesar  de  que  muitas  vezes 
observações  atípicas  também  podem  ser  classificadas  como 
influenfes. 

Padronização  Processo  no  qual  a  variável  original  é  trans¬ 
formada  em  uma  nova  variável  com  uma  média  de  0  e  um 
desvio-padrão  de  1.  O  procedimento  típico  é  primeiramente 
subtrair  a  média  da  variável  do  valor  de  cada  observação  e 
então  dividir  pelo  desvio-padrão.  Quando  todas  as  variáveis 
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de  uma  variável  estatística  de  regressão  estão  padronizadas, 
0  termo  bg  (o  intercepto)  assume  um  valor  0  e  os  coeficien¬ 
tes  de  regressão  são  conhecidos  como  coeficientes  beta, 
os  quais  permitem  ao  pesquisador  comparar  diretamente  o 
efeito  relativo  de  cada  variável  independente  sobre  a  variável 
dependente. 

Parâmetro  Quantidade  (medida)  característica  da  população. 
Por  exemplo,  p  e  são  os  símbolos  usados  para  os  parâme¬ 
tros  populacionais  de  média  (p)  e  variância  (o^).  Estes  normal¬ 
mente  são  estimados  a  partir  dos  dados  da  amostra  em  que 
a  média  aritmética  da  amostra  é  utilizada  como  uma  medida 
da  média  populacional  e  a  variância  da  amostra  é  empregada 
para  estimar  a  variância  da  população. 

Poder  Probabilidade  de  uma  relação  significante  ser  encontra¬ 
da  se  ela  realmente  existir.  Complementa  o  nível  de  significân- 
cia  alfa  (a),  mais  amplamente  usado. 

Polinómio  Transformação  de  uma  variável  independente  para 
representar  uma  relação  curvilínea  com  a  variável  dependen¬ 
te.  Incluindo-se  um  termo  quadrado  (A^),  um  único  ponto  de 
inflexão  é  estimado.  Um  termo  cúbico  estima  um  segundo 
ponto  de  Inflexão.  Termos  adicionais  de  potência  superior 
também  podem  ser  estimados. 

Pontos  de  alavanca  Tipo  de  observação  influente  definido  por 
um  aspecto  da  influência  chamado  de  alavanca.  Essas  ob¬ 
servações  são  substancialmente  diferentes  em  uma  ou  mais 
variáveis  independentes,  de  modo  que  afetam  a  estimação 
de  um  ou  mais  coeficientes  de  regressão. 

Regressão  com  todos  os  subconjuntos  possíveis  Método 
para  selecionar  as  variáveis  para  inclusão  no  modelo  de  re¬ 
gressão  que  considera  todas  as  combinações  possíveis  das 
variáveis  independentes.  Por  exemplo,  se  o  pesquisador 
especifica  quatro  variáveis  independentes  potenciais,  essa 
técnica  estima  todos  os  possíveis  modelos  de  regressão  com 
uma,  duas,  três  e  quatro  variáveis.  Então,  a  técnica  identifica 
o(s)  modelo(s)  com  melhor  precisão  de  previsão. 

Regressão  múltipla  Modelo  de  regressão  com  duas  ou  mais 
variáveis  independentes. 

Regressão  simples  Modelo  de  regressão  com  uma  única  va¬ 
riável  Independente,  também  conhecido  como  regressão  bl- 
varlada. 

Relação  estatística  Relação  baseada  na  correlação  de  uma  ou 
mais  variáveis  independentes  com  a  variável  dependente. 
Medidas  de  associação,  tipicamente  correlações,  represen¬ 
tam  0  grau  de  relação  porque  há  mais  de  um  valor  da  variável 
dependente  para  cada  valor  da  variável  independente. 

Resíduo  (e  ou  e)  Erro  na  previsão  de  nossos  dados  da  amostra. 
Raramente  nossas  previsões  serão  perfeitas.  Consideramos 
que  0  erro  aleatório  ocorrerá,  mas  assumimos  que  esse  erro  é 
uma  estimativa  do  verdadeiro  erro  aleatório  na  população  (e), 
não  apenas  o  erro  na  previsão  de  nossa  amostra  (e).  Consi¬ 
deramos  que  0  erro  na  população  que  estamos  estimando  é 
distribuído  com  uma  média  de  0  e  uma  variância  constante 
{homoscedástica). 

Resíduo  estudantizado  A  forma  mais  comumente  usada  de 
resíduo  padronizado.  Difere  de  outros  métodos  na  manei¬ 


ra  como  calcula  o  desvio-padrão  usado  em  padronização. 
Para  minimizar  o  efeito  de  qualquer  observação  no  processo 
de  padronização,  o  desvio-padrão  residual  para  a  obser¬ 
vação  /  é  computado  a  partir  de  estimativas  de  regressão, 
omitindo-se  a  áésima  observação  no  cálculo  das  estimativas 
de  regressão. 

Singularidade  O  caso  extremo  de  colinearidade  ou  multicoline- 
aridade  no  qual  uma  variável  Independente  é  perfeitamente 
prevista  (uma  correlação  de  ±  1 ,0)  por  uma  ou  mais  variáveis 
independentes.  Modelos  de  regressão  não  podem  ser  estima¬ 
dos  quando  existe  uma  singularidade.  O  pesquisador  deve 
omitir  uma  ou  mais  das  variáveis  independentes  envolvidas 
para  remover  a  singularidade. 

Soma  de  quadrados  da  regressão  (SS,,)  Soma  das  diferenças 
quadradas  entre  a  média  e  valores  previstos  da  variável  de¬ 
pendente  para  todas  as  observações.  Representa  a  quantia 
de  melhoramento  na  explicação  da  variável  dependente  atri¬ 
buível  ã(s)  variável(eis)  índependente(s). 

Soma  de  quadrados  dos  erros  (SS^)  Soma  dos  erros  de  previ¬ 
são  (resíduos)  ao  quadrado  em  todas  as  observações.  É  usa¬ 
da  para  denotar  a  variância  na  variável  dependente  ainda  não 
explicada  pelo  modelo  de  regressão.  Se  nenhuma  variável 
independente  é  empregada  para  previsão,  ela  se  transforma 
nos  quadrados  dos  erros,  usando  a  média  como  o  valor  pre¬ 
visto,  e  assim  se  iguala  ã  soma  total  de  quadrados. 

Soma  total  de  quadrados  (SS^.)  Quantia  total  de  variação  exis¬ 
tente  a  ser  explicada  pelas  variáveis  independentes.  Esse 
ponto  de  referência  é  calculado  somando-se  as  diferenças 
quadradas  entre  a  média  e  valores  reais  para  a  variável  de¬ 
pendente  em  todas  as  observações. 

Tolerância  Medida  de  colinearidade  e  multicolinearidade  co¬ 
mumente  usada.  A  tolerância  da  variável  i  (TO Q  é  1  -  R^'i, 
onde  R^'ié  o  coeficiente  de  determinação  para  a  previsão  da 
variável  /  pelas  outras  variáveis  independentes  na  variável  es¬ 
tatística  de  regressão.  À  medida  que  o  valor  da  tolerância  se 
torna  menor,  a  variável  é  melhor  prevista  pelas  outras  variá¬ 
veis  independentes  (colinearidade). 

Transformação  Uma  variável  pode  ter  uma  característica  Inde¬ 
sejável,  como  não-normalidade,  que  diminui  a  habilidade  do 
coeficiente  de  correlação  de  representar  a  relação  entre  ela 
e  outra  variável.  Uma  transformação  como  calcular  o  logarit¬ 
mo  ou  a  raiz  quadrada  da  variável  cria  uma  nova  variável  e 
elimina  a  característica  indesejável,  permitindo  uma  medida 
melhor  da  relação.  Transformações  podem  ser  aplicadas  em 
variáveis  dependentes,  independentes,  ou  ambas.  A  neces¬ 
sidade  e  0  tipo  específico  de  transformação  podem  ser  ba¬ 
seados  em  motivos  teóricos  (como  a  transformação  de  uma 
relação  não-linear  conhecida)  ou  empíricos  (identificados  por 
meios  gráficos  ou  estatísticos). 

Valores  parciais  F  (ou  f)  Q  teste  parcial  Fé  simplesmente  um 
teste  estatístico  da  contribuição  adicional  de  uma  variável 
para  a  precisão  de  previsão  acima  da  contribuição  das  variá¬ 
veis  já  na  equação.  Quando  uma  variável  (XJ  é  acrescentada 
a  uma  equação  de  regressão  depois  que  outras  variáveis  já 
estão  na  equação,  sua  contribuição  pode  ser  muito  pequena. 
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ainda  que  tenha  uma  alta  correlação  com  a  variável  depen¬ 
dente.  O  motivo  é  que  X^é  altamente  correlacionada  com  as 
variáveis  já  na  equação.  O  valor  parcial  Fé  calculado  para 
todas  as  variáveis  simplesmente  simulando  que  cada  uma, 
por  sua  vez,  seja  a  última  a  entrar  na  equação.  Ele  fornece  a 
contribuição  adicional  de  cada  variável  acima  de  todas  as  ou¬ 
tras  na  equação.  Um  valor  parcial  F pequeno  ou  insignificante 
para  uma  variável  que  não  está  presente  na  equação  indica 
sua  contribuição  pequena  ou  insignificante  ao  modelo  como 
já  especificado.  Um  valor  f  pode  ser  calculado  no  lugar  de  va¬ 
lores  Fem  todos  os  casos,  sendo  o  valor  f  aproximadamente 
a  raiz  quadrada  do  valor  F. 

Variável  critério  (Y)  Ver  variável  dependente. 

Variável  dependente  (Y)  Variável  que  está  sendo  prevista  ou 
explicada  pelo  conjunto  de  variáveis  independentes. 

Variável  dicotômica  Variável  independente  usada  para  explicar 
0  efeito  que  diferentes  níveis  de  uma  variável  não-métrica  têm 
na  previsão  da  variável  dependente.  Para  explicar  L  níveis  de 
uma  variável  independente  não-métrica,  L  -  1  variáveis  dico¬ 
tômicas  são  necessárias.  Por  exemplo,  o  sexo  é  medido  como 
masculino  ou  feminino  e  poderia  ser  representado  por  duas 
variáveis  dicotômicas,  X,  e  X^.  Quando  o  respondente  é  do 
sexo  masculino,  X,  =  1  e  Xj  =  0.  Do  mesmo  modo,  quando  o 
respondente  é  do  sexo  feminino,  X^  =  0  e  Xj  =  1 .  No  entanto, 
quando  X.,  =  1,  sabemos  que  Xjdeve  ser  igual  aO.  Assim,  pre¬ 
cisamos  de  apenas  uma  variável,  X,  ou  X^,  para  representar  o 
sexo.  Não  precisamos  incluir  ambas,  pois  uma  é  perfeitamen¬ 
te  prevista  pela  outra  (uma  singularidade)  e  os  coeficientes  de 
regressão  não  podem  ser  estimados.  Se  uma  variável  tem  três 
níveis,  apenas  duas  variáveis  dicotômicas  são  necessárias. 
Assim,  0  número  de  variáveis  dicotômicas  é  um  a  menos  do 
que  0  número  de  níveis  da  variável  não-métrica.  Os  dois  mé¬ 
todos  mais  comuns  para  determinação  dos  valores  das  variá¬ 
veis  dicotômicas  são  a  codificação  indicadora  e  a  codificação 
dos  efeitos. 

Variável  estatística  de  regressão  Combinação  linear  de  variá¬ 
veis  independentes  ponderadas  usadas  coletivamente  para 
prever  a  variável  dependente. 

Variável  independente  Variável(is)  selecionada(s)  como  previ- 
soras  e  potenciais  variáveis  de  explicação  da  variável  depen¬ 
dente. 

Variável  preditora  (X„)  Ver  variável  independente. 


O  QUE  É  ANÁLISE  DE 
REGRESSÃO  MÚLTIPLA? 

A  análise  de  regressão  múltipla  é  uma  técnica  estatísti¬ 
ca  que  pode  ser  usada  para  analisar  a  relação  entre  uma 
única  variável  dependente  (critério)  e  várias  variáveis 
independentes  (preditoras).  O  objetivo  da  análise  de  re¬ 
gressão  múltipla  é  usar  as  variáveis  independentes  cujos 
valores  são  conhecidos  para  prever  os  valores  da  variável 
dependente  selecionada  pelo  pesquisador.  Cada  variável 
independente  é  ponderada  pelo  procedimento  da  análise 
de  regressão  para  garantir  máxima  previsão  a  partir  do 


conjunto  de  variáveis  independentes.  Os  pesos  denotam 
a  contribuição  relativa  das  variáveis  independentes  para 
a  previsão  geral  e  facilitam  a  interpretação  sobre  a  in¬ 
fluência  de  cada  variável  em  fazer  a  previsão,  apesar  de  a 
correlação  entre  as  variáveis  independentes  complicar  o 
processo  interpretativo.  O  conjunto  de  variáveis  indepen¬ 
dentes  ponderadas  forma  a  variável  estatística  de  regres¬ 
são,  uma  combinação  linear  das  variáveis  independentes 
que  melhor  prevê  a  variável  dependente  (o  Capítulo  1 
contém  uma  explicação  mais  detalhada  da  variável  estatís¬ 
tica).  A  variável  estatística  de  regressão,  também  conhe¬ 
cida  como  equação  de  regressão  ou  modelo  de  regressão, 
é  o  exemplo  mais  amplamente  conhecido  de  uma  variável 
estatística  entre  as  técnicas  multivariadas. 

Como  observado  no  Capítulo  1,  a  análise  de  regressão 
múltipla  é  uma  técnica  de  dependência.  Assim,  para  usá- 
la,  você  deve  ser  capaz  de  classificar  as  variáveis  em  depen¬ 
dentes  e  independentes.  A  análise  de  regressão  também 
é  uma  ferramenta  estatística  que  deveria  ser  empregada 
apenas  quando  variáveis  dependente  e  independentes  são 
métricas.  Porém,  sob  certas  circunstâncias,  é  possível  in¬ 
cluir  dados  não-métricos  como  variáveis  independentes 
(transformando  dados  ordinais  ou  nominais  com  codifica¬ 
ção  dicotômica)  ou  como  a  variável  dependente  (pelo  uso 
de  uma  medida  binária  na  técnica  especializada  de  regres¬ 
são  logística;  ver  Capítulo  5).  Em  resumo,  para  aplicar  a 
análise  de  regressão  múltipla,  (1)  os  dados  devem  ser  mé¬ 
tricos  ou  adequadamente  transformados,  e,  (2)  antes  de 
estabelecer  a  equação  de  regressão,  o  pesquisador  deve 
decidir  qual  variável  deve  ser  dependente  e  quais  serão  as 
independentes. 


UM  EXEMPLO  DE  REGRESSÃO 
SIMPLES  E  MÚLTIPLA 

O  objetivo  da  análise  de  regressão  é  prever  uma  única  va¬ 
riável  dependente  a  partir  do  conhecimento  de  uma  ou 
mais  variáveis  independentes.  Quando  o  problema  envol¬ 
ve  uma  única  variável  independente,  a  técnica  estatísti¬ 
ca  é  chamada  de  regressão  simples.  Quando  o  problema 
envolve  duas  ou  mais  variáveis  independentes,  chama-se 
regressão  múltipla.  A  discussão  a  seguir  descreve  breve¬ 
mente  o  procedimento  básico  e  conceitos  e  os  ilustra  atra¬ 
vés  de  um  exemplo  simples.  A  discussão  se  divide  em  três 
partes  para  mostrar  como  a  regressão  estima  a  relação 
entre  variáveis  dependente  e  independentes.  Qs  seguintes 
tópicos  são  cobertos: 

1.  Estabelecimento  de  uma  previsão  de  referência  sem  uma  va¬ 
riável  independente,  usando  somente  a  média  da  variável 
dependente. 

2.  Previsão  usando  uma  única  variável  independente  -  regres¬ 
são  simples. 

3.  Previsão  usando  diversas  variáveis  independentes  -  regres¬ 
são  múltipla. 
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a  variável  dependente  ao  usar  a  média.  Para  superar  esse 
problema,  calculamos  o  quadrado  de  cada  erro  e  então 
somamos  os  resultados.  Esse  total,  chamado  de  soma  de 
quadrados  dos  erros  (SSg),  fornece  uma  medida  de  preci¬ 
são  de  previsão  que  varia  de  acordo  com  a  quantia  de  er¬ 
ros  de  previsão.  O  objetivo  é  obter  a  menor  soma  possível 
de  quadrados  dos  erros  (chamados  de  erros  quadrados) 
como  nossa  medida  de  precisão  de  previsão. 

Escolhemos  a  média  aritmética  porque  ela  sempre 
produz  uma  soma  menor  dos  erros  quadrados  do  que 
qualquer  outra  medida  de  tendência  central,  incluindo 
a  mediana,  moda,  qualquer  outro  valor  de  um  dado  ou 
qualquer  outra  medida  estatística  mais  sofisticada  (enco¬ 
rajamos  os  leitores  interessados  a  tentar  encontrar  um  va- 

^  ,  ,  .  ,  ,  „  .  lor  preditivo  melhor  do  que  a  média). 

Estabelecimento  de  um  ponto  de  reierencia: 

previsão  sem  uma  variável  independente 

Antes  de  estimar  a  primeira  equação  de  regressão,  co¬ 
mecemos  calculando  o  ponto  de  referência  com  o  qual 
compararemos  a  habilidade  preditiva  de  nossos  modelos 
de  regressão.  O  ponto  de  referência  deve  representar  nos¬ 
sa  melhor  previsão  sem  o  uso  de  variáveis  independen¬ 
tes.  Poderíamos  usar  qualquer  número  de  opções  (p.ex., 
previsão  perfeita,  um  valor  pré -especificado,  ou  uma  das 
medidas  de  tendência  central,  como  média,  mediana  ou 
moda).  O  preditor  de  referência  usado  em  regressão  é  a 
média  simples  da  variável  dependente,  que  tem  diversas 
propriedades  desejáveis  que  discutimos  adiante. 

O  pesquisador  ainda  deve  responder  uma  questão: 
quão  precisa  é  a  previsão?  Como  a  média  não  irá  prever 
perfeitamente  cada  valor  da  variável  dependente,  deve¬ 
mos  criar  algum  modo  de  avaliar  a  precisão  preditiva  que 
possa  ser  usado  tanto  na  previsão  de  referência  quanto 
nos  modelos  de  regressão  que  criamos.  O  modo  usual  de 
avaliar  a  precisão  de  qualquer  previsão  é  examinar  os  er¬ 
ros  na  previsão  da  variável  dependente. 

Apesar  de  podermos  esperar  obter  uma  medida  útil  de 
precisão  de  previsão  simplesmente  somando  os  erros,  isso 
não  seria  interessante,  pois  os  erros,  ao  se  usar  o  valor  mé¬ 
dio,  sempre  somam  zero.  Logo,  a  soma  simples  de  erros 
nunca  mudaria,  não  importa  quão  bem  ou  mal  previmos 


TABELA  4-1  Resultados  de  pesquisa  sobre  uso  de  cartão  de  crédito 


Identificação  da 
família 

Número  de  cartões 
de  crédito  usados  (Y) 

Tamanho  da  família 
(Vd 

Renda  familiar  (mi¬ 
lhares  de  US$)  (Vd 

Número  de  automó¬ 
veis  da  família  (V3) 

1 

4 

2 

14 

1 

2 

6 

2 

16 

2 

3 

6 

4 

14 

2 

4 

7 

4 

17 

1 

5 

8 

5 

18 

3 

6 

7 

5 

21 

2 

7 

8 

6 

17 

1 

8 

10 

6 

25 

2 

Em  nosso  exemplo,  a  média  aritmética  (ou  média)  da  va¬ 
riável  dependente  (número  de  cartões  de  crédito  usados) 
é  sete  (ver  Tabela  4-2).  Nossa  previsão  de  referência  pode 
então  ser  enunciada  como  “O  número  previsto  de  cartões 
de  crédito  usados  por  uma  família  é  sete”.  Também  pode¬ 
mos  escrever  isso  como  uma  equação  de  regressão: 

Número  previsto  de  _  Número  médio  de 
cartões  de  crédito  cartões  de  crédito 

ou  _ 

Y  =  Y 

Com  nossa  previsão  de  referência  de  cada  família  usando 
sete  cartões  de  crédito,  superestimamos  o  número  de  car¬ 
tões  de  crédito  usados  pela  família  1  por  três.  Assim,  o  erro 
é  -3.  Se  este  procedimento  fosse  seguido  para  cada  família, 
algumas  estimativas  seriam  muito  altas,  outras  seriam  mui¬ 
to  baixas,  e  outras  ainda  poderiam  ser  exatamente  corre¬ 
tas.  Para  nossa  pesquisa  das  oito  famílias,  usando  a  média 
como  nossa  previsão  de  referência,  conseguimos  o  melhor 
preditor  do  número  de  cartões  de  crédito,  com  uma  soma 
de  erros  quadrados  de  22  (ver  Tabela  4-2).  Em  nossa  dis¬ 
cussão  sobre  regressão  simples  e  múltipla,  usamos  a  previ¬ 
são  pela  média  como  uma  referência  para  comparação,  por 
representar  a  melhor  previsão  possível  sem  usar  qualquer 
variável  independente. 


Para  ilustrar  os  princípios  básicos  envolvidos,  são  forneci¬ 
dos  os  resultados  de  um  pequeno  estudo  de  oito  famílias 
sobre  seu  uso  de  cartão  de  crédito.  O  propósito  do  estudo 
era  determinar  quais  fatores  afetavam  o  número  de  car¬ 
tões  de  crédito  usados.  Três  fatores  potenciais  foram  iden¬ 
tificados  (tamanho  da  família,  renda  familiar  e  número  de 
automóveis  da  família)  e  foram  coletados  dados  de  cada 
uma  das  oito  famílias  (ver  Tabela  4-1).  Na  terminologia 
da  análise  de  regressão,  a  variável  dependente  (T)  é  o  nú¬ 
mero  de  cartões  de  crédito  usados,  e  as  três  variáveis  inde¬ 
pendentes  (Ej,  EjS  1^3)  são  o  tamanho  da  família,  a  renda 
familiar  e  o  número  de  automóveis,  respectivamente. 
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TABELA  4-2  Previsão  de  referência  usando  a  média  da  variávei  dependente 


Variável  estatística  de  regressão: 
Equação  de  previsão: 

II  II 

Identificação 
da  família 

Número  de  car¬ 
tões  de  crédito 
usados 

Previsão  de 
referência’ 

Erro  de 
previsão'’ 

Erro  quadrado 
de  previsão 

1 

4 

7 

-3 

9 

2 

6 

7 

-1 

1 

3 

6 

7 

-1 

1 

4 

7 

7 

0 

0 

5 

8 

7 

+1 

1 

6 

7 

7 

0 

0 

7 

8 

7 

+1 

1 

8 

10 

7 

+3 

9 

Total 

56 

0 

22 

“Número  médio  de  cartões  de  créditos  usados  =  56/8  =  7. 

“Erro  de  previsão  se  refere  ao  valor  real  da  variável  dependente  menos  o  valor  previsto. 


Previsão  usando  uma  única  variável 
independente:  regressão  simples 

Como  pesquisadores,  estamos  sempre  interessados  em 
melhorar  nossas  previsões.  Na  seção  anterior,  apren¬ 
demos  que  a  média  da  variável  dependente  é  o  melhor 
preditor  quando  não  usamos  variáveis  independentes. 
Porém,  como  pesquisadores,  estamos  buscando  uma  ou 
mais  variáveis  adicionais  (independentes)  que  possam 
melhorar  esse  valor  de  referência.  Quando  procuramos 
apenas  uma  variável  independente,  chamamos  de  regres¬ 
são  simples.  Esse  procedimento  para  prever  dados  (assim 
como  a  média  faz)  usa  a  mesma  regra:  minimizar  a  soma 
de  erros  quadrados  de  previsão.  O  objetivo  do  pesquisa¬ 
dor  para  regressão  simples  é  encontrar  uma  variável  inde¬ 
pendente  que  melhore  a  previsão  de  referência. 


Em  nossa  pesquisa  de  oito  famílias,  também  coletamos  in¬ 
formações  sobre  medidas  que  poderiam  atuar  como  variá¬ 
veis  independentes.  Sabemos  que  sem  o  uso  de  qualquer 
uma  dessas  variáveis  independentes,  a  melhor  previsão 
que  podemos  fazer  sobre  o  número  de  cartões  de  crédito 
usados  é  o  valor  médio  7.  Mas  podemos  fazer  melhor? 
Será  que  uma  de  nossas  variáveis  independentes  fornece 
informação  que  nos  permite  realizar  previsões  melhores 
do  que  aquelas  conseguidas  apenas  com  a  média? 


O  papel  do  coeficiente  de  correlação 

Apesar  de  podermos  ter  qualquer  número  de  variáveis 
independentes,  a  questão  diante  do  pesquisador  é:  qual 
escolher?  Poderíamos  tentar  cada  variável  e  ver  qual  nos 
dá  a  melhor  previsão,  mas  essa  abordagem  é  impraticável 
mesmo  quando  o  número  de  possíveis  variáveis  indepen¬ 
dentes  é  muito  pequeno.  Ao  invés  disso,  podemos  confiar 
no  conceito  de  associação,  representado  pelo  coeficiente 
de  correlação.  Duas  variáveis  são  ditas  correlacionadas  se 
mudanças  em  uma  são  associadas  com  mudanças  na  outra. 


Desse  modo,  quando  uma  variável  muda,  sabemos  como  a 
outra  mudará.  O  conceito  de  associação,  representado  pelo 
coeficiente  de  correlação  (r),  é  fundamental  na  análise  de 
regressão,  representando  a  relação  entre  duas  variáveis. 

Como  esse  coeficiente  ajudará  a  melhorar  nossas  previ¬ 
sões?  Vejamos  novamente  o  uso  de  média  como  referên¬ 
cia  de  previsão.  Ao  usarmos  a  média,  devemos  observar 
um  fato:  o  valor  médio  nunca  muda  (lembre  que  sempre 
usamos  7  como  valor  previsto  em  nosso  exemplo).  Como 
tal,  a  média  tem  uma  correlação  nula  com  os  valores  reais. 
Como  melhoramos  esse  método?  Queremos  uma  variá¬ 
vel  que,  ao  invés  de  ter  apenas  um  valor,  tem  valores  que 
são  altos  quando  o  número  de  cartões  de  crédito  é  alto  e 
valores  baixos  quando  o  número  de  cartões  de  crédito  é 
baixo.  Se  podemos  achar  uma  variável  que  exibe  padrão 
similar  (uma  correlação)  ao  da  variável  dependente,  de¬ 
vemos  ser  capazes  de  melhorar  nossa  previsão  feita  com 
o  uso  apenas  da  média.  Quanto  mais  similares  (mais  altas 
correlações),  melhores  previsões  teremos. 


Usando  nossas  informações  da  pesquisa  sobre  as  três 
variáveis  independentes,  podemos  tentar  melhorar  nos¬ 
sas  previsões  reduzindo  os  erros  de  previsão.  Para  fazer 
isso,  os  erros  de  previsão  no  número  de  cartões  de  crédi¬ 
to  usados  devem  ser  associados  (correlacionados)  a  uma 
das  variáveis  independentes  potenciais  (Vj,  Vj  ou  Ej).  Se 
E;  estiver  correlacionada  com  o  uso  de  cartões  de  crédi¬ 
to,  podemos  usar  essa  relação  para  prever  o  número  de 
cartões  de  crédito  do  seguinte  modo: 


Número 
previsto  de  = 
cartões  de 
crédito 


Variação  no  número 
de  cartões  de  crédito 
usados  associada  à 
variação  de  uma 
unidade  em  Ej 


X 


(Valor  I 
de  E,  ) 


OU 

Y  =  bV 

1  í 
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Adição  de  uma  constante  ou  um  termo  intercepto 

Ao  fazer  a  previsão  da  variável  dependente,  podemos  des¬ 
cobrir  que  é  possível  melhorar  nossa  precisão  usando  uma 
constante  no  modo  de  regressão.  Conhecida  como  intercep¬ 
to,  ela  representa  o  valor  da  variável  dependente  quando  to¬ 
das  as  variáveis  independentes  têm  um  valor  nulo.  Grafica¬ 
mente  ela  representa  o  ponto  no  qual  a  reta  que  descreve  o 
modelo  de  regressão  cruza  o  eixo  Y,  daí  o  nome  intercepto. 


Uma  ilustração  do  procedimento  é  mostrada  na  Tabela 
4-3  para  alguns  dados  hipotéticos  (não  o  exemplo  com  car¬ 
tões  de  crédito)  com  uma  única  variável  independente,  Aj. 
Se  percebemos  que,  quando  aumenta  uma  unidade,  a 
variável  dependente  aumenta  (na  média)  duas  unidades, 
podemos  então  fazer  previsões  para  cada  valor  da  variável 
independente.  Por  exemplo,  quando  tivesse  um  valor 
de  4,  preveríamos  um  valor  de  8  (ver  Tabela  4-3a).  Logo,  o 
valor  previsto  sempre  é  duas  vezes  o  valor  de  X^  (2  X^).  No 
entanto,  freqüentemente  notamos  que  a  previsão  é  melho¬ 
rada  acrescentando-se  um  valor  constante.  Na  Tabela  4-3a 
podemos  ver  que  a  previsão  simples  de  2x  X^  está  erra¬ 
da  por  duas  unidades  em  cada  caso.  Logo,  a  mudança  em 
nossa  descrição  pelo  acréscimo  de  uma  constante  de  dois  a 
cada  previsão  nos  dá  previsões  perfeitas  em  todos  os  casos 
(ver  Tabela  4-3b).  Veremos  que,  quando  estimamos  uma 
equação  de  regressão,  geralmente  é  bom  incluir  uma  cons¬ 
tante,  que  é  chamada  de  intercepto. 


Estimação  da  equação  de  regressão  simples 

Podemos  selecionar  a  “melhor”  variável  independen¬ 
te  com  base  nos  coeficientes  de  correlação,  pois  quanto 
maior  este  coeficiente,  mais  forte  a  relação  e,  portanto, 
maior  a  precisão  preditiva.  Na  equação  de  regressão,  re¬ 
presentamos  o  intercepto  como  b^.  A  quantia  de  mudança 


na  variável  dependente  devido  à  variável  independente 
é  representada  pelo  termo  hj,  também  conhecido  como 
coeficiente  de  regressão.  Usando  um  procedimento  ma¬ 
temático  chamado  de  mínimos  qnadrados  [8, 11, 15],  po¬ 
demos  estimar  os  valores  de  e  hj  tal  que  a  soma  dos 
erros  quadrados  de  previsão  seja  minimizada.  O  erro  de 
previsão,  a  diferença  entre  os  valores  reais  e  previstos  da 
variável  dependente,  é  chamado  de  resíduo  (e  ou  e). 


A  Tabela  4-4  contém  uma  matriz  de  correlações  entre  a 
variável  dependente  (T)  e  as  independentes  (Vj,  FjOU 
Vj),  que  pode  ser  usada  na  escolha  da  melhor  variável 
independente.  Olhando  abaixo  a  primeira  coluna,  pode¬ 
mos  ver  que  V^,  tamanho  da  família,  tem  a  maior  cor¬ 
relação  com  a  variável  dependente  e,  desse  modo,  é  a 
melhor  candidata  para  nossa  primeira  regressão  simples. 
A  matriz  de  correlação  também  contém  as  correlações 
entre  as  variáveis  independentes,  que  veremos  serem 
muito  importantes  em  regressão  múltipla  (duas  ou  mais 
variáveis  independentes). 

Agora  podemos  estimar  nosso  primeiro  modelo  de 
regressão  simples  para  a  amostra  de  oito  famílias  e  ver 
quão  bem  a  descrição  se  ajusta  aos  nossos  dados.  O  mo¬ 
delo  de  regressão  pode  ser  enunciado  como  se  segue: 


ou 


Neste  exemplo,  os  valores  apropriados  são  uma  cons¬ 
tante  (ftg)  de  2,87  e  um  coeficiente  de  regressão  (bj)  de 
0,97  para  tamanho  da  família. 


Variação  no  número  ' 
de  cartões  de  crédito 
usados  associada  à 
variação  de  uma 
unidade  no  tamanho 
da  família 


,  1  Tamanho  I 
'  \  da  família  1 


Número 
previsto  de  =  jintercepto  j + 
cartões  dc  \  / 

crédito  usados 


( Intercepto)  - 


TABELA  4-3  Melhoramento  da  precisão  de  previsão  com  o  acréscimo  de  um 
intercepto  em  uma  equação  de  regressão 


(A)  PREVISÃO  SEM  0  INTERCEPTO 

Equação  de  previsão:  Y  =  2X, 

Valor  de  X, 

Variável  dependente 

Previsão 

Erro  de  previsão 

1 

4 

2 

2 

2 

6 

4 

2 

3 

8 

6 

2 

4 

10 

8 

2 

5 

12 

10 

2 

(B)  PREVISÃO  COM  UM  INTERCEPTO  DE  2,0 

Equação  de  previsão:  /=  2,0  +  2X, 

Valor  de  X, 

Variável  dependente 

Previsão 

Erro  de  previsão 

1 

4 

4 

0 

2 

6 

6 

0 

3 

8 

8 

0 

4 

10 

10 

0 

5 

12 

12 

0 
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TABELA  4-4  Matriz  de  correlação  para  o  estudo  de  uso  de  cartões  de  crédito 


Variável 

Y 

1/, 

14 

Y  Número  de  cartões  de  crédito  usados 

1,000 

V,  Tamanho  da  família 

0,866 

1,000 

14  Renda  familiar 

0,829 

0,673 

1,000 

1/3  Número  de  automóveis 

0,342 

0,192 

0,301 

1,000 

Interpretação  do  modelo  de  regressão  simples 

Com  o  intercepto  e  o  coeficiente  de  regressão  estimados 
pelo  procedimento  de  mínimos  quadrados,  a  atenção  ago¬ 
ra  se  volta  à  interpretação  desses  dois  valores: 

•  Coeficiente  de  regressão.  A  variação  estimada  na  variável  de¬ 
pendente  por  variação  unitária  da  variável  independente.  Se  o 
coeficiente  de  regressão  é  percebido  como  estatisticamente  sig- 
nificante  (ou  seja,  o  coeficiente  é  significativamente  diferente 
de  zero),  o  valor  do  coeficiente  de  regressão  indica  a  extensão 
na  qual  a  variável  independente  se  associa  com  a  dependente. 

•  Intercepto.  A  interpretação  do  intercepto  é  de  algum  modo 
diferente.  O  intercepto  tem  valor  explanatório  apenas  den¬ 
tro  do  domínio  de  valores  para  as  variáveis  independentes. 
Além  disso,  sua  interpretação  se  baseia  nas  características 
da  variável  independente: 

•  Em  termos  simples,  o  intercepto  tem  valor  interpretativo  so¬ 
mente  quando  zero  é  um  valor  conceitualmente  válido  para 
a  variável  independente  (i.e.,  a  variável  independente  pode 
ter  um  valor  nulo  e  ainda  manter  sua  relevância  prática). 
Por  exemplo,  considere  que  a  variável  independente  é  dóla¬ 
res  para  anúncios.  Se  for  realista  que,  em  algumas  situações, 
nenhum  anúncio  é  feito,  então  o  intercepto  representará  o 
valor  da  variável  dependente  quando  anúncio  é  nulo. 

•  Se  o  valor  independente  representa  uma  medida  que  ja¬ 
mais  pode  ter  um  valor  verdadeiro  de  zero  (p.ex.,  atitu¬ 
des  ou  percepções),  o  intercepto  auxilia  no  melhoramen¬ 
to  do  processo  de  previsão,  mas  sem  valor  explanatório. 

Para  algumas  situações  especiais  nas  quais  sabe-se  que 
a  relação  específica  pode  passar  pela  origem,  o  intercepto 
pode  ser  suprimido  (conhecido  como  regressão  pela  ori¬ 
gem).  Nesses  casos,  a  interpretação  dos  resíduos  e  dos  co¬ 
eficientes  de  regressão  muda  um  pouco. 


Nosso  modelo  de  regressão  prevendo  uso  de  cartões  de 
crédito  indica  que  para  cada  membro  a  mais  da  família, 
o  número  de  cartões  de  crédito  possuídos  é  maior,  em 
média,  em  0,97.  A  constante  2,87  pode  ser  interpretada 
apenas  no  âmbito  dos  valores  para  a  variável  indepen¬ 
dente.  Nesse  caso,  um  tamanho  de  família  de  zero  não  é 
possível,  e  assim  o  intercepto  sozinho  não  tem  qualquer 
significado  prático.  Contudo,  isso  não  invalida  seu  uso, 
já  que  ele  ajuda  na  previsão  de  uso  de  cartões  de  cré¬ 
dito  para  cada  tamanho  possível  de  família  (em  nosso 
exemplo,  de  1  a  5*).  A  equação  de  regressão  simples  e 
as  previsões  e  os  resíduos  resultantes  para  cada  uma  das 
oito  famílias  são  exibidos  na  Tabela  4-5. 

Como  usamos  o  mesmo  critério  (minimizar  a  soma 
dos  quadrados  dos  erros  ou  mínimos  quadrados),  pode¬ 
mos  determinar  se  nosso  conhecimento  do  tamanho  da 
família  nos  ajuda  a  melhor  prever  o  uso  de  cartões  de 
crédito  comparando  a  previsão  por  regressão  simples 
com  a  previsão  de  referência.  A  soma  dos  quadrados 
dos  erros  usando  a  média  (o  ponto  de  referência)  foi  22; 
com  nosso  novo  procedimento  com  uma  única  variável 
independente,  a  soma  dos  quadrados  dos  erros  diminui 
para  5,50  (ver  Tabela  4-5).  Usando  o  procedimento  dos 
mínimos  quadrados  e  uma  única  variável  independente, 
vemos  que  nossa  nova  abordagem,  a  regressão  simples,  é 
evidentemente  melhor  para  previsões  do  que  empregar 
apenas  a  média. 


*  N.  de  R.  T.:  A  frase  correta  seria  “em  nosso  exemplo,  de  2  a  6”. 


TABELA  4-5  Resultados  de  regressão  simples  usando  tamanho  de  família  como  variável  independente 


Variável  estatística  de  regressão: 

Equação  de  previsão: 

Y=b,  +  b,V, 

/=  2,87 +  0,971/, 

Identificação  da 
família 

Número  de  cartões 
de  crédito  usados 

Tamanho  da  fa¬ 
mília  (V,) 

Previsão  de  re¬ 
gressão  simples 

Erro  de  previsão 

Erro  quadrado 
de  previsão 

1 

4 

2 

4,81 

-0,81 

0,66 

2 

6 

2 

4,81 

1,19 

1,42 

3 

6 

4 

6,75 

-0,75 

0,56 

4 

7 

4 

6,75 

0,25 

0,06 

5 

8 

5 

7,72 

0,28 

0,08 

6 

7 

5 

7,72 

-0,72 

0,52 

7 

8 

6 

8,69 

-0,69 

0,48 

8 

Total 

10 

6 

8,69 

1,31 

1,72 

5,50 
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Estabelecimento  de  um  intervalo  de  confiança 
para  os  coeficientes  de  regressão  e  o  valor  previsto 

Como  usamos  apenas  uma  amostra  de  observações  para 
estimar  uma  equação  de  regressão,  podemos  esperar  que 
os  coeficientes  de  regressão  variem  se  selecionarmos  ou¬ 
tra  amostra  de  observações  e  estimarmos  outra  equação 
de  regressão.  Não  queremos  considerar  repetidas  amos¬ 
tras;  assim,  precisamos  de  um  teste  empírico  para  ver  se 
o  coeficiente  de  regressão  estimado  tem  algum  valor  real 
(i.e.,  é  diferente  de  zero?)  ou  se  poderíamos  esperar  que 
ele  se  iguale  a  zero  em  outra  amostra.  Para  abordar  essa 
questão,  a  análise  de  regressão  permite  o  teste  estatístico 
do  intercepto  e  dos  coeficientes  de  regressão  para  deter¬ 
minar  se  eles  são  significativamente  diferentes  de  zero  (ou 
seja,  eles  têm  um  impacto  que  podemos  esperar  com  uma 
probabilidade  especificada  que  seja  diferente  de  zero  em 
qualquer  número  de  amostras  de  observações). 

Com  a  variação  esperada  no  intercepto  e  no  coeficien¬ 
te  de  regressão  ao  longo  das  amostras,  devemos  também 
esperar  que  o  valor  previsto  varie  cada  vez  que  selecio¬ 
narmos  outra  amostra  de  observações  e  estimarmos  outra 
equação  de  regressão.  Assim,  gostaríamos  de  estimar  o 
intervalo  de  valores  previstos  que  podemos  esperar,  em 
vez  de  confiar  apenas  na  estimativa  única  (pontual).  A  es¬ 
timativa  pontual  é  a  melhor  estimativa  da  variável  depen¬ 
dente  para  essa  amostra  de  observações  e  pode  se  mostrar 
que  ela  corresponde  à  previsão  média  para  qualquer  valor 
dado  da  variável  independente. 

A  partir  dessa  estimativa  pontual,  também  podemos 
calcular  o  intervalo  dos  valores  previstos  em  amostras  re¬ 
petidas  com  base  em  uma  medida  dos  erros  de  previsão 
que  esperamos  cometer.  Conhecida  como  o  erro  padrão 
da  estimativa  (SEj.),  essa  medida  pode  ser  definida  sim¬ 
plesmente  como  o  desvio-padrão  esperado  dos  erros  de 
previsão.  Para  qualquer  conjunto  de  valores  de  uma  va¬ 
riável,  podemos  construir  um  intervalo  de  confiança  para 
uma  variável  em  torno  de  seu  valor  médio  acrescentando 
(mais  e  menos)  um  determinado  número  de  desvios-pa¬ 
drão.  Por  exemplo,  o  acréscimo  de  ±1,96  desvios-padrão 
à  média  define  um  intervalo  para  grandes  amostras  que 
inclui  95%  dos  valores  de  uma  variável. 

Podemos  seguir  um  método  semelhante  para  as  previ¬ 
sões  obtidas  a  partir  de  um  modelo  de  regressão.  Usando 
a  estimativa  pontual,  podemos  acrescentar  (mais  e  menos) 
um  determinado  número  de  erros  padrão  da  estimativa  (de¬ 
pendendo  do  nível  de  confiança  desejado  e  do  tamanho  da 
amostra)  para  estabelecer  os  limites  superior  e  inferior  para 
nossas  previsões  feitas  com  variável(eis)  independente(s). 
O  erro  padrão  da  estimativa  (SE^)  é  calculado  por 

ISoma  de  erros  quadrados 

—  \ 

V  Tamanho  da  amostra  -  2 

O  número  de  SEgS  a  usar  na  obtenção  do  intervalo 
de  confiança  é  determinado  pelo  nível  de  significância 
(a)  e  pelo  tamanho  da  amostra  (Al),  o  que  dá  um  valor 


t.  O  intervalo  de  confiança  é  então  calculado  com  o  me¬ 
nor  limite  igual  ao  valor  previsto  menos  (SEg  x  valor  í), 
e  o  limite  superior,  como  o  valor  previsto  mais  (SEg  x 
valor  t). 


Para  nosso  modelo  de  regressão  simples,  SEg  =  +  0,957 
(a  raiz  quadrada  do  valor  de  5,50  dividido  por  6).  O 
intervalo  ou  domínio  de  confiança  para  as  previsões  é 
construído  selecionando-se  o  número  de  erros  padrão 
a  acrescentar  (mais  e  menos),  por  meio  da  consulta  em 
uma  tabela  para  a  distribuição  í  e  da  seleção  do  valor 
para  nível  de  confiança  e  tamanho  da  amostra  específi¬ 
cos.  Em  nosso  exemplo,  o  valor  t  para  um  nível  de  con¬ 
fiança  de  95%  com  seis  graus  de  liberdade  (tamanho  da 
amostra  menos  o  número  de  coeficientes,  ou  8  -  2  =  6)  é 
2,447.  A  quantia  acrescentada  (mais  e  menos)  ao  valor 
previsto  é  então  (0,957  x  2,447),  ou  2,34.  Se  substituí¬ 
mos  o  tamanho  médio  da  família  (4,25)  na  equação  de 
regressão,  o  valor  previsto  é  6,99  (difere  da  média  de  7 
só  por  causa  de  arredondamento).  O  intervalo  esperado 
de  cartões  de  crédito  fica  de  4,65  (6,99  -  2,34)  a  9,33  (6,99 
±  2,34).  O  intervalo  de  confiança  pode  ser  aplicado  a 
qualquer  valor  previsto  de  cartões  de  crédito.  Para  uma 
discussão  mais  detalhada  desses  intervalos  de  confiança, 
ver  Neter  et  al.  [11]. 


Avaliação  da  precisão  de  previsão 

Se  a  soma  de  quadrados  dos  erros  (SSg)  representa  uma 
medida  de  nossos  erros  de  previsão,  também  devemos 
conseguir  determinar  uma  medida  de  nosso  sucesso  de 
previsão,  o  qual  podemos  chamar  de  soma  de  quadrados 
da  regressão  (SSj,).  Juntas,  essas  duas  medidas  devem 
igualar  a  soma  total  de  quadrados  (SS^),  o  mesmo  valor 
de  nossa  previsão  de  referência.  Como  o  pesquisador 
acrescenta  variáveis  independentes,  a  soma  total  de  qua¬ 
drados  agora  pode  ser  dividida  em  (1)  a  soma  de  quadra¬ 
dos  prevista  pela(s)  variável(eis)  independente(s),  que  é 
a  soma  de  quadrados  da  regressão  (SS^),  e  (2)  a  soma  de 
quadrados  dos  erros  (SSg): 

t(.y.-yy=t(y,-y.y+t(y.-yy 

Í=1  Í=1  1  =  1 

SS.,,  =  SSg  ±  ss„ 

T  ER 

Soma  total  de  quadrados  =  Soma  de  erros  quadrados  ± 
Soma  de  quadrados  de  regressão 
onde 

y  =  média  de  todas  as  observações 
y.  =  valor  da  observação  individual  i 
y.  =  valor  previsto  da  observação  i 

Podemos  usar  essa  divisão  da  soma  total  de  quadra¬ 
dos  para  estimar  o  quão  bem  a  variável  estatística  de 
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regressão  descreve  a  variável  dependente.  Lembre-se 
que  a  média  da  variável  dependente  é  nossa  melhor  es¬ 
timativa  de  referência.  Sabemos  que  não  é  uma  estima¬ 
tiva  muito  precisa,  mas  é  a  melhor  estimativa  disponível 
sem  o  emprego  de  outras  variáveis  quaisquer.  A  questão 
agora  é:  a  precisão  preditiva  aumenta  quando  a  equação 
de  regressão  é  usada  no  lugar  da  previsão  de  referência? 
Podemos  quantificar  esse  melhoramento  com  o  que  se 
segue: 

Soma  total  de  quadrados  (previsão  de  referência) 

-  Soma  de  erros  (regressão  simples)  -  SS^^.^^ 

Soma  de  quadrados  explicada  (regressão  simples)  SSj^ 

SS^ 
ou  SS„ 

_ E 

SSk 

A  soma  de  quadrados  explicada  (SS^)  representa  as¬ 
sim  uma  melhoria  na  previsão  em  relação  à  previsão  de 
referência.  Outro  modo  de  expressar  esse  nível  de  pre¬ 
cisão  de  previsão  é  com  o  coeficiente  de  determinação 
iR\  a  razão  entre  a  soma  de  quadrados  da  regressão  e 
a  soma  total  de  quadrados,  como  mostrado  na  equação 
seguinte: 

Coeficiente  de  _  Soma  de  quadrados  de  regressão 
determinação  (R^)  Soma  total  de  quadrados 

Se  o  modelo  de  regressão  previu  perfeitamente  a  variá¬ 
vel  dependente,  =  1,0.  Mas  se  não  forneceu  previsões 
melhores  do  que  o  uso  da  média  (previsão  de  referência), 
=  0.  Assim  o  valor  R^  é  uma  medida  única  de  precisão 
de  previsão  geral  representando  o  seguinte: 

•  O  efeito  combinado  da  variável  estatística  inteira  na  previ¬ 
são,  mesmo  quando  a  equação  de  regressão  contém  mais  de 
uma  variável  independente. 

•  Simplesmente  a  correlação  quadrada  dos  valores  reais  e 
previstos. 

Quando  o  coeficiente  de  correlação  (r)  é  usado  para 
avaliar  a  relação  entre  variáveis  dependente  e  indepen¬ 
dentes,  o  sinal  do  coeficiente  de  correlação  (-r,+r)  deno¬ 
ta  o  coeficiente  angular  da  reta  de  regressão.  Contudo,  a 
força  da  relação  é  representada  por  R^,  a  qual  com  certeza 
sempre  é  positiva.  Quando  discussões  mencionam  a  varia¬ 
ção  da  variável  dependente,  elas  se  referem  a  essa  soma 
total  de  quadrados  que  a  análise  de  regressão  tenta  prever 
com  uma  ou  mais  variáveis  independentes. 


Em  nosso  exemplo,  a  previsão  de  referência  é  o  nú¬ 
mero  médio  de  cartões  de  créditos  usados  por  nossas 
famílias  da  amostra  e  é  a  melhor  previsão  disponível 


sem  o  uso  de  outras  variáveis.  A  precisão  de  previsão 
de  referência  usando  a  média  foi  medida  calculando-se 
a  soma  de  quadrados  dos  erros  em  relação  à  referência 
(soma  de  quadrados  =  22).  Agora  que  ajustamos  um 
modelo  de  regressão  usando  tamanho  da  família,  isso 
explica  a  variação  melhor  que  a  média?  Sabemos  que 
de  algum  modo  é  melhor  porque  a  soma  de  quadrados 
dos  erros  agora  diminuiu  para  5,50.  Podemos  olhar  o 
quão  bem  nosso  modelo  prevê  examinando  esse  apri¬ 
moramento. 

Soma  total  de  quadrados  (previsão  de  referência)  SS.|,^|^| 

-  Soma  de  erros  quadrados  (regressão  simples)  -  SS^^.^^ 
Soma  de  quadrados  explicada  (regressão  simples) 

SS^  22,0 
ou  SS„  -5,5 
SSj^  16,5 

Logo,  explicamos  16,5  quadrados  dos  erros  mu¬ 
dando  da  média  para  o  modelo  de  regressão  simples 
usando  tamanho  da  família.  Esse  é  um  melhoramento 
de  75%  (16,5/22  =  0,75)  sobre  a  referência.  Estabele¬ 
cemos  assim  que  o  coeficiente  de  determinação  (R^) 
para  essa  equação  de  regressão  é  0,75,  o  que  significa 
que  ela  explica  75%  da  variação  possível  na  variável 
dependente.  Lembre  também  que  o  valor  R^  é  simples¬ 
mente  a  correlação  ao  quadrado  entre  os  valores  reais 
e  previstos. 


Previsão  usando  diversas  variáveis 
independentes:  regressão  múltipla 

Demonstramos  previamente  o  quanto  a  regressão  sim¬ 
ples  pode  ajudar  a  melhorar  nossa  previsão  de  uma  va¬ 
riável  dependente  (p.ex.,  usando  dados  sobre  o  tamanho 
da  família,  previmos  o  número  de  cartões  de  crédito  que 
uma  família  usaria  muito  mais  precisamente  do  que  po¬ 
deríamos  se  usássemos  apenas  a  média  aritmética).  Esse 
resultado  levanta  a  questão  da  possibilidade  de  melho¬ 
rarmos  nossa  previsão  ainda  mais,  usando  dados  adicio¬ 
nais  obtidos  das  variáveis  independentes  (p.ex.,  outros 
dados  das  famílias).  Nossa  previsão  melhoraria  se  usás¬ 
semos  não  apenas  dados  sobre  o  tamanho  da  família, 
mas  informações  sobre  uma  outra  variável,  como  talvez 
renda  familiar  ou  número  de  automóveis  que  cada  famí¬ 
lia  possui? 

O  impacto  de  multicolinearidade 

A  habilidade  de  uma  variável  independente  adicional 
de  melhorar  a  previsão  da  variável  dependente  está  re¬ 
lacionada  não  apenas  à  sua  correlação  com  a  variável 
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dependente,  mas  também  com  a(s)  correlação(ões)  da 
variável  independente  adicional  com  a(s)  variável(eis) 
independente(s)  já  incluídas  na  equação  de  regressão.  A 
colínearidade  é  a  associação,  medida  como  a  correlação, 
entre  duas  variáveis  independentes.  A  multícolínearídade 
refere-se  à  correlação  entre  três  ou  mais  variáveis  inde¬ 
pendentes  (evidenciada  quando  uma  é  “regredida”  em 
relação  às  outras).  Apesar  de  haver  uma  distinção  precisa 
entre  esses  dois  conceitos  em  termos  estatísticos,  é  prática 
comum  usar  os  termos  alternadamente. 

Como  era  de  se  esperar,  correlação  entre  as  variáveis 
independentes  pode  ter  um  forte  impacto  sobre  o  modelo 
de  regressão: 

•  O  impacto  da  multicolinearidade  é  reduzir  o  poder  preditivo 
de  qualquer  variável  independente  na  medida  em  que  ela  é 
associada  com  as  outras  variáveis  independentes.  Quando  a 
colínearidade  aumenta,  a  variância  única  explicada  por  con¬ 
ta  de  cada  variável  independente  diminui  e  o  percentual  da 
previsão  compartilhada  aumenta.  Como  essa  previsão  com¬ 
partilhada  pode  ser  considerada  apenas  uma  vez,  a  previsão 
geral  aumenta  muito  mais  vagarosamente  quando  variáveis 
independentes  com  multicolinearidade  elevada  são  acres¬ 
centadas. 

•  Para  maximizar  a  previsão  a  partir  de  um  dado  número  de 
variáveis  independentes,  o  pesquisador  deve  procurar  variá¬ 
veis  independentes  que  tenham  baixa  multicolinearidade  com 
as  outras  variáveis  independentes,  mas  também  apresentem 
correlações  elevadas  com  a  variável  dependente. 

Revisitamos  as  questões  sobre  a  colínearidade  e  a  mul¬ 
ticolinearidade  em  seções  posteriores  para  discutir  suas 
implicações  na  seleção  de  variáveis  independentes  e  na 
interpretação  da  variável  estatística  de  regressão. 

A  equação  de  regressão  múltipla 

Como  observado  anteriormente,  regressão  múltipla  é  o 
uso  de  duas  ou  mais  variáveis  independentes  na  previsão 
de  uma  variável  dependente.  A  tarefa  do  pesquisador  é 
expandir  o  modelo  de  regressão  simples  acrescentando  va¬ 
riáveis  independentes  que  tenham  o  maior  poder  preditivo 
adicional.  Ainda  que  possamos  determinar  a  associação 
de  qualquer  variável  independente  com  a  dependente 
através  do  coeficiente  de  correlação,  a  amplitude  do  poder 
preditivo  incremental  para  qualquer  variável  adicional  é 
muitas  vezes  determinada  por  sua  multicolinearidade  com 
outras  variáveis  já  presentes  na  equação  de  regressão.  Po¬ 
demos  olhar  nosso  exemplo  com  cartões  de  crédito  para 
demonstrar  tais  conceitos. 


Para  melhorar  ainda  mais  nossa  previsão  de  uso  de  car¬ 
tões  de  crédito,  usemos  dados  adicionais  obtidos  a  partir 
de  nossas  oito  famílias.  A  segunda  variável  independen¬ 
te  a  ser  incluída  no  modelo  de  regressão  é  a  renda  fami¬ 
liar  (1^2)1  que  tem  a  próxima  correlação  mais  alta  com  a 


variável  dependente.  Apesar  de  Uj  um  grau  médio 
de  correlação  com  Vj,  já  presente  na  equação,  ainda  é 
a  segunda  melhor  variável  a  entrar,  pois  tem  uma 
correlação  muito  menor  com  a  variável  dependente. 
Simplesmente  expandimos  nosso  modelo  de  regressão 
simples  para  incluir  duas  variáveis  independentes,  como 
a  seguir: 

Número  previsto  de  cartões  de  crédito 
usados  =  fto  -H  -r  Ò2U2  +  ^ 

onde 

ftg  =  número  constante  de  cartões  de  crédito  indepen¬ 
dentemente  do  tamanho  da  família  e  da  renda  fa¬ 
miliar 

ftj  =  variação  no  uso  de  cartões  de  crédito  em  relação  à 
variação  de  uma  unidade  no  tamanho  da  família 
^2  =  variação  no  uso  de  cartões  de  crédito  em  relação  à 
variação  de  uma  unidade  na  renda  familiar 
Uj  =  tamanho  da  família 
V2  =  renda  familiar 
e  =  erro  de  previsão  (resíduo) 

O  modelo  de  regressão  múltipla  com  duas  variáveis 
independentes,  quando  estimado  com  o  procedimento 
de  mínimos  quadrados,  tem  uma  constante  de  0,482, 
com  coeficientes  de  regressão  de  0,63  e  0,216  para 
e  V2,  respectivamente.  Podemos  determinar  novamen¬ 
te  nossos  resíduos  prevendo  Y  e  subtraindo  a  previsão 
do  verdadeiro  valor.  Em  seguida,  elevamos  ao  quadra¬ 
do  o  erro  de  previsão  resultante,  como  na  Tabela  4-6.  A 
soma  de  quadrados  dos  erros  para  o  modelo  de  regres¬ 
são  múltipla  com  tamanho  da  família  e  renda  familiar  é 
3,04.  Este  resultado  pode  ser  comparado  com  o  valor  do 
modelo  de  regressão  simples  de  5,50  (Tabela  4-5),  o  qual 
usa  apenas  o  tamanho  da  família  para  a  previsão. 

Quando  a  renda  familiar  é  adicionada  à  análise  de 
regressão,  também  aumenta  para  0,86. 


R.^ 

(tamanho  da  família  -1-  renda  familiar) 


22,0-3,04 

22,0 


18,96 

22,0 


0,86 


A  inclusão  da  renda  familiar  na  análise  de  regressão 
aumenta  a  previsão  em  11%  (0,86  -  0,75),  devido  ao  po¬ 
der  preditivo  incremental  único  da  renda  familiar. 


Acréscimo  de  uma  terceira 
variável  independente 

Percebemos  um  aumento  na  precisão  de  previsão,  con¬ 
quistado  ao  mudar-se  da  equação  de  regressão  simples 
para  a  equação  de  regressão  múltipla,  mas  também  deve¬ 
mos  observar  que  em  algum  ponto  o  acréscimo  de  variá¬ 
veis  independentes  se  tornará  menos  vantajoso,  e  em  al¬ 
guns  casos  até  mesmo  contraprodutivo.  A  adição  de  mais 
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TABELA  4-6  Resultados  de  regressão  múltipla  usando  tamanho  de  família  e  renda  familiar  como  variáveis  independentes 


Variável  estatística  de  regressão: 
Equação  de  previsão: 

y=  0,482  +  0,631/,  +0,216^2 

Identificação 
da  família 

Número  de  cartões 
de  crédito  usados 

Tamanho  da 
família  (V,) 

Renda 
familiar  (Vj) 
(milhares  de  US$) 

Previsão  da 
regressão  múltipla 

Erro  de 
previsão 

Erro  quadrado 
de  previsão 

1 

4 

2 

14 

4,76 

-0,76 

0,58 

2 

6 

2 

16 

5,20 

0,80 

0,64 

3 

6 

4 

14 

6,03 

-0,03 

0,00 

4 

7 

4 

17 

6,68 

0,32 

0,10 

5 

8 

5 

18 

7,53 

0,47 

0,22 

6 

7 

5 

21 

8,18 

-1,18 

1,39 

7 

8 

6 

17 

7,95 

0,05 

0,00 

8 

10 

6 

25 

9,67 

0,33 

0,11 

Total 

3,04 

variáveis  independentes  se  baseia  em  balancear  entre 
poder  preditivo  aumentado  versus  modelos  de  regressão 
excessivamente  complexos  e  até  mesmo  potencialmente 
enganosos. 


A  pesquisa  do  uso  de  cartões  de  crédito  fornece  mais 
uma  possível  adição  à  equação  de  regressão  múltipla,  o 
número  de  automóveis  possuídos  (V^).  Se  agora  especifi¬ 
carmos  a  equação  de  regressão  para  incluir  as  três  variá¬ 
veis  independentes,  perceberemos  alguma  melhora  na 
equação  de  regressão,  mas  inferior  à  vista  anteriormen¬ 
te.  O  valor  aumentará  para  0,87,  apenas  um  aumento 
de  0,01  em  relação  ao  modelo  de  regressão  múltipla  an¬ 
terior.  Além  disso,  como  discutiremos  posteriormente,  o 
coeficiente  de  regressão  para  não  é  estatisticamente 
significante.  Logo,  nesse  caso,  o  pesquisador  está  melhor 
servido  empregando  o  modelo  de  regressão  múltipla 
com  duas  variáveis  independentes  (tamanho  da  família 
e  renda  familiar)  e  não  usando  a  terceira  variável  inde¬ 
pendente  (número  de  automóveis  possuídos)  para  fazer 
previsões. 


Resumo 

A  análise  de  regressão  é  uma  fécnica  de  dependência 
simples  e  direfa  que  pode  fornecer  previsão  e  explicação 
ao  pesquisador.  O  exemplo  anferior  ilusfrou  os  conceifos 
e  procedimentos  básicos  inerenfes  à  análise  de  regressão 
em  uma  fenfafiva  de  desenvolver  uma  compreensão  da 
metodologia  e  caracferísficas  desse  procedimenfo  em 
sua  forma  mais  básica.  As  seções  a  seguir  defalham  essas 
quesfões  e  fornecem  um  processo  de  decisão  para  aplicar 
a  análise  de  regressão  a  qualquer  problema  de  pesquisa 
apropriado. 


UM  PROCESSO  DE  DECISÃO  PARA  A 
ANÁLISE  DE  REGRESSÃO  MÚLTIPLA 

Nas  seções  anteriores,  discutimos  exemplos  de  regressão 
simples  e  múltipla.  Naquelas  discussões,  muitos  fatores 
influenciaram  nossa  habilidade  de  encontrar  o  melhor 
modelo  de  regressão.  Até  esse  ponto,  no  entanto,  exa¬ 
minamos  tais  questões  apenas  em  termos  simples,  com 
pouca  preocupação  em  como  elas  se  combinam  em  uma 
abordagem  geral  da  análise  de  regressão  múltipla.  Nas 
seções  a  seguir,  o  processo  de  construção  de  modelo  em 
seis  estágios,  introduzido  no  Capítulo  1,  será  usado  como 
referência  para  discutir  os  fatores  que  afetam  a  criação, 
estimação,  interpretação  e  validação  de  uma  análise  de 
regressão.  O  processo  começa  com  a  especificação  dos 
objetivos  da  análise  de  regressão,  incluindo  a  seleção  das 
variáveis  dependente  e  independentes.  O  pesquisador  en¬ 
tão  começa  a  planejar  a  análise  de  regressão,  consideran¬ 
do  fatores  como  o  tamanho  da  amostra  e  a  necessidade  de 
transformações  de  variáveis.  Com  o  modelo  de  regressão 
formulado,  as  suposições  inerentes  à  análise  de  regressão 
são  primeiramente  testadas  para  as  variáveis  individuais. 
Se  todas  as  suposições  forem  atendidas,  então  o  modelo 
será  estimado.  Quando  já  se  têm  os  resultados,  são  fei¬ 
tas  análises  diagnósticas  para  garantir  que  o  modelo  geral 
atende  às  suposições  de  regressão  e  que  nenhuma  obser¬ 
vação  tem  influência  indevida  sobre  os  resultados.  O  pró¬ 
ximo  estágio  é  a  interpretação  da  variável  estatística  de 
regressão;  examina-se  o  papel  desempenhado  por  cada 
variável  independente  na  previsão  da  medida  dependente. 
Finalmente,  os  resultados  são  validados  para  garantir  ge¬ 
neralização  para  a  população.  As  Figuras  4-1  e  4-6  repre¬ 
sentam  os  estágios  1-3  e  4-6,  respectivamente,  fornecendo 
uma  representação  gráfica  do  processo  de  construção  do 
modelo  para  regressão  múltipla,  e  as  seções  a  seguir  discu¬ 
tem  cada  passo  em  detalhes. 
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Estágio  1 


Estágio  2 


Estágio  3 


FiGURA  4-1  Estágios  1  -3  no  diagrama  de  decisão  de  regressão  múitipia. 


ESTÁGIO  1:  OBJETIVOS  DA 
REGRESSÃO  MÚLTIPLA 

A  análise  de  regressão  múltipla,  uma  forma  de  modela¬ 
gem  linear  geral,  é  uma  técnica  estatística  multivariada 
usada  para  examinar  a  relação  entre  uma  única  variável 
dependente  e  um  conjunto  de  variáveis  independentes.  O 
ponto  de  partida  necessário  na  regressão  múltipla,  como 
ocorre  em  todas  as  técnicas  estatísticas  multivariadas,  é  o 
problema  de  pesquisa.  A  flexibilidade  e  a  adaptabilidade 
da  regressão  múltipla  permitem  seu  uso  em  quase  toda  re¬ 
lação  de  dependência.  Ao  selecionar  aplicações  adequa¬ 
das  de  regressão  múltipla,  o  pesquisador  deve  considerar 
três  questões  principais: 

1.  Adequação  do  problema  de  pesquisa 

2.  Especificação  de  uma  relação  estatística 

3.  Seleção  das  variáveis  dependente  e  independentes 


Problemas  de  pesquisa  apropriados 
à  regressão  múltipla 

A  regressão  múltipla  é  de  longe  a  técnica  multivariada  mais 
utilizada  entre  aquelas  examinadas  neste  texto.  Com  sua 
ampla  aplicabilidade,  a  regressão  múltipla  tem  sido  usada 
para  muitos  propósitos.  Suas  aplicações  sempre  crescentes 
recaem  em  duas  grandes  classes  de  problemas  de  pesquisa: 
previsão  e  explicação.  Previsão  envolve  o  quanto  que  uma 
variável  estatística  de  regressão  (uma  ou  mais  variáveis  in¬ 
dependentes)  pode  prever  da  variável  dependente.  Expli¬ 
cação  examina  os  coeficientes  de  regressão  (sua  magnitude, 
sinal  e  significância  estatística)  para  cada  variável  indepen¬ 
dente  e  tenta  desenvolver  uma  razão  substantiva  ou  teórica 
para  os  efeitos  das  variáveis  independentes.  Tais  proble¬ 
mas  de  pesquisa  não  são  mutuamente  excludentes,  e  uma 
aplicação  da  análise  de  regressão  múltipla  pode  abordar 
qualquer  um  ou  ambos  os  tipos  de  problema  de  pesquisa. 
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Previsão  com  regressão  múltipla 

Um  propósito  fundamental  da  regressão  múltipla  é  prever 
a  variável  dependente  com  um  conjunto  de  variáveis  inde¬ 
pendentes.  Ao  fazer  isso,  a  regressão  múltipla  atinge  um 
entre  dois  objetivos. 

•  O  primeiro  objetivo  ê  maximizar  o  poder  preditivo  geral 
das  variáveis  independentes  como  representadas  na  variável 
estatística.  Como  mostrado  em  nosso  exemplo  anterior  de 
previsão  de  uso  de  cartões  de  crédito,  a  variável  estatísti¬ 
ca  é  formada  pela  estimação  dos  coeficientes  de  regressão 
para  cada  variável  independente  de  modo  a  se  tornar  o 
preditor  ótimo  da  medida  dependente.  Precisão  preditiva 
é  sempre  crucial  para  garantir  a  validade  do  conjunto  de 
variáveis  independentes.  Medidas  de  precisão  preditiva  são 
desenvolvidas  e  testes  estatísticos  são  usados  para  avaliar  a 
significância  do  poder  preditivo.  Em  todos  os  casos,  preten¬ 
dendo  o  pesquisador  interpretar  os  coeficientes  da  variável 
estatística  ou  não,  a  análise  de  regressão  deve  atingir  níveis 
aceitáveis  de  precisão  preditiva  para  justificar  sua  aplicação. 
O  pesquisador  deve  garantir  que  tanto  a  significância  esta¬ 
tística  quanto  a  prática  são  consideradas  (ver  as  discussões 
no  estágio  4). 

Em  certas  aplicações  concentradas  apenas  na  previsão, 
o  pesquisador  está  interessado  principalmente  em  atingir  a 
previsão  máxima,  e  interpretar  os  coeficientes  de  regressão 
é  relativamente  pouco  importante.  Ao  invés  disso,  o  pesqui¬ 
sador  emprega  as  muitas  opções  na  forma  e  na  especificação 
das  variáveis  independentes  que  podem  modificar  a  variá¬ 
vel  estatística  para  aumentar  seu  poder  preditivo,  frequen¬ 
temente  maximizando  previsão  às  custas  da  interpretação. 
Um  exemplo  específico  é  uma  variante  da  regressão,  análise 
de  série  temporal,  na  qual  o  único  propósito  é  previsão,  e 
a  interpretação  dos  resultados  é  útil  só  como  um  meio  de 
aumentar  a  precisão  preditiva. 

•  A  regressão  múltipla  também  pode  atingir  um  segundo 
objetivo  de  comparar  dois  ou  mais  conjuntos  de  variáveis 
independentes  para  examinar  o  poder  preditivo  de  cada  va¬ 
riável  estatística.  Ilustrativo  de  uma  abordagem  confirma- 
tória  para  modelagem,  esse  uso  da  regressão  múltipla  está 
relacionado  com  a  comparação  de  resultados  entre  dois 
ou  mais  modelos  alternativos  ou  concorrentes.  O  principal 
foco  desse  tipo  de  análise  é  o  poder  preditivo  relativo  entre 
modelos,  apesar  de  que,  em  qualquer  situação,  a  previsão 
do  modelo  selecionado  deve  demonstrar  significâncias  es¬ 
tatística  e  prática. 

Explicação  com  regressão  múltipla 

A  regressão  múltipla  também  fornece  um  meio  de  ava¬ 
liar  objetivamente  o  grau  e  caráter  da  relação  entre  va¬ 
riáveis  dependente  e  independentes,  pela  formação  da 
variável  estatística  de  variáveis  independentes  e  então 
examinando  a  magnitude,  sinal  e  significância  estatística 
do  coeficiente  de  regressão  para  cada  variável  indepen¬ 
dente.  Deste  modo,  as  variáveis  independentes,  além  de 
sua  previsão  coletiva  da  variável  dependente,  também 
podem  ser  consideradas  por  sua  contribuição  individual 
à  variável  estatística  e  suas  previsões.  A  interpretação  da 
variável  estatística  pode  se  apoiar  em  qualquer  uma  de 


três  perspectivas:  a  importância  das  variáveis  independen¬ 
tes,  os  tipos  de  relações  encontradas,  ou  as  inter-relações 
entre  as  variáveis  independentes. 

•  A  interpretação  mais  direta  da  variável  estatística  de  regres¬ 
são  é  uma  determinação  da  importância  relativa  de  cada  va¬ 
riável  independente  na  previsão  da  medida  dependente.  Em 
todas  as  aplicações,  a  seleção  de  variáveis  independentes 
deve  ser  baseada  em  suas  relações  teóricas  com  a  variável 
dependente.  A  análise  de  regressão  fornece  então  um  meio 
de  avaliar  objetivamente  a  magnitude  e  a  direção  (positiva 
ou  negativa)  da  relação  de  cada  variável  independente.  O 
caráter  da  regressão  múltipla  que  a  diferencia  de  suas  con- 
trapartes  univariadas  é  a  avaliação  simultânea  de  relações 
entre  cada  variável  independente  e  a  medida  dependente. 
Ao  fazer  essa  avaliação  simultânea,  a  importância  relativa 
de  cada  variável  independente  é  determinada. 

•  Além  de  avaliar  a  importância  de  cada  variável,  a  regressão 
múltipla  também  dá  ao  pesquisador  um  meio  de  avaliar  a 
natureza  das  relações  entre  as  variáveis  independentes  e  a 
variável  dependente.  A  relação  assumida  é  uma  associação 
linear  baseada  nas  correlações  entre  as  variáveis  indepen¬ 
dentes  e  a  medida  dependente.  Transformações  ou  variá¬ 
veis  adicionais  também  estão  disponíveis  para  avaliar  se  há 
outros  tipos  de  relações,  particularmente  relações  curvilí- 
neas.  Essa  flexibilidade  garante  que  o  pesquisador  possa 
examinar  a  verdadeira  natureza  da  relação,  além  da  linear 
considerada. 

•  Finalmente,  a  regressão  múltipla  fornece  uma  visão  das 
relações  entre  variáveis  independentes  em  sua  previsão  da 
medida  dependente.  Essas  inter-relações  são  importantes 
por  dois  motivos.  Primeiro,  a  correlação  entre  as  variáveis 
independentes  pode  tornar  algumas  variáveis  redundantes 
no  esforço  preditivo.  Desse  modo,  elas  não  são  necessárias 
para  produzir  a  previsão  ótima,  dadas  as  outras  variáveis 
independentes  na  equação  de  regressão.  Em  tais  casos,  a  va¬ 
riável  independente  terá  uma  forte  relação  individual  com 
a  variável  dependente  (correlações  bivariadas  substanciais 
com  a  variável  dependente),  mas  tal  relação  é  sensivelmente 
diminuída  em  um  contexto  multivariado  (a  correlação  par¬ 
cial  com  a  variável  dependente  é  baixa  quando  considerada 
com  outras  variáveis  na  equação  de  regressão).  Qual  é  a  in¬ 
terpretação  “correta”  nesta  situação?  Deve  o  pesquisador 
focalizar  a  forte  correlação  bivariada  para  avaliar  impor¬ 
tância,  ou  deve  a  relação  reduzida  no  contexto  multivariado 
formar  a  base  para  a  avaliação  da  relação  da  variável  com  a 
dependente? 

Aqui  o  pesquisador  deve  confiar  nas  bases  teóricas 
da  análise  de  regressão  para  avaliar  a  “verdadeira”  re¬ 
lação  para  a  variável  independente.  Em  tais  situações,  o 
pesquisador  deve  se  prevenir  contra  a  determinação  da 
importância  de  variáveis  independentes  com  base  somente 
na  variável  estatística  obtida,  pois  relações  entre  as  variá¬ 
veis  independentes  podem  mascarar  ou  confundir  relações 
que  não  são  necessárias  para  fins  preditivos,  mas  que,  ain¬ 
da  assim,  representam  descobertas  substantivas.  As  inter- 
relações  entre  variáveis  podem  se  estender  não  apenas  a 
seu  poder  preditivo,  mas  também  a  relações  entre  seus 
efeitos  estimados,  o  que  é  melhor  percebido  quando  o 
efeito  de  uma  variável  independente  é  condicional  a  ou¬ 
tra  medida  independente. 
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A  regressão  múltipla  fornece  análises  diagnósticas  que 
podem  determinar  se  tais  efeitos  existem  com  base  em  ar¬ 
gumento  empírico  ou  teórico.  Indicações  de  um  grau  eleva¬ 
do  de  inter-relações  (multicolinearidade)  entre  as  variáveis 
independentes  podem  sugerir  o  uso  de  escalas  múltiplas, 
como  discutido  no  Capítulo  3. 

Especificação  de  uma  relação  estatística 

A  regressão  múltipla  é  apropriada  quando  o  pesquisador 
está  interessado  em  uma  relação  estatística,  e  não  funcio¬ 
nal.  Por  exemplo,  examinemos  a  seguinte  relação: 

Custo  total  =  Custo  variável  -i-  Custo  fixo 

Se  o  custo  variável  for  $2  por  unidade,  o  custo  fixo  for 
$500  e  produzirmos  100  unidades,  assumimos  que  o  custo 
total  será  de  exatamente  $700  e  que  qualquer  desvio  de 
$700  é  causado  por  nossa  falta  de  habilidade  em  medir 
custos,  uma  vez  que  a  relação  entre  custos  é  fixa.  Isso  é 
o  que  se  chama  de  relação  funcional,  pois  esperamos  que 
não  exista  erro  algum  em  nossa  previsão.  Como  tal,  sem¬ 
pre  sabemos  o  impacto  de  cada  variável  no  cálculo  da  me¬ 
dida  de  resultado. 

Entretanto,  em  nosso  exemplo  anterior  que  lidava  com 
dados  amostrais  representando  comportamento  humano, 
assumimos  que  nossa  descrição  do  uso  de  cartões  de  cré¬ 
dito  era  apenas  aproximada,  e  não  uma  previsão  perfei¬ 
ta.  Ela  foi  definida  como  uma  relação  estatística  porque 
sempre  há  algum  componente  aleatório  na  relação  em 
exame.  Uma  relação  estatística  é  caracterizada  por  dois 
elementos: 

1.  Quando  múltiplas  observações  são  coletadas,  mais  de  um 
valor  da  medida  dependente  geralmente  será  observado 
para  qualquer  valor  de  uma  variável  independente. 

2.  Com  base  no  uso  de  uma  amostra  aleatória,  o  erro  na  pre¬ 
visão  da  variável  dependente  também  é  considerado  aleató¬ 
rio,  e  para  uma  dada  variável  independente,  podemos  ape¬ 
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(a)  Relação  funcional 


nas  esperar  estimar  o  valor  médio  da  variável  dependente 
associado  a  ela. 


Em  nosso  exemplo  de  regressão  simples,  encontramos 
duas  famílias  com  dois  membros,  duas  com  quatro  mem¬ 
bros,  e  assim  por  diante,  que  tinham  diferentes  quanti¬ 
dades  de  cartões  de  crédito.  As  duas  famílias  com  qua¬ 
tro  membros  mantinham  uma  média  de  6,5  cartões  de 
crédito,  e  nossa  previsão  era  de  6,75.  Não  é  tão  precisa 
quanto  gostaríamos,  mas  é  melhor  do  que  apenas  usar 
a  média  de  7  cartões  de  crédito.  O  erro  é  considerado 
resultado  do  comportamento  aleatório  entre  usuários  de 
cartões  de  crédito. 


Em  resumo,  uma  relação  funcional  calcula  um  valor 
exato,  enquanto  uma  relação  estatística  estima  um  valor 
médio.  As  duas  relações  são  exibidas  na  Figura  4-2.  Neste 
livro,  estamos  interessados  em  relações  estatísticas.  Nossa 
habilidade  de  empregar  apenas  uma  amostra  de  observa¬ 
ções  e  em  seguida  usar  os  métodos  de  estimação  das  téc¬ 
nicas  multivariadas  e  avaliar  a  significância  das  variáveis 
independentes  se  baseia  em  teoria  estatística.  Fazendo 
isso,  devemos  nos  assegurar  de  atender  às  suposições  es¬ 
tatísticas  inerentes  a  cada  técnica  multivariada,  pois  elas 
são  críticas  em  nossa  habilidade  de  fazer  previsões  não- 
tendenciosas  da  variável  dependente  e  interpretações  vá¬ 
lidas  das  variáveis  independentes. 

Seleção  de  variáveis  dependente 
e  independentes 

O  grande  sucesso  de  qualquer  técnica  multivariada,  inclu¬ 
sive  da  regressão  múltipla,  começa  com  a  seleção  das  va¬ 
riáveis  a  serem  usadas  na  análise.  Como  a  regressão  múl¬ 
tipla  é  uma  técnica  de  dependência,  o  pesquisador  deve 
especificar  qual  variável  é  a  dependente  e  quais  são  as 
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FIGURA  4-2  Comparação  das  relações  funcional  e  estatística. 
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independentes.  Apesar  de  muitas  vezes  as  opções  parece¬ 
rem  evidentes,  o  pesquisador  sempre  deve  considerar  três 
pontos  que  podem  afetar  qualquer  decisão:  teoria  forte, 
erro  de  medida  e  erro  de  especificação. 

Teoria  forte 

A  seleção  dos  dois  tipos  de  variáveis  deve  ser  baseada 
principalmente  em  questões  conceituais  ou  teóricas,  mes¬ 
mo  quando  o  objetivo  é  somente  previsão.  Os  Capítulos  1 
e  10  discutem  o  papel  da  teoria  em  análise  multivariada, 
e  tais  questões  se  aplicam  muito  à  regressão  múltipla.  O 
pesquisador  deve  tomar  decisões  fundamentais  sobre  a 
seleção  de  variáveis,  ainda  que  muitas  opções  e  modos  de 
programas  estejam  disponíveis  para  auxiliar  na  estimação 
do  modelo.  Se  o  pesquisador  não  exerce  julgamento  du¬ 
rante  a  seleção  de  variáveis,  mas,  em  vez  disso,  (1)  sele¬ 
ciona  variáveis  indiscriminadamente  ou  (2)  permite  que 
a  seleção  de  uma  variável  independente  seja  sustentada 
apenas  em  bases  empíricas,  vários  dos  pressupostos  bási¬ 
cos  do  desenvolvimento  de  modelos  serão  violados. 

Erro  de  medida 

A  seleção  de  uma  variável  dependente  muitas  vezes  é 
ditada  pelo  problema  de  pesquisa.  Em  todos  os  casos,  o 
pesquisador  deve  estar  a  par  do  erro  de  medida,  espe¬ 
cialmente  na  variável  dependente.  O  erro  de  medida  re- 
fere-se  ao  grau  em  que  a  variável  é  uma  medida  precisa 
e  consistente  do  conceito  em  estudo.  Se  a  variável  usada 
como  a  medida  dependente  contiver  um  erro  de  medida 
substancial,  então  mesmo  as  melhores  variáveis  indepen¬ 
dentes  poderão  ser  incapazes  de  atingir  níveis  aceitáveis 
de  precisão  preditiva.  Apesar  de  o  erro  de  medida  poder 
surgir  de  várias  fontes  (ver  Capítulo  1  para  uma  discussão 
mais  detalhada),  a  regressão  múltipla  não  dispõe  de  uma 
maneira  direta  de  correção  para  níveis  conhecidos  de  erro 
de  medida  para  a  variável  dependente  ou  as  independen¬ 
tes. 

O  erro  de  medida  problemático  pode  ser  tratado  por 
meio  de  duas  abordagens: 

•  Escalas  múltiplas,  como  discutido  nos  Capítulos  1  e  3,  em¬ 
pregam  múltiplas  variáveis  para  reduzir  a  confiança  em 
qualquer  variável  isolada  como  a  única  representativa  de 
um  conceito. 

•  Modelagem  de  equações  estruturais  (Capítulo  10)  acomoda 
diretamente  erro  de  medida  na  estimação  de  efeitos  das  va¬ 
riáveis  independentes  em  qualquer  relação  de  dependência 
especificada. 

Escalas  múltiplas  podem  ser  diretamente  incorpora¬ 
das  na  regressão  múltipla  substituindo-se  ou  a  variável 
dependente  ou  as  independentes  com  os  valores  da  escala 
múltipla,  enquanto  a  modelagem  de  equações  estruturais 
requer  o  uso  de  uma  técnica  inteiramente  diferente  geral¬ 
mente  tida  como  mais  difícil  de  implementar.  Assim,  esca¬ 
las  múltiplas  são  recomendadas  como  a  primeira  escolha 
na  correção  de  erro  de  medida  onde  for  possível. 


Erro  de  especificação 

Talvez  a  questão  mais  problemática  na  seleção  de  variá¬ 
veis  independentes  seja  o  erro  de  especificação,  o  qual  se 
refere  à  inclusão  de  variáveis  irrelevantes  ou  à  omissão 
de  variáveis  relevantes  do  conjunto  de  variáveis  indepen¬ 
dentes. 

Ambos  os  tipos  de  erro  de  especificação  podem  ter 
impactos  substanciais  em  qualquer  análise  de  regressão, 
embora  de  maneiras  muito  diferentes: 

•  Apesar  de  a  inclusão  de  variáveis  irrelevantes  não  viesar  os 
resultados  para  as  outras  variáveis  independentes,  ela  exer¬ 
ce  algum  impacto  sobre  a  variável  estatística  de  regressão. 
Primeiro,  reduz  a  parcimônia  do  modelo,  a  qual  pode  ser 
crucial  na  interpretação  dos  resultados.  Segundo,  as  variá¬ 
veis  adicionais  podem  mascarar  ou  substituir  os  efeitos  de 
variáveis  mais  úteis,  especialmente  se  alguma  forma  seqüen- 
cial  de  estimação  de  modelo  for  empregada  (ver  a  discussão 
do  estágio  4  para  mais  detalhes).  Finalmente,  as  variáveis 
adicionais  podem  tornar  o  teste  de  significância  estatística 
das  variáveis  independentes  menos  preciso  e  reduzir  a  signi¬ 
ficância  estatística  e  prática  da  análise. 

•  Dados  os  problemas  associados  ao  acréscimo  de  variáveis 
irrelevantes,  o  pesquisador  deve  se  preocupar  com  a  exclu¬ 
são  de  variáveis  relevantes?  A  resposta  é  definitivamente 
positiva,  pois  a  exclusão  de  variáveis  relevantes  pode  causar 
sérios  vieses  nos  resultados  e  afetar  negativamente  qual¬ 
quer  interpretação  dos  mesmos.  No  caso  mais  simples,  as 
variáveis  omitidas  são  não-correlacionadas  com  as  variáveis 
incluídas,  e  o  único  efeito  é  reduzir  a  precisão  preditiva  ge¬ 
ral  da  análise.  Quando  existe  correlação  entre  as  variáveis 
omitidas  e  incluídas,  os  efeitos  das  variáveis  incluídas  se 
tornam  mais  viesados  à  medida  que  elas  são  correlaciona¬ 
das  com  as  omitidas.  Quanto  maior  a  correlação,  maior  o 
viés.  Qs  efeitos  estimados  para  as  variáveis  incluídas  ago¬ 
ra  representam  não  apenas  seus  efeitos  reais,  mas  também 
os  efeitos  que  as  variáveis  incluídas  compartilham  com  as 
variáveis  omitidas.  Isso  pode  conduzir  a  problemas  sérios 
na  interpretação  do  modelo  e  na  avaliação  da  significância 
estatística  e  gerencial. 

O  pesquisador  deve  ser  cuidadoso  na  seleção  das  va¬ 
riáveis  para  evitar  os  dois  tipos  de  erro  de  especificação. 
Talvez  mais  problemática  seja  a  omissão  de  variáveis  re- 

-  REGRAS  PRÁTICAS  4-1  - 

Atendimento  dos  objetivos  da  regressão  múltipla 

•  Apenas  a  modelagem  de  equações  estruturais  (SEM) 
pode  acomodar  diretamente  erro  de  medida,  usando 
escalas  múltiplas  para  diminuí-lo  quando  se  emprega 
regressão  múltipla. 

•  Quando  em  dúvida,  inclua  variáveis  potencialmente 
irrelevantes  (elas  podem  apenas  confundir  a 
interpretação)  ao  invés  de  possivelmente  omitir 
uma  variável  relevante  (o  que  pode  viesar  todas  as 
estimativas  de  regressão). 
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levantes,  uma  vez  que  o  efeito  das  variáveis  não  pode 
ser  avaliado  sem  sua  inclusão  (ver  Regras  Práticas  4-1). 
Sua  potencial  influência  em  qualquer  resultado  aumenta 
a  necessidade  de  apoio  teórico  e  prático  para  todas  as 
variáveis  incluídas  ou  excluídas  em  uma  análise  de  re¬ 
gressão  múltipla. 


ESTÁGIO  2:  PLANEJAMENTO  DE 
PESQUISA  DE  UMA  ANÁLISE 
DE  REGRESSÁO  MÚLTIPLA 

Adaptabilidade  e  flexibilidade  são  duas  das  principais  ra¬ 
zões  para  o  amplo  uso  de  regressão  múltipla  em  uma  vas¬ 
ta  variedade  de  aplicações.  Como  você  verá  nas  seções  a 
seguir,  a  regressão  múltipla  pode  representar  uma  grande 
gama  de  relações  de  dependência.  Ao  fazer  isso,  o  pesqui¬ 
sador  incorpora  três  características: 

1.  Tamanho  da  amostra.  A  regressão  múltipla  mantém  os  ní¬ 
veis  necessários  de  poder  estatístico  e  significância  prática  e 
estatística  ao  longo  de  muitos  tamanhos  de  amostras. 

2.  Elementos  únicos  da  relação  de  dependência.  Ainda  que 
variáveis  independentes  sejam  consideradas  métricas  e  te¬ 
nham  uma  relação  linear  com  a  variável  dependente,  ambas 
as  suposições  podem  ser  mais  flexíveis  ou  tolerantes,  crian- 
do-se  variáveis  adicionais  para  representarem  esses  aspec¬ 
tos  especiais  da  relação. 

3.  Natureza  das  variáveis  independentes.  Regressão  múltipla 
acomoda  variáveis  independentes  métricas  que  são  conside¬ 
radas  como  fixas  por  natureza,  bem  como  aquelas  com  uma 
componente  aleatória. 

Cada  uma  dessas  características  tem  um  papel  chave 
na  aplicação  da  regressão  múltipla  em  muitos  tipos  de 
questões  de  pesquisa,  ao  mesmo  tempo  em  que  mantêm 
os  níveis  necessários  de  significância  estatística  e  prática. 

Tamanho  da  amostra 

O  tamanho  da  amostra  em  regressão  múltipla  talvez  seja 
o  elemento  mais  influente  sob  o  controle  do  pesquisador 


no  planejamento  da  análise.  Os  efeitos  de  tamanho  da 
amostra  são  vistos  mais  diretamente  no  poder  estatístico 
do  teste  de  significância  e  na  generalização  do  resultado. 
Ambas  as  questões  são  analisadas  nas  seções  que  se  se¬ 
guem. 

Poder  estatístico  e  tamanho  da  amostra 

O  tamanho  da  amostra  tem  um  impacto  direto  sobre  a 
adequação  e  o  poder  estatístico  da  regressão  múltipla. 
Amostras  pequenas,  geralmente  caracterizadas  por 
menos  de  30  observações,  são  apropriadas  para  análise 
apenas  por  regressão  simples  com  uma  única  variável 
independente.  Mesmo  nessas  situações,  apenas  relações 
fortes  podem  ser  detectadas  com  algum  grau  de  certeza. 
Do  mesmo  modo,  amostras  muito  grandes,  de  1000  ob¬ 
servações  ou  mais,  tornam  os  testes  de  significância  esta¬ 
tística  excessivamente  sensíveis,  muitas  vezes  indicando 
que  quase  qualquer  relação  é  estatisticamente  signiflcan- 
te.  Com  amostras  muito  grandes,  o  pesquisador  deve  ga¬ 
rantir  que  o  critério  de  significância  prática  seja  atendido 
junto  com  a  significância  estatística. 

Níveis  de  poder  em  vários  modelos  de  regressão.  O  po¬ 
der  em  regressão  múltipla  se  refere  à  probabilidade  de 
detectar-se  como  estatisticamente  signiflcante  um  nível 
específico  de  ou  um  coeficiente  de  regressão  em  um 
nível  de  significância  especificado  para  um  dado  tama¬ 
nho  de  amostra  (ver  Capítulo  1  para  uma  discussão  mais 
detalhada).  O  tamanho  da  amostra  tem  um  impacto  não 
apenas  na  avaliação  do  poder  de  uma  análise  corrente, 
mas  também  na  antecipação  do  poder  estatístico  de  uma 
análise  proposta. 

A  Tabela  4-7  ilustra  o  efeito  recíproco  entre  o  tama¬ 
nho  da  amostra,  o  nível  de  significância  (a)  escolhido  e  o 
número  de  variáveis  independentes  na  detecção  de  um 
signiflcante.  Os  valores  da  tabela  são  o  R^  mínimo  que  o 
tamanho  de  amostra  especificado  detecta  como  estatis¬ 
ticamente  signiflcante  no  nível  alfa  (a)  especificado  com 
um  poder  (probabilidade)  de  0,80. 


TABELA  4-7  FÍ  mínimo  que  pode  ser  tido  como  estatisticamente  significante  com  um  poder  de  0,80  para 
diferentes  números  de  variáveis  independentes  e  tamanhos  de  amostras 


Nível  de  significância  (a)  =  0,01 

Número  de  variáveis  independentes 

Nívei  de  significância  (a)  =  0,05 
Número  de  variáveis  independentes 

Tamanho 
da  amostra 

2 

5 

10 

20 

2 

5 

10 

20 

20 

45 

56 

71 

NA 

39 

48 

64 

NA 

50 

23 

29 

36 

49 

19 

23 

29 

42 

100 

13 

16 

20 

26 

10 

12 

15 

21 

250 

5 

7 

8 

11 

4 

5 

6 

8 

500 

3 

3 

4 

6 

3 

4 

5 

9 

1.000 

1 

2 

2 

3 

1 

1 

2 

2 

NA  =  não  aplicável 
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Por  exemplo,  se  o  pesquisador  empregar  cinco  variáveis 
independentes,  especificar  um  nível  de  significância  de 
0,05  e  estiver  satisfeito  em  detectar  o  em  80%  das  ve¬ 
zes  em  que  ocorre  (o  que  corresponde  a  um  poder  de 
0,80),  uma  amostra  de  50  respondentes  detectará  valo¬ 
res  maiores  ou  iguais  a  23%.  Se  a  amostra  aumentar 
para  100  respondentes,  então  os  valores  de  de  12%  ou 
mais  serão  detectados.  Entretanto,  se  50  respondentes 
são  tudo  que  está  disponível  e  o  pesquisador  desejar  um 
nível  de  significância  de  0,01,  a  análise  detectará  valores 
apenas  maiores  ou  iguais  a  29%. 


Exigências  de  tamanho  de  amostra  para  poder  deseja¬ 
do.  O  pesquisador  pode  também  considerar  o  papel  do 
tamanho  da  amostra  no  teste  de  significância  antes  da  co¬ 
leta  dos  dados.  Se  relações  mais  fracas  são  esperadas,  o 
pesquisador  pode  fazer  julgamentos  com  base  em  infor¬ 
mações  factuais  quanto  ao  tamanho  necessário  da  amos¬ 
tra  para  detectar  razoavelmente  as  relações,  se  elas  exis¬ 
tirem. 


Por  exemplo,  a  Tabela  4-7  demonstra  que  tamanhos  de 
amostra  de  100  detectam  valores  R^  muito  pequenos 
(10%  a  15%)  com  até  10  variáveis  independentes  e  um 
nível  de  significância  de  0,05.  No  entanto,  se  o  tamanho 
da  amostra  nessas  situações  cai  para  50  observações,  o 
mínimo  que  pode  ser  detectado  dobra. 


O  pesquisador  também  pode  determinar  o  tamanho 
da  amostra  necessário  para  detectar  efeitos  para  as  variá¬ 
veis  independentes  individuais,  dado  o  tamanho  do  efeito 
esperado  (correlação),  o  nível  a  e  o  poder  desejado.  As 
computações  possíveis  são  muito  numerosas  para  serem 
apresentadas  nesta  discussão,  e  o  leitor  interessado  pode 
consultar  textos  que  tratam  de  análise  do  poder  [5]  ou 
um  programa  de  computador  para  calcular  o  tamanho  da 
amostra  ou  do  poder  em  uma  dada  situação  [3]. 

Resumo.  O  pesquisador  sempre  deve  estar  ciente  do  po¬ 
der  antecipado  de  qualquer  análise  de  regressão  múltipla 
proposta.  É  crítico  entender  os  elementos  do  planejamen¬ 
to  da  pesquisa,  particularmente  tamanho  da  amostra,  que 
podem  ser  mudados  para  atender  às  exigências  de  uma 
análise  aceitável  [9]. 

Generalização  e  tamanho  da  amostra 

Além  de  seu  papel  na  determinação  do  poder  estatístico, 
o  tamanho  da  amostra  também  afeta  a  generalização  dos 
resultados  pela  proporção  entre  observações  e  variáveis 
independentes.  Uma  regra  geral  é  que  a  razão  jamais  deve 
ficar  abaixo  de  5  para  1,  o  que  significa  que  deve  haver 
cinco  observações  para  cada  variável  independente  na 
variável  estatística.  Apesar  de  a  proporção  mínima  ser 


de  5  para  1,  o  nível  desejado  está  entre  15  e  20  observa¬ 
ções  para  cada  variável  independente.  Quando  esse  nível 
é  alcançado,  os  resultados  devem  ser  generalizáveis  se  a 
amostra  é  representativa.  No  entanto,  se  um  procedimen¬ 
to  stepwise  é  empregado,  o  nível  recomendado  aumenta 
para  50  por  1,  pois  essa  técnica  seleciona  apenas  as  rela¬ 
ções  mais  fortes  dentro  do  conjunto  de  dados  e  sofre  de 
uma  maior  tendência  para  se  tornar  específica  da  amostra 
[16].  Em  casos  nos  quais  a  amostra  disponível  não  atende 
a  esses  critérios,  o  pesquisador  deve  se  certificar  de  vali¬ 
dar  a  generalização  dos  resultados. 

Definição  de  graus  de  liberdade.  Se  essa  proporção  ficar 
abaixo  de  5  para  1,  o  pesquisador  corre  o  risco  de  supera- 
justar  a  variável  estatística  à  amostra,  tornando  os  resul¬ 
tados  demasiadamente  específicos  à  amostra  e  assim  per¬ 
dendo  a  generalização.  Ao  compreendermos  o  conceito 
de  superajuste,  precisamos  lidar  com  a  noção  estatística 
de  graus  de  liberdade.  Em  qualquer  procedimento  de  esti¬ 
mação  estatística,  o  pesquisador  está  fazendo  estimativas 
de  parâmetros  a  partir  dos  dados  da  amostra.  No  caso  de 
regressão,  os  parâmetros  são  os  coeficientes  de  regressão 
para  cada  variável  independente  e  o  termo  constante. 
Como  anteriormente  descrito,  os  coeficientes  de  regres¬ 
são  são  os  pesos  usados  no  cálculo  da  variável  estatística 
de  regressão  e  indicam  a  contribuição  de  cada  variável  in¬ 
dependente  ao  valor  previsto.  O  que  é  então  a  relação  en¬ 
tre  o  número  de  observações  e  de  variáveis?  Examinemos 
rapidamente  a  estimação  de  parâmetros  para  um  melhor 
discernimento  sobre  esse  problema. 

Cada  observação  representa  uma  unidade  separada  e 
independente  de  informação  (i.e.,  um  conjunto  de  valores 
para  cada  variável  independente).  Em  uma  visão  simplis¬ 
ta,  o  pesquisador  poderia  dedicar  uma  única  variável  a 
prever  perfeitamente  somente  uma  observação,  uma  se¬ 
gunda  variável  a  outra  observação,  e  assim  por  diante.  Se 
a  amostra  é  relativamente  pequena,  então  a  precisão  pre- 
ditiva  poderia  ser  bastante  alta,  e  muitas  das  observações 
seriam  perfeitamente  previstas.  Na  verdade,  se  o  número 
de  parâmetros  estimados  (coeficientes  de  regressão  e  a 
constante)  se  iguala  ao  tamanho  da  amostra,  previsão  per¬ 
feita  acontecerá  mesmo  que  todos  os  valores  de  variáveis 
sejam  números  aleatórios.  Tal  cenário  seria  totalmente 
inaceitável  e  considerado  como  extremamente  superajus- 
tado,  pois  os  parâmetros  estimados  não  têm  generaliza¬ 
ção,  mas  se  relacionam  apenas  com  a  amostra.  Além  disso, 
sempre  que  uma  variável  for  acrescentada  na  equação  de 
regressão,  o  valor  R^  aumentará. 

Graus  de  liberdade  como  medida  de  geueralização.  O 

que  acontece  com  a  generalização  quando  o  tamanho  da 
amostra  aumenta?  Podemos  perfeitamente  prever  uma 
observação  com  uma  só  variável,  mas  e  quanto  a  todas  as 
outras  observações?  Assim,  o  pesquisador  está  procuran¬ 
do  pelo  melhor  modelo  de  regressão,  um  com  a  melhor 
precisão  preditiva  para  a  maior  amostra  (a  mais  genera- 
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lizável).  O  grau  de  generalização  é  representado  pelos 
graus  de  liberdade,  calculados  como: 

Graus  de  liberdade  (df)  =  Tamanho  da  amostra  - 
Número  de  parâmetros  estimados 

ou 

Graus  de  liberdade  (df)  =  N  -  (Número  de  variáveis 
independentes  + 1) 

Quanto  mais  graus  de  liberdade,  mais  generalizáveis 
são  os  resultados.  Graus  de  liberdade  aumentam  em  uma 
dada  amostra  reduzindo-se  o  número  de  variáveis  inde¬ 
pendentes.  Assim,  a  meta  é  conseguir  a  melhor  precisão 
preditiva  com  o  máximo  de  graus  de  liberdade.  Em  nosso 
exemplo  anterior,  onde  o  número  de  parâmetros  estima¬ 
dos  é  igual  ao  tamanho  da  amostra,  temos  uma  previsão 
perfeita,  mas  zero  graus  de  liberdade!  O  pesquisador  deve 
reduzir  o  número  de  variáveis  independentes  (ou  aumen¬ 
tar  o  tamanho  da  amostra),  diminuindo  a  precisão  predi¬ 
tiva  mas  também  aumentando  os  graus  de  liberdade.  Não 
há  diretrizes  específicas  para  determinar  quantos  graus  de 
liberdade  deve-se  ter,  mas  eles  são  indicativos  da  genera¬ 
lidade  dos  resultados  e  fornecem  uma  idéia  do  superajus- 
te  de  qualquer  modelo  de  regressão,  como  se  mostra  nas 
Regras  Práticas  4-2. 

Criação  de  variáveis  adicionais 

A  relação  básica  representada  na  regressão  múltipla  é  a 
associação  linear  entre  variáveis  dependente  e  indepen¬ 
dentes  com  base  na  correlação  produto-momento.  Um 
problema  freqüentemente  enfrentado  por  pesquisadores  é 
o  desejo  de  incorporar  dados  não-métricos,  como  sexo  ou 
profissão,  em  uma  equação  de  regressão.  Contudo,  como  já 
discutimos,  a  regressão  é  limitada  a  dados  métricos.  Mais 
que  isso,  a  falta  de  habilidade  da  regressão  de  diretamente 
modelar  relações  não-lineares  pode  restringir  o  pesquisa¬ 
dor  quando  ele  enfrenta  situações  nas  quais  uma  relação 
não-linear  (por  exemplo,  em  forma  de  U)  é  sugerida  pela 
teoria  ou  detectada  quando  se  examinam  os  dados. 

-  REGRAS  PRÁTICAS  4-2  - 

Considerações  sobre  tamanho  de  amostra 

•  Regressão  simples  pode  ser  efetiva  com  um  tamanho 
de  amostra  de  20,  mas  manter  poder  a  0,80  em 
regressão  múltipla  requer  uma  amostra  mínima  de  50 
e,  preferivelmente,  100  observações  para  a  maioria  das 
situações  de  pesquisa. 

•  A  proporção  mínima  de  observações  por  variáveis  é  5:1, 
mas  a  proporção  preferida  é  de  15:1  ou  20:1,  o  que  deve 
então  aumentar  quando  a  estimação  stepwise  é  usada. 

•  Maximizar  os  graus  de  liberdade  melhora  generalização 
e  lida  tanto  com  parcimônia  do  modelo  quanto  com 
preocupações  com  tamanho  da  amostra. 


Uso  de  transformações  de  variáveis 

Nessas  situações,  novas  variáveis  devem  ser  criadas  por 
transformações,  uma  vez  que  a  regressão  múltipla  é  total¬ 
mente  confiável  ao  se  criarem  novas  variáveis  no  mode¬ 
lo  para  incorporar  variáveis  não-métricas  ou  representar 
efeitos  diferentes  de  relações  lineares.  Também  encon¬ 
tramos  o  uso  de  transformações  discutidas  no  Capítulo  2 
como  um  meio  para  remediar  violações  de  algumas  supo¬ 
sições  estatísticas,  mas  nosso  propósito  aqui  é  fornecer  ao 
pesquisador  uma  maneira  de  modificar  a  variável  depen¬ 
dente  ou  as  independentes  por  uma  entre  duas  razões: 

1.  Melhorar  ou  modificar  a  relação  entre  variáveis  dependente 
e  independentes. 

2.  Permitir  o  emprego  de  variáveis  não-métricas  na  variável 
estatística  de  regressão. 

As  transformações  de  dados  podem  ser  baseadas  em 
razões  teóricas  (transformações  cuja  adequação  é  sus¬ 
tentada  na  natureza  dos  dados)  ou  de  origem  nos  dados 
(transformações  estritamente  sugeridas  por  um  exame 
dos  dados).  Em  qualquer  caso,  o  pesquisador  deve  proce¬ 
der  muitas  vezes  por  tentativa  e  erro,  avaliando  constante¬ 
mente  a  melhoria  versus  a  necessidade  de  transformações 
adicionais.  Exploramos  essas  questões  com  discussões  so¬ 
bre  as  transformações  de  dados  que  permitem  à  análise 
de  regressão  uma  melhor  representação  dos  dados  reais 
e  uma  discussão  da  criação  de  variáveis  para  suplementa¬ 
rem  as  originais. 

Todas  as  transformações  que  descrevemos  são  facil¬ 
mente  executáveis  por  comandos  simples  em  todos  os 
pacotes  estatísticos  populares.  Apesar  de  nos  concentrar¬ 
mos  em  transformações  que  podem  ser  computadas  desse 
modo,  há  outros  métodos  mais  sofisticados  e  complicados 
disponíveis  (p.ex.,  ver  Box  e  Cox  [4]). 

Incorporação  de  dados  não-métricos 
com  variáveis  dicotômicas 

Uma  situação  comum  enfrentada  por  pesquisadores  é  o 
desejo  de  utilizar  variáveis  independentes  não-métricas. 
Todavia,  até  aqui,  todos  os  nossos  exemplos  assumiram 
medida  métrica  para  variáveis  independentes  e  dependen¬ 
te.  Quando  a  variável  dependente  é  medida  como  dicotô¬ 
mica  (0, 1),  tanto  a  análise  discriminante  como  uma  forma 
especializada  de  regressão  (regressão  logística),  ambas 
discutidas  no  Capítulo  5,  são  adequadas.  Q  que  podemos 
fazer  quando  as  variáveis  independentes  são  não-métricas 
e  têm  duas  ou  mais  categorias?  Q  Capítulo  2  introduziu  o 
conceito  de  variáveis  dicotômicas,  as  quais  podem  atuar 
como  variáveis  independentes  substitutas.  Cada  variável 
dicotômica  representa  uma  categoria  de  uma  variável  in¬ 
dependente  não-métrica,  e  qualquer  variável  não-métrica 
com  k  categorias  pode  ser  representada  por  k-í  variáveis 
dicotômicas. 

Codificação  indicadora:  o  formato  mais  comum.  Das 

duas  formas  de  codificação  de  variáveis  dicotômicas,  a 
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mais  comum  é  a  codificação  indicadora,  na  qual  cada  ca¬ 
tegoria  da  variável  não-métrica  é  representada  por  1  ou  0. 
Os  coeficientes  de  regressão  para  as  variáveis  dicotômicas 
representam  diferenças  sobre  a  variável  dependente  para 
cada  grupo  de  respondentes  da  categoria  de  referência 
{isto  é,  o  grupo  omitido  que  recebeu  todos  os  zeros).  Essas 
diferenças  de  grupos  podem  ser  avaliadas  diretamente, 
uma  vez  que  os  coeficientes  estão  nas  mesmas  unidades 
da  variável  dependente. 


Essa  forma  de  codificação  de  variável  dicotômica  pode 
ser  descrita  como  diferentes  interceptos  para  os  vários 
grupos,  com  a  categoria  de  referência  representada  no 
termo  constante  do  modelo  de  regressão  (ver  Figura 
4-3).  Neste  exemplo,  uma  variável  não-métrica  de  três 
categorias  é  representada  por  duas  variáveis  dicotômi¬ 
cas  (£)j  e  D2),  representando  os  grupos  1  e  2,  sendo  o 
grupo  3  a  categoria  de  referência.  Os  coeficientes  de  re¬ 
gressão  são  2,0  para  e  -3,0  para  D^.  Esses  coeficientes 
se  traduzem  em  três  retas  paralelas.  O  grupo  de  referên¬ 
cia  (neste  caso,  o  grupo  3)  é  definido  pela  equação  de 
regressão  com  ambas  as  variáveis  dicotômicas  iguais  a 
zero.  A  reta  do  grupo  1  está  duas  unidades  acima  da  reta 
do  grupo  de  referência.  A  reta  do  grupo  2  está  três  uni¬ 
dades  abaixo  da  reta  do  grupo  de  referência  3.  As  retas 
paralelas  indicam  que  as  variáveis  dicotômicas  não  mu¬ 
dam  a  natureza  da  relação,  mas  apenas  fornecem  dife¬ 
rentes  interceptos  entre  os  grupos. 


Essa  forma  de  codificação  é  mais  apropriada  quando 
existe  um  grupo  de  referência  lógico,  como  em  um  expe¬ 
rimento.  Em  qualquer  momento  em  que  a  codificação  por 
variável  dicotômica  for  empregada,  devemos  estar  cien¬ 
tes  do  grupo  de  comparação  e  lembrar  que  os  coeficientes 
representam  as  diferenças  em  médias  em  relação  a  esse 
grupo. 

Codificação  de  efeitos.  Um  método  alternativo  de  codi¬ 
ficação  por  variável  dicotômica  se  chama  codificação  dos 
efeitos.  E  o  mesmo  que  codificação  indicadora,  exceto 
pelo  fato  de  que  o  grupo  de  comparação  ou  omitido  (o 
grupo  que  recebe  todos  os  zeros)  recebe  o  valor  -1  no  lu¬ 
gar  de  0  para  as  variáveis  dicotômicas.  Agora  os  coeficien¬ 
tes  representam  diferenças  para  qualquer  grupo  em  relação 
ã  média  de  todos  os  grupos,  e  não  em  relação  ao  grupo 
omitido.  Ambas  as  formas  de  codificação  por  variável  di¬ 
cotômica  dão  os  mesmos  resultados  preditivos,  coeficiente 
de  determinação  e  coeficientes  de  regressão  para  as  variá¬ 
veis  contínuas.  As  únicas  diferenças  estão  na  interpreta¬ 
ção  dos  coeficientes  das  variáveis  dicotômicas. 

Representação  de  efeitos  curvilíneos  com  polinómios 

Diversos  tipos  de  transformações  de  dados  são  adequados 
para  linearizar  uma  relação  curvilínea.  Abordagens  dire¬ 
tas,  discutidas  no  Capítulo  2,  envolvem  a  modificação  de 


valores  por  alguma  transformação  aritmética  (p.ex.,  a  raiz 
quadrada  ou  o  logaritmo  da  variável).  No  entanto,  tais 
transformações  estão  sujeitas  às  seguintes  limitações: 

•  Elas  são  aplicáveis  somente  em  uma  relação  curvilínea  sim¬ 
ples  (uma  relação  com  apenas  um  ponto  de  inflexão). 

•  Elas  não  fornecem  meios  estatísticos  para  avaliar  se  o  mo¬ 
delo  curvilíneo  ou  linear  é  mais  apropriado. 

•  Elas  acomodam  apenas  relações  univariadas,  e  não  a  intera¬ 
ção  entre  variáveis,  quando  mais  de  uma  variável  indepen¬ 
dente  está  envolvida. 

Agora  discutimos  um  meio  para  criar  novas  variáveis 
para  modelar  explicitamente  as  componentes  curvilíneas 
da  relação  e  lidar  com  cada  limitação  inerente  às  transfor¬ 
mações  de  dados. 

Especificação  de  um  efeito  curvilíneo.  Transformações 
de  potências  de  uma  variável  independente  que  acrescen¬ 
tam  uma  componente  não-linear  para  cada  potência  adi¬ 
cional  da  variável  independente  são  conhecidas  como  po¬ 
linómios.  A  potência  de  1  (^^)  representa  a  componente 
linear  e  é  a  forma  que  discutimos  até  agora  neste  capítulo. 
A  potência  de  2,  a  variável  ao  quadrado  (X^),  representa  a 
componente  quadrática.  Em  termos  gráficos,  represen¬ 
ta  o  primeiro  ponto  de  inflexão.  Uma  componente  cúbica, 
representada  pela  variável  ao  cubo  (^^),  acrescenta  um 
segundo  ponto  de  inflexão.  Com  essas  variáveis  e  mesmo 
potências  superiores,  podemos  acomodar  relações  mais 
complexas  do  que  é  possível  apenas  com  transformações. 
Por  exemplo,  em  um  modelo  de  regressão  simples,  um 
modelo  curvilíneo  com  um  ponto  de  inflexão  pode  ser  ex¬ 
presso  pela  equação 

Y=bo+b^Xi  +  b^X^ 

onde 

hjj  =  intercepto 
bjXj  =  efeito  linear  de 

=  efeito  curvilíneo  de  X_^ 

Apesar  de  poder  ser  acrescentado  qualquer  número 
de  componentes  não-lineares,  o  termo  cúbico  geralmente 
é  a  maior  potência  usada.  Polinómios  multivariados  são 
criados  quando  a  equação  de  regressão  contém  duas  ou 
mais  variáveis  independentes.  Seguimos  o  mesmo  proce¬ 
dimento  para  criar  os  termos  polinomiais  como  antes,  mas 
também  devemos  criar  um  termo  adicional,  o  termo  de  in¬ 
teração  (XjAj),  que  é  necessário  para  cada  combinação  de 
variável  para  representar  completamente  os  efeitos  mul¬ 
tivariados.  Em  termos  gráficos,  um  polinómio  multivaria- 
do  de  duas  variáveis  é  retratado  por  uma  superfície  com 
um  pico  ou  vale.  Para  os  polinómios  de  ordem  superior, 
a  melhor  forma  de  interpretação  é  obtida  pelo  gráfico  da 
superfície  a  partir  dos  valores  previstos. 

Interpretação  de  um  efeito  curvilíneo.  Da  mesma  forma 
que  ocorre  com  cada  nova  variável  incluída  na  equação  de 
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Grupo  3 

Grupo  2 
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X 

Equações  de  regressão  com  variáveis  dicotômicas  (D,  e  D^,) 

Especificada 

Y -  a  +  b-fX  +  b^D^  +  b^D^ 

Estimada 

Geral 

/=2  +  1,2X+2Di-3D2 

Grupo  Específico 

Grupo  1  (D.|  =  1,  Dj  =  0) 

/=2-r1,2X+2(1) 

Grupo  2  (D^  =  0,  Dj  =  1) 

V'=2-r1,2X  -3(1) 

Grupo  3  (D.|  =  0,  Dj  =  0) 

/=2-r1,2X 

FIGURA  4-3  Incorporação  de  variáveis  não-métricas  via  variáveis  dicotômicas. 


regressão,  podemos  também  fazer  um  teste  estatístico  di¬ 
reto  das  componentes  não-lineares,  o  qual  não  é  possível 
com  transformações  de  dados.  No  entanto,  multicolinea- 
ridade  pode  criar  problemas  na  avaliação  da  significância 
estatística  dos  coeficientes  individuais  na  medida  em  que 
o  pesquisador  deveria  avaliar  efeitos  incrementais  como 
uma  medida  de  qualquer  termo  polinomial  em  um  pro¬ 
cesso  de  três  passos: 

1.  Estimar  a  equação  de  regressão  original. 

2.  Estimar  a  relação  curvilínea  (equação  original  mais  o  termo 
polinomial). 

3.  Avaliar  a  mudança  em  R^.  Se  for  estatisticamente  significan- 
te,  então  um  efeito  curvilíneo  significante  está  presente.  A 
atenção  está  no  efeito  incremental,  e  não  na  significância  de 
variáveis  individuais. 

Três  relações  (duas  não-lineares  e  uma  linear)  são 
exibidas  na  Figura  4-4.  Para  fins  de  interpretação,  o  ter¬ 
mo  quadrático  positivo  indica  uma  curva  em  forma  de  U, 
enquanto  um  coeficiente  negativo  indica  uma  curva  em 
em  forma  de  n.  A  utilização  de  um  termo  cúbico  pode 


representar  curvas  no  formato  de  um  S  ou  uma  curva  de 
crescimento  muito  facilmente,  mas  geralmente  é  melhor 
representar  graficamente  os  valores  para  interpretar  cor¬ 
retamente  a  forma  real. 

Quantos  termos  devem  ser  acrescentados?  A  prática  co¬ 
mum  ê  começar  com  a  componente  linear  e  então  acrescen¬ 
tar  seqüencialmente  polinómios  de  ordem  superior  até  que 
a  não-significãncia  seja  alcançada.  O  uso  de  polinómios, 
contudo,  também  apresenta  problemas  em  potencial.  Pri¬ 
meiro,  cada  termo  adicional  exige  um  grau  de  liberdade,  o 
que  pode  ser  particularmente  restritivo  em  tamanhos  pe¬ 
quenos  de  amostras.  Essa  limitação  não  ocorre  com  trans¬ 
formações  de  dados.  Além  disso,  a  multicolinearidade  é 
introduzida  pelos  termos  adicionais  e  torna  o  teste  de  sig¬ 
nificância  estatística  dos  termos  polinomiais  inadequado. 
Em  vez  disso,  o  pesquisador  deve  comparar  os  valores 
do  modelo  com  termos  lineares  com  o  da  equação  com 
os  termos  polinomiais.  Testar  a  significância  estatística  do 
R^  incremental  é  o  modo  adequado  de  avaliar  o  impacto 
dos  polinómios. 
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FIGURA  4-4  Representação  polinomial  de  relações  não-lineares. 


Representação  de  efeitos  de  interação  ou  moderadores 

As  relações  não-lineares  discutidas  anteriormente  exigem 
a  criação  de  uma  variável  adicional  (p.ex.,  o  termo  qua¬ 
drado)  para  representar  a  variação  do  coeficiente  angular 
da  relação  ao  longo  do  intervalo  da  variável  independen¬ 
te.  Essa  representação  se  concentra  sobre  a  relação  entre 
uma  única  variável  independente  e  a  variável  dependente. 
Entretanto,  o  que  acontece  se  uma  relação  variável  inde¬ 
pendente-dependente  é  afetada  por  uma  outra  variável 
independente?  Essa  situação  é  chamada  de  efeito  mode¬ 
rador,  o  qual  ocorre  quando  a  variável  moderadora,  uma 
segunda  variável  independente,  muda  a  forma  da  relação 
entre  uma  outra  variável  independente  e  a  dependente. 
Isso  é  também  conhecido  como  um  efeito  de  interação  e  é 
semelhante  ao  termo  de  interação  encontrado  em  análise 
de  variância  e  análise  multivariada  de  variância  (ver  Capí¬ 
tulo  6  para  mais  detalhes  sobre  termos  de  interação). 

Exemplos  de  efeitos  moderadores.  O  efeito  moderador 
mais  comum  empregado  em  regressão  múltipla  é  o  quase 
moderador  ou  moderador  bilinear,  no  qual  o  coeficiente 
angular  da  relação  de  uma  variável  independente  (Xf) 
muda  ao  longo  de  valores  da  variável  moderadora  (Xj) 
[7,14]. 


Em  nosso  exemplo  anterior  de  uso  de  cartões  de  crédito, 
considere  que  a  renda  familiar  {X2)  foi  percebida  como 
um  moderador  positivo  da  relação  entre  tamanho  da 
família  (Aj)  e  uso  de  cartões  de  crédito  (Y).  Isso  signi¬ 
fica  que  a  variação  esperada  no  uso  de  cartões  de  cré¬ 
dito  baseada  em  tamanho  da  família  (hj,  o  coeficiente 
de  regressão  para  Xf)  poderia  ser  menor  para  famílias 
com  rendas  menores,  e  maior  para  famílias  com  rendas 
maiores.  Sem  o  efeito  moderador,  consideramos  que  o 


tamanho  da  família  tinha  um  efeito  constante  sobre  o 
número  de  cartões  de  crédito  usados,  mas  o  termo  de 
interação  nos  diz  que  essa  relação  muda,  dependendo  do 
nível  de  renda  familiar.  Observe  que  isso  não  significa 
necessariamente  que  os  efeitos  do  tamanho  da  família 
ou  da  renda  familiar  são  por  si  mesmos  sem  importância, 
mas  que  o  termo  de  interação  complementa  sua  explica¬ 
ção  do  uso  de  cartões  de  crédito. 


Adição  do  efeito  moderador.  O  efeito  moderador  é  re¬ 
presentado  em  regressão  múltipla  por  um  termo  muito 
semelhante  aos  polinómios  descritos  anteriormente  para 
representar  efeitos  não-lineares.  O  termo  moderador  é 
uma  variável  composta  formada  pela  multiplicação  de  X^ 
pelo  moderador  X2,  o  qual  entra  na  equação  de  regres¬ 
são.  Na  verdade,  o  termo  não-linear  pode  ser  visto  como 
uma  forma  de  interação,  onde  a  variável  independente 
“modera”  a  si  própria  e,  portanto,  o  termo  quadrado 
(XfXf  A  relação  moderada  é  representada  como 

Y=ba  +  b^X^  +  b^X^  +  b^X^X^ 

onde 

=  intercepto 
=  efeito  linear  de 

b  X  =  efeito  linear  de  X, 

22  2 

bjXjXj  =  efeito  moderador  deX^  sobre  X^ 

Por  causa  da  multicolinearidade  entre  as  variáveis  an¬ 
tigas  e  as  novas,  uma  abordagem  semelhante  para  testar 
a  significância  de  efeitos  polinomiais  (não-lineares)  é  em¬ 
pregada.  Para  determinar  se  o  efeito  moderador  é  signifi- 
cante,  o  pesquisador  segue  um  processo  de  três  passos: 
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1.  Estimar  a  equação  original  (não-moderada). 

2.  Estimar  a  relação  moderada  (equação  original  mais  a  variá¬ 
vel  moderadora). 

3.  Avaliar  a  mudança  em  R^:  se  for  estatisticamente  significan- 
te,  então  um  efeito  moderador  significante  se  faz  presente. 
Apenas  o  efeito  incremental  é  avaliado,  não  a  significância 
das  variáveis  individuais. 

Interpretação  dos  efeitos  moderadores.  A  interpre¬ 
tação  dos  coeficientes  de  regressão  muda  um  pouco  em 
relações  moderadas.  O  coeficiente  b^,  o  efeito  moderador, 
indica  a  variação  por  unidade  no  efeito  de  Xj  quando  X2 
varia.  Os  coeficientes  bj  e  ^2  agora  representam  os  efeitos 
de  Xj  e  X2,  respectivamente,  quando  a  outra  variável  in¬ 
dependente  é  zero.  Na  relação  não-moderada,  o  coefi¬ 
ciente  representa  o  efeito  de  X^  ao  longo  de  todos  os 
níveis  de  X2,  e  o  mesmo  ocorre  para  Ò2-  Assim,  em  re¬ 
gressão  não-moderada,  os  coeficientes  de  regressão  b^  e 
^2  têm  médias  calculadas  ao  longo  dos  níveis  das  outras 
variáveis  independentes,  enquanto  que,  em  uma  relação 
moderada,  eles  são  separados  das  outras  variáveis  inde¬ 
pendentes.  Para  determinar  o  efeito  total  de  uma  variável 
independente,  os  efeitos  separados  e  moderados  devem 
ser  combinados.  O  efeito  geral  de  X^p&xa  qualquer  valor 
de  X2pode  ser  determinado  substituindo-se  o  valor  X2na 
seguinte  equação: 


Por  exemplo,  considere  que  uma  regressão  moderada 
tenha  resultado  nos  seguintes  coeficientes:  hj  =  2,0  e 
=  0,5.  Se  o  valor  de  X2  varia  de  1  a  7,  o  pesquisador  pode 
calcular  o  efeito  total  de  X^  para  qualquer  valor  de  X2. 
Quando  2Í2  é  3,  o  efeito  total  de  X^  é  3,5  [2,0  -t  0,5(3)]. 
Quando  X2  aumenta  para  7,  o  efeito  total  de  X^  passa  a 
ser  5,5  [2,0 -t  0,5(7)]. 


Podemos  ver  o  efeito  moderador  em  funcionamento, 
fazendo  a  relação  de  X^com  a  variável  dependente  variar, 
dado  o  nível  de  Xj.  Excelentes  discussões  sobre  relações 
moderadas  em  regressão  múltipla  estão  disponíveis  em 
várias  fontes  [5,7,14]. 

Resumo 

A  criação  de  novas  variáveis  fornece  ao  pesquisador 
grande  flexibilidade  na  representação  de  uma  vasta  gama 
de  relações  em  modelos  de  regressão  (ver  Regras  Práti¬ 
cas  4-3).  Ainda,  muito  freqüentemente  o  desejo  de  um 
melhor  ajuste  de  modelo  conduz  à  inclusão  dessas  rela¬ 
ções  especiais  sem  apoio  teórico.  Nesses  casos,  o  pesqui¬ 
sador  está  correndo  um  risco  muito  maior  de  encontrar 
resultados  com  pouca  ou  nenhuma  generalização.  Em 
vez  disso,  ao  usar  essas  variáveis  adicionais,  ele  deve  ser 
guiado  pela  teoria  apoiada  por  análise  empírica.  Desse 
modo,  tanto  a  significância  prática  quanto  a  estatística 
podem  ser  alcançadas. 


Previsores  de  efeitos  fixos  versus  aleatórios 

Qs  exemplos  de  modelos  de  regressão  discutidos  até  aqui 
consideram  que  os  níveis  das  variáveis  independentes  são 
fixos.  Por  exemplo,  se  queremos  saber  o  impacto  sobre 
preferência  de  três  níveis  de  adoçante  em  um  refrigerante, 
produzimos  três  diferentes  tipos  de  bebida  e  pedimos  a  um 
grupo  de  pessoas  para  experimentar  cada  um.  Em  seguida 
podemos  prever  o  índice  de  preferência  sobre  cada  refrige¬ 
rante  usando  o  nível  de  adoçante  como  a  variável  indepen¬ 
dente.  Fixamos  o  nível  de  adoçante  e  estamos  interessados 
em  seus  efeitos  em  tais  níveis.  Não  consideramos  os  três  ní¬ 
veis  como  uma  amostra  aleatória  para  um  grande  número 
de  possíveis  níveis  de  adoçante. 

Uma  variável  independente  aleatória  é  uma  na  qual  os 
níveis  são  selecionados  ao  acaso.  Quando  se  usa  uma  va¬ 
riável  independente  aleatória,  o  interesse  não  é  apenas  nos 
níveis  examinados,  mas  na  maior  população  de  possíveis  ní¬ 
veis  de  variável  independente  a  partir  da  qual  selecionamos 
uma  amostra. 

A  maioria  dos  modelos  de  regressão  baseados  em  da¬ 
dos  de  pesquisa  são  modelos  de  efeitos  aleatórios.  Como 
ilustração,  um  levantamento  foi  conduzido  para  auxiliar  na 
avaliação  da  relação  entre  idade  do  respondente  e  freqüên- 
cia  de  visitas  a  médicos.  A  variável  independente  “idade  do 
respondente”  foi  aleatoriamente  escolhida  a  partir  da  popu¬ 
lação,  e  a  inferência  relativa  à  população  é  de  preocupação, 
e  não  apenas  conhecimento  dos  indivíduos  na  amostra. 

Qs  procedimentos  de  estimação  para  modelos  usando 
ambos  os  tipos  de  variáveis  independentes  são  os  mesmos 
exceto  pelos  termos  de  erro.  Nos  modelos  de  efeitos  alea¬ 
tórios,  uma  porção  do  erro  aleatório  surge  da  amostragem 
das  variáveis  independentes.  No  entanto,  os  procedimentos 
estatísticos  baseados  no  modelo  fixado  são  bastante  robus¬ 
tos,  e  assim  usar  a  análise  estatística  como  se  você  estivesse 
lidando  com  um  modelo  fixo  (como  a  maioria  dos  pacotes 
de  análise  consideram)  pode  ainda  ser  apropriado  como 
uma  aproximação  razoável. 

-  REGRAS  PRÁTICAS  4-3  - 

Transformações  de  variáveis 

•  Variáveis  não-métricas  só  podem  ser  incluídas  em  uma 
análise  de  regressão  pela  criação  de  variáveis  dicotômicas. 

•  Variáveis  dicotômicas  só  podem  ser  interpretadas  em 
relação  a  sua  categoria  de  referência. 

•  Adicionar  um  termo  polinomial  extra  representa  outro 
ponto  de  inflexão  na  relação  curvilínea. 

•  Polinómios  quadráticos  e  cúbicos  são  geralmente 
suficientes  para  representar  a  maioria  das  relações 
curvilíneas. 

•  A  avaliação  da  significância  de  um  termo  polinomial 
ou  de  interação  se  consegue  com  a  avaliação  do 
incremental,  e  não  a  significância  de  coeficientes 
individuais,  devido  à  alta  multicolinearidade. 
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ESTÁGIO  3:  SUPOSIÇÕES  EM  ANÁLISE 
DE  REGRESSÁO  MÚLTIPLA 

Já  mostramos  como  que  melhoramentos  na  previsão  da 
variável  dependente  são  possíveis  acrescentando-se  variá¬ 
veis  independentes  e  mesmo  transformando-as  para  re¬ 
presentar  aspectos  da  relação  que  não  são  lineares.  Con¬ 
tudo,  para  isso,  devemos  fazer  várias  suposições  sobre  as 
relações  entre  as  variáveis  dependente  e  independentes 
que  afetam  o  procedimento  estatístico  (mínimos  quadra¬ 
dos)  usado  para  regressão  múltipla.  Nas  seções  a  seguir, 
discutimos  testes  para  as  suposições  e  ações  corretivas  a 
realizar  no  caso  de  ocorrerem  violações. 

A  questão  básica  é  se,  no  curso  do  cálculo  dos  coefi¬ 
cientes  de  regressão  e  de  previsão  da  variável  dependente, 
as  suposições  da  análise  de  regressão  são  atendidas.  Os  er¬ 
ros  na  previsão  são  um  resultado  de  uma  ausência  real  de 
uma  relação  entre  as  variáveis,  ou  eles  são  causados  por 
algumas  características  dos  dados  não  acomodadas  pelo 
modelo  de  regressão?  As  suposições  a  serem  examinadas 
estão  em  quatro  áreas: 

1.  Linearidade  do  fenômeno  medido 

2.  Variância  constante  dos  termos  de  erro 

3.  Independência  dos  termos  de  erro 

4.  Normalidade  da  distribuição  dos  termos  de  erro 

Avaliação  de  variáveis  individuais 
versus  a  variável  estatística 

Antes  de  abordarmos  as  suposições  individuais,  devemos 
primeiramente  entender  que  as  suposições  inerentes  à 
análise  de  regressão  múltipla  se  aplicam  às  variáveis  in¬ 
dividuais  (dependente  e  independentes)  e  à  relação  como 
um  todo.  O  Capítulo  2  examinou  os  métodos  disponíveis 
para  avaliar  as  suposições  para  variáveis  individuais.  Na 
regressão  múltipla,  uma  vez  que  a  variável  estatística  te¬ 
nha  sido  determinada,  ela  atua  coletivamente  na  previ¬ 
são  da  variável  dependente,  a  qual  necessita  de  avaliação 
das  suposições  não  apenas  para  variáveis  individuais,  mas 
também  para  a  variável  estatística  em  si.  Esta  seção  se  con¬ 
centra  no  exame  da  variável  estatística  e  da  sua  relação 
com  a  variável  dependente  para  atender  às  suposições 
da  regressão  múltipla.  Essas  análises,  na  verdade,  devem 
ser  executadas  depois  que  o  modelo  de  regressão  tenha 
sido  estimado  no  estágio  4.  Logo,  os  testes  das  suposições 
devem  ocorrer  não  apenas  nas  fases  iniciais  da  regressão, 
mas  também  depois  que  o  modelo  foi  estimado. 

Uma  questão  comum  é  colocada  por  muitos  pesquisa¬ 
dores:  por  que  examinar  as  variáveis  individuais  quando  po¬ 
demos  simplesmente  examinar  a  variável  estatística  e  evitar 
o  tempo  e  o  esforço  despendidos  na  avaliação  de  variáveis 
individuais?  A  resposta  se  apóia  na  compreensão  consegui¬ 
da  no  exame  de  variáveis  individuais  em  duas  áreas: 

•  A  violação  de  suposições  para  variáveis  individuais  fez  suas 
relações  serem  mal  representadas? 


•  Quais  são  as  fontes  e  ações  corretivas  para  qualquer  viola¬ 
ção  de  suposições  para  a  variável  estatística? 

Somente  com  um  detalhado  exame  das  variáveis  in¬ 
dividuais  o  pesquisador  será  capaz  de  abordar  essas  duas 
questões  importantes.  Se  apenas  a  variável  estatística 
for  avaliada,  então  o  pesquisador  não  apenas  terá  pouca 
idéia  de  como  corrigir  eventuais  problemas,  como,  talvez 
mais  importante  ainda,  não  saberá  quais  oportunidades 
foram  perdidas  para  melhores  representações  das  variá¬ 
veis  individuais  e,  em  última  instância,  da  variável  esta¬ 
tística. 

Métodos  de  diagnóstico 

A  principal  medida  de  erro  de  previsão  para  a  variável 
estatística  é  o  resíduo  -  a  diferença  entre  os  valores  ob¬ 
servados  e  previstos  para  a  variável  dependente.  Quan¬ 
do  se  examinam  resíduos,  recomenda-se  alguma  forma 
de  padronização,  pois  isso  torna  os  resíduos  diretamente 
comparáveis.  (Em  sua  forma  original,  valores  previstos 
maiores  naturalmente  têm  resíduos  maiores.)  A  forma 
mais  amplamente  usada  é  o  resíduo  estudantízado,  cujos 
valores  correspondem  a  valores  t.  Essa  correspondência 
torna  muito  fácil  avaliar  a  significância  estatística  de  resí¬ 
duos  particularmente  grandes. 

A  representação  gráfica  dos  resíduos  versus  as  variá¬ 
veis  independentes  ou  previstas  é  um  método  básico  para 
identificar  violações  de  suposições  para  a  relação  geral.  No 
entanto,  o  emprego  de  gráficos  de  resíduos  depende  de 
várias  considerações-chave: 

•  O  gráfico  de  resíduo  mais  comum  envolve  os  resíduos 
(q)  versus  os  valores  dependentes  previstos  (Y,).  Para 
um  modelo  de  regressão  simples,  os  resíduos  podem  ser 
representados  graficamente  em  relação  à  variável  depen¬ 
dente  ou  à  independente,  uma  vez  que  elas  estão  direta¬ 
mente  relacionadas.  No  entanto,  em  regressão  múltipla, 
apenas  os  valores  dependentes  previstos  representam  o 
efeito  total  da  variável  estatística  de  regressão.  Assim,  a 
menos  que  a  análise  de  resíduo  pretenda  se  concentrar 
em  apenas  uma  única  variável,  as  variáveis  dependentes 
previstas  são  usadas. 

•  Violações  de  cada  suposição  podem  ser  identificadas  por  pa¬ 
drões  específicos  dos  resíduos.  A  Figura  4-5  contém  vários 
gráficos  de  resíduos  que  tratam  das  suposições  básicas  dis¬ 
cutidas  nas  seções  a  seguir.  Um  gráfico  de  especial  interesse 
é  o  gráfico  nulo  (Figura  4-5a),  o  gráfico  de  resíduos  quando 
todas  as  suposições  são  atendidas.  O  gráfico  nulo  mostra  os 
resíduos  que  ocorrem  aleatoriamente,  com  dispersão  re¬ 
lativamente  igual  em  torno  de  zero  e  nenhuma  tendência 
forte  para  ser  maior  ou  menor  que  zero.  Do  mesmo  modo, 
nenhum  padrão  é  encontrado  para  valores  grandes  versus 
pequenos  da  variável  independente.  Os  demais  gráficos  de 
resíduos  serão  usados  para  ilustrar  métodos  para  exame  de 
violações  das  suposições  inerentes  à  análise  de  regressão. 
Nas  seções  a  seguir  examinamos  uma  série  de  testes  estatís¬ 
ticos  que  podem  complementar  o  exame  visual  dos  gráficos 
de  resíduos. 
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(a)  Gráfico  nulo 


(b)  Não-linearidade 


(c)  Heteroscedasticidade 


(g)  Histograma  normal  (h)  Não-linearidade  e  heteroscedasticidade 

FIGURA  4-5  Análise  gráfica  de  resíduos. 


Linearidade  do  fenômeno 

A  linearidade  da  relação  entre  variáveis  dependente  e  in¬ 
dependentes  representa  o  grau  em  que  a  variação  na  variá¬ 
vel  dependente  é  associada  com  a  variável  independente. 
O  coeficiente  de  regressão  é  constante  no  intervalo  de  va¬ 
lores  da  variável  independente.  O  conceito  de  correlação  é 
baseado  em  uma  relação  linear,  o  que  a  torna  uma  questão 
crucial  na  análise  de  regressão.  A  linearidade  de  qualquer 
relação  bivariada  é  facilmente  examinada  por  meio  de  grá¬ 
ficos  de  resíduos.  A  Figura  4-5b  mostra  um  padrão  típico 
de  resíduos  que  indicam  a  existência  de  uma  relação  não- 
linear  não  representada  no  presente  modelo.  Qualquer 
padrão  curvilíneo  consistente  nos  resíduos  indica  que  uma 
ação  corretiva  aumentará  a  precisão  preditiva  do  modelo, 
bem  como  a  validade  dos  coeficientes  estimados.  Ações 
corretivas  podem  assumir  uma  entre  três  formas: 


•  Transformações  de  dados  (p.ex.,  logaritmo,  raiz  quadrada 
etc.)  de  uma  ou  mais  variáveis  independentes  para  conse¬ 
guir  linearidade  são  discutidas  no  Capítulo  2  [10]. 

•  Inclusão  direta  de  relações  não-lineares  no  modelo  de  re¬ 
gressão,  como  através  da  criação  de  termos  polinomiais  dis¬ 
cutida  no  estágio  2. 

•  Uso  de  métodos  especializados,  como  a  regressão  não-linear 
especificamente  elaborada  para  acomodar  os  efeitos  curvi¬ 
líneos  de  variáveis  independentes  ou  relações  não-lineares 
mais  complexas. 

Identificação  de  variáveis  independentes  para  ação 

Como  determinamos  quais  variáveis  independentes  de¬ 
vem  ser  selecionadas  para  ação  corretiva?  Em  regressão 
múltipla  com  mais  de  uma  variável  independente,  um  exa¬ 
me  dos  resíduos  mostra  somente  os  efeitos  combinados 
de  todas  as  variáveis  independentes,  mas  não  podemos 
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examinar  qualquer  variável  independente  separadamente 
em  um  gráfico  de  resíduos.  Para  fazer  isso,  utilizamos  o 
que  chamamos  de  gráficos  de  regressão  parcial,  os  quais 
mostram  a  relação  de  uma  única  variável  independente 
com  a  dependente,  controlando  os  efeitos  das  demais  va¬ 
riáveis  independentes.  Como  tal,  o  gráfico  de  regressão 
parcial  retrata  a  relação  única  entre  a  variável  dependente 
e  cada  variável  independente.  Ele  difere  dos  gráficos  de 
resíduos  já  discutidos,  pois  a  reta  que  passa  pelo  centro 
dos  pontos,  que  era  horizontal  nos  gráficos  anteriores  (ver 
Figura  4-5),  agora  tem  inclinação  para  cima  ou  para  baixo, 
dependendo  de  o  coeficiente  de  regressão  para  aquela  va¬ 
riável  independente  ser  positivo  ou  negativo. 

O  exame  das  observações  em  torno  dessa  reta  é  feito 
exatamente  como  antes,  mas  agora  o  padrão  curvilíneo 
indica  uma  relação  não-linear  entre  uma  variável  inde¬ 
pendente  específica  e  a  variável  dependente.  Esse  método 
é  mais  útil  quando  diversas  variáveis  independentes  estão 
envolvidas,  já  que  podemos  dizer  quais  variáveis  especí¬ 
ficas  violam  a  suposição  de  linearidade  e  aplicar  as  ações 
corretivas  necessárias  apenas  a  elas.  Além  disso,  a  identi¬ 
ficação  de  observações  atípicas  ou  influentes  se  torna  mais 
fácil  com  base  em  uma  variável  independente  por  vez. 

Variância  constante  do  termo  de  erro 

A  presença  de  variâncias  desiguais  (heteroscedastícidade) 
é  uma  das  violações  mais  comuns  de  suposições.  O  diag¬ 
nóstico  é  feito  com  gráficos  de  resíduos  ou  testes  estatísti¬ 
cos  simples.  A  representação  gráfica  de  resíduos  (estudan- 
tizados)  versus  os  valores  dependentes  previstos  e  a  sua 
comparação  com  o  gráfico  nulo  (ver  Figura  4-5a)  mostra 
um  padrão  consistente  se  a  variância  não  for  constante. 
Talvez  o  padrão  mais  comum  seja  a  forma  triangular  em 
qualquer  direção  (Figura  4-5c).  Fim  padrão  em  forma  de 
diamante  (Figura  4-5d)  pode  ser  esperado  no  caso  de  per¬ 
centagens  nas  quais  se  espera  mais  variação  no  meio  do 
intervalo,  em  vez  das  bordas.  Muitas  vezes,  diversas  vio¬ 
lações  ocorrem  simultaneamente,  como  não-linearidade  e 
heteroscedastícidade  (Figura  4-5h).  Ações  corretivas  para 
uma  das  violações  freqüentemente  corrigem  problemas 
em  outras  áreas  também. 

Todo  programa  computacional  estatístico  dispõe  de 
testes  estatísticos  para  heteroscedasticidade.  Por  exem¬ 
plo,  SPSS  fornece  o  teste  Fevene  para  homogeneidade  de 
variância,  o  qual  mede  a  igualdade  de  variâncias  para  um 
par  de  variáveis.  Seu  uso  é  particularmente  recomendado 
porque  é  menos  afetado  por  desvios  da  normalidade,  ou¬ 
tro  problema  comum  em  regressão. 

Se  ocorrer  heteroscedasticidade,  duas  ações  corretivas 
estão  disponíveis.  Se  for  possível  atribuir  a  violação  a  uma 
única  variável  independente  através  da  análise  de  gráfi¬ 
cos  de  resíduos  discutida  anteriormente,  o  procedimento 
de  mínimos  quadrados  ponderados  (com  pesos)  poderá 
ser  empregado.  Não  obstante,  mais  diretas  e  mais  fáceis 


são  várias  transformações  de  estabilização  de  variância 
discutidas  no  Capítulo  2,  que  permitem  que  as  variáveis 
transformadas  exibam  homocedastícídade  (igualdade  de 
variância)  e  sejam  diretamente  usadas  em  nosso  modelo 
de  regressão. 

Independência  dos  termos  de  erro 

Assumimos  em  regressão  que  cada  valor  previsto  é  inde¬ 
pendente,  o  que  significa  que  o  valor  previsto  não  está  re¬ 
lacionado  com  qualquer  outra  previsão;  ou  seja,  eles  não 
são  seqüenciados  por  qualquer  variável.  Podemos  identi¬ 
ficar  melhor  tal  ocorrência  fazendo  o  gráfico  de  resíduos 
em  relação  a  qualquer  variável  seqüencial  possível.  Se  os 
resíduos  forem  independentes,  o  padrão  deverá  parecer 
aleatório  e  semelhante  ao  gráfico  nulo  de  resíduos.  As  vio¬ 
lações  serão  identificadas  por  um  padrão  consistente  nos 
resíduos.  A  Figura  4-5e  exibe  um  gráfico  de  resíduos  que 
mostra  uma  associação  entre  os  resíduos  e  o  tempo,  uma 
variável  seqüencial  comum.  Fim  outro  padrão  freqüente 
é  mostrado  na  Figura  4-5f.  Ele  ocorre  quando  as  condi¬ 
ções  básicas  do  modelo  mudam,  mas  não  estão  incluídas 
no  modelo.  Por  exemplo,  vendas  de  trajes  de  banho  são 
medidas  mensalmente  durante  12  meses,  com  duas  esta¬ 
ções  de  inverno  versus  uma  estação  de  verão,  ainda  que 
nenhum  indicador  sazonal  seja  estimado.  O  padrão  re¬ 
sidual  mostrará  resíduos  negativos  para  os  meses  de  in¬ 
verno  versus  resíduos  positivos  para  os  meses  de  verão. 
Transformações  de  dados,  como  as  primeiras  diferenças 
em  um  modelo  de  séries  temporais,  inclusão  de  variáveis 
indicadoras,  ou  modelos  de  regressão  especialmente  for¬ 
mulados,  podem  tratar  dessa  violação  se  ela  ocorrer. 

Normalidade  da  distribuição  dos  termos  de  erro 

Talvez  a  violação  de  suposição  mais  freqüentemente  en¬ 
contrada  seja  a  não-normalidade  das  variáveis  indepen¬ 
dentes  ou  dependente  ou  ambas  [13].  O  diagnóstico  mais 
simples  para  o  conjunto  de  variáveis  independentes  na 
equação  é  um  histograma  de  resíduos,  com  uma  verifica¬ 
ção  visual  para  uma  distribuição  que  se  aproxima  da  nor¬ 
mal  (ver  Figura  4-5g).  Apesar  de  atraente  por  sua  simpli¬ 
cidade,  esse  método  é  especialmente  difícil  em  amostras 
menores,  onde  a  distribuição  é  mal  formada.  Um  método 
melhor  é  o  uso  de  gráficos  de  probabilidade  normal.  Eles 
diferem  dos  gráficos  de  resíduos  no  sentido  de  que  os  re¬ 
síduos  padronizados  são  comparados  com  a  distribuição 
normal.  A  distribuição  normal  forma  uma  reta  diagonal, 
e  os  resíduos  graficamente  representados  são  comparados 
com  a  diagonal.  Se  uma  distribuição  for  normal,  a  reta  re¬ 
sidual  se  aproximará  da  diagonal.  O  mesmo  procedimento 
pode  comparar  as  variáveis  dependente  ou  independentes 
separadamente  com  a  distribuição  normal  [6].  O  Capítulo 
2  fornece  uma  discussão  mais  detalhada  sobre  a  interpre¬ 
tação  de  gráficos  de  probabilidade  normal. 
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Resumo 

A  análise  de  resíduos,  seja  com  gráficos  de  resíduos  ou 
testes  estatísticos,  fornece  um  conjunto  simples,  mas  po¬ 
deroso,  de  ferramentas  analíticas  para  o  exame  da  ade¬ 
quação  de  nosso  modelo  de  regressão.  No  entanto,  muito 
freqüentemente  essas  análises  não  são  feitas  e  as  violações 
de  suposições  são  mantidas  intactas.  Assim,  os  usuários 
dos  resultados  não  estão  cientes  das  imprecisões  poten¬ 
ciais  que  podem  estar  presentes,  as  quais  variam  de  testes 
inadequados  da  significância  de  coeficientes  (mostrando 
significância  onde  não  existe  ou  o  contrário)  até  previsões 
viesadas  e  imprecisas  da  variável  dependente.  Recomen¬ 
damos  muito  que  esses  métodos  sejam  aplicados  a  cada 
conjunto  de  dados  e  cada  modelo  de  regressão  (ver  Regras 
Práticas  4-4).  A  aplicação  das  ações  corretivas,  especial¬ 
mente  as  transformações  dos  dados,  aumenta  a  confiança 
nas  interpretações  e  previsões  da  regressão  múltipla. 


ESTÁGIO  4:  ESTIMAÇÃO  DO  MODELO 
DE  REGRESSÃO  E  AVALIAÇÃO  DO 
AJUSTE  GERAL  DO  MODELO 

Após  ter  especificado  os  objetivos  da  análise  de  regressão, 
selecionado  as  variáveis  dependente  e  independentes, 
abordado  as  questões  de  planejamento  da  pesquisa  e  ava¬ 
liado  se  as  variáveis  atendem  às  suposições  da  regressão, 
o  pesquisador  agora  está  pronto  para  estimar  o  modelo  de 
regressão  e  avaliar  a  precisão  preditiva  geral  das  variáveis 
independentes  (ver  Figura  4-6).  Neste  estágio,  o  pesquisa¬ 
dor  deve  cumprir  três  tarefas  básicas: 

1.  Selecionar  um  método  para  especificar  o  modelo  de  regres¬ 
são  a  ser  estimado. 

2.  Avaliar  a  significância  estatística  do  modelo  geral  na  previ¬ 
são  da  variável  dependente. 

3.  Determinar  se  alguma  das  observações  exerce  uma  influên¬ 
cia  indevida  nos  resultados. 


-  REGRAS  PRÁTICAS  4-4  - 

Avaliação  das  suposições  estatísticas 

•  Teste  de  suposições  deve  ser  feito  não  apenas  para  a 
variável  dependente  e  cada  variável  independente,  mas 
também  para  a  variável  estatística 

•  Análises  gráficas  (i.e.,  gráficos  de  regressão  parcial,  de 
resíduos  e  de  probabilidade  normal)  são  os  métodos 
mais  amplamente  usados  de  avaliação  de  suposições 
para  a  variável  estatística 

•  Ações  corretivas  para  problemas  encontrados 
na  variável  estatística  devem  ser  realizadas  pela 
modificação  de  uma  ou  mais  variáveis  independentes, 
como  descrito  no  Capítulo  2 


Seleção  de  uma  técnica  de  estimação 

Na  maioria  dos  casos  de  regressão  múltipla,  o  pesquisa¬ 
dor  tem  várias  possíveis  variáveis  independentes  que  po¬ 
dem  ser  escolhidas  para  inclusão  na  equação  de  regressão. 
Algumas  vezes,  o  conjunto  de  variáveis  independentes  é 
especificado  exatamente  e  o  modelo  de  regressão  é  essen¬ 
cialmente  usado  em  uma  abordagem  confirmatória.  Em 
outros  casos,  o  pesquisador  pode  usar  a  técnica  de  estima¬ 
ção  para  escolher  algumas  variáveis  em  um  conjunto  de 
variáveis  independentes  com  métodos  de  busca  seqüen- 
cial  ou  combinatorial.  Cada  um  é  planejado  para  ajudar 
o  pesquisador  a  encontrar  o  “melhor”  modelo  de  regres¬ 
são.  Essas  três  abordagens  para  especificar  o  modelo  de 
regressão  são  discutidas  a  seguir. 

Especificação  confirmatória 

A  abordagem  mais  simples,  mas  talvez  a  mais  exigente, 
para  especificar  o  modelo  de  regressão  é  empregar  uma 
perspectiva  confirmatória  quando  o  pesquisador  especi¬ 
fica  completamente  o  conjunto  de  variáveis  independen¬ 
tes  a  serem  incluídas.  Assim  como  na  comparação  com  as 
abordagens  específicas  a  serem  discutidas  a  seguir,  o  pes¬ 
quisador  tem  total  controle  sobre  a  seleção  de  variáveis. 
Ainda  que  a  especificação  confirmatória  seja  conceitual- 
mente  simples,  o  pesquisador  é  completamente  responsá¬ 
vel  pelas  comparações  entre  mais  variáveis  independentes 
e  maior  precisão  preditiva  versus  parcimônia  do  modelo  e 
explicação  concisa.  Particularmente  problemáticos  são  er¬ 
ros  de  especificação  de  omissão  ou  inclusão.  Orientações 
para  o  desenvolvimento  de  modelos  são  discutidas  nos 
Capítulos  1  e  10.  O  pesquisador  deve  evitar  ser  guiado  por 
informação  empírica  e  procurar  confiar  significativamente 
em  justificativa  teórica  para  uma  abordagem  verdadeira¬ 
mente  confirmatória. 

Métodos  de  busca  seqüencial 

Em  visível  contraste  com  o  método  anterior,  os  méto¬ 
dos  de  busca  seqüencial  têm  em  comum  a  abordagem 
geral  de  estimar  a  equação  de  regressão  considerando 
um  conjunto  de  variáveis  definidas  pelo  pesquisador  e 
então  seletivamente  acrescentar  ou  eliminar  variáveis 
até  que  alguma  medida  de  critério  geral  seja  alcançada. 
Essa  técnica  fornece  um  método  objetivo  para  selecio¬ 
nar  variáveis  que  maximiza  a  previsão  ao  mesmo  tempo 
que  emprega  o  menor  número  de  variáveis.  Dois  tipos 
de  abordagens  são:  (1)  estimação  stepwise  e  (2)  adição 
forward  e  eliminação  backward.  Em  cada  tratamento, 
as  variáveis  são  individualmente  avaliadas  quanto  à 
sua  contribuição  à  previsão  da  variável  dependente  e 
acrescentadas  ao  modelo  de  regressão  ou  eliminadas 
do  mesmo  com  base  em  sua  contribuição  relativa.  O 
procedimento  por  etapas  (stepwise)  é  discutido  e  então 
contrastado  com  os  procedimentos  de  adição  forward  e 
eliminação  backward. 
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Estágio  4 


Estágio  5 


Estágio  6 


FIGURA  4-6  Estágios  4-6  do  diagrama  de  decisão  da  regressão  múltipla. 
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FIGURA  4-7  Fluxograma  do  método  de  estimação  stepwise. 


Estimação  stepwise.  A  estimação  stepwise  talvez  seja 
a  abordagem  seqüencial  mais  comum  para  a  seleção  de 
variáveis.  Ela  permite  ao  pesquisador  examinar  a  con¬ 
tribuição  de  cada  variável  independente  para  o  modelo 
de  regressão.  Cada  variável  é  considerada  para  inclusão 
antes  do  desenvolvimento  da  equação.  A  variável  inde¬ 
pendente  com  a  maior  contribuição  é  acrescentada  em  um 
primeiro  momento.  Variáveis  independentes  são  então 
selecionadas  para  inclusão,  com  base  em  sua  contribuição 
incremental  sobre  as  variáveis  já  presentes  na  equação.  O 
procedimento  stepwise  é  ilustrado  na  Figura  4-7.  As  ques¬ 
tões  específicas  em  cada  estágio  são  as  seguintes: 

1.  Começar  com  o  modelo  de  regressão  simples  selecionando 

a  variável  independente  que  é  a  mais  fortemente  correlacio¬ 
nada  com  a  variável  dependente.  A  equação  seria  Y  =  + 

b,X,. 

2.  Examinar  os  coeficientes  de  correlação  parcial  para  en¬ 
contrar  uma  variável  independente  adicional  que  explique 
a  maior  parte  estatisticamente  significante  da  variância  não 


explicada  (erro)  remanescente  da  primeira  equação  de  re¬ 
gressão. 

3.  Recalcular  a  equação  de  regressão  usando  as  duas  variá¬ 
veis  independentes  e  examinar  o  valor  parcial  F  para  a 
variável  original  no  modelo  para  ver  se  esta  ainda  faz  uma 
contribuição  significante,  dada  a  presença  da  nova  variável 
independente.  Se  não  for  o  caso,  eliminar  a  variável.  Essa 
habilidade  de  eliminar  variáveis  já  no  modelo  diferencia  o 
modelo  stepwise  dos  modelos  de  adição /orvcurd/eliminação 
backward.  Se  a  variável  original  ainda  fizer  uma  contribui¬ 
ção  significante,  a  equação  será  Y  =  èg  +  ftjXj  +  h2^2- 

4.  Continuar  esse  procedimento  examinando  todas  as  variáveis 
independentes  não-presentes  no  modelo  para  determinar  se 
alguma  faria  uma  adição  estatisticamente  significante  para  a 
equação  corrente  e,  assim,  deveria  ser  incluída  em  uma  equa 
ção  revisada.  Se  uma  nova  variável  independente  é  incluída, 
examinar  todas  as  variáveis  independentes  previamente  no 
modelo  para  julgar  se  elas  devem  ser  mantidas. 

5.  Continuar  adicionando  variáveis  independentes  até  que  ne¬ 
nhuma  das  candidatas  remanescentes  para  inclusão  possa 
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contribuir  em  melhora  estatisticamente  significante  na  preci¬ 
são  preditiva.  Esse  ponto  acontece  quando  todos  os  coeficien¬ 
tes  de  regressão  parcial  remanescentes  são  não-significantes. 

Um  viés  potencial  no  procedimento  stepwise  resulta 
da  consideração  de  apenas  uma  variável  para  seleção  por 
vez.  Suponha  que  as  variáveis  Xje  ^4  explicassem  juntas 
uma  parte  significante  da  variância  (cada  uma,  dada  a 
presença  da  outra),  mas  nenhuma  fosse  significante  por  si 
mesma.  Nessa  situação,  nenhuma  seria  considerada  para 
o  modelo  final.  Além  disso,  como  é  discutido  adiante, 
multicolinearidade  entre  as  variáveis  independentes  pode 
afetar  substancialmente  todos  os  métodos  de  estimação 
seqüencial. 

Adição  forward  e  eliminação  backward.  Os  procedi¬ 
mentos  de  adição  forward  e  eliminação  backward  são 

processos  de  tentativa  e  erro  para  encontrar  as  melhores 
estimativas  de  regressão.  O  modelo  de  adição  forward  é 
semelhante  ao  procedimento  stepwise,  no  sentido  de  que 
ele  constrói  a  equação  de  regressão  começando  com  uma 
única  variável  independente,  enquanto  a  eliminação  ba¬ 
ckward  começa  com  uma  equação  de  regressão  incluindo 
todas  as  variáveis  independentes  e  então  elimina  variáveis 
independentes  que  não  contribuem  significativamente.  A 
principal  distinção  da  abordagem  stepwise  em  relação  aos 
procedimentos  de  adição  forward  e  eliminação  backward 
é  sua  habilidade  de  acrescentar  ou  eliminar  variáveis  em 
cada  estágio.  Uma  vez  que  uma  variável  é  acrescentada  ou 
eliminada  nos  esquemas  de  adição  forward  ou  elimina¬ 
ção  backward,  a  ação  não  pode  ser  revertida  em  um  está¬ 
gio  posterior.  Assim,  a  habilidade  do  método  stepwise  de 
acrescentar  e  eliminar  faz  dele  o  procedimento  preferido 
para  a  maioria  dos  pesquisadores. 

Advertências  sobre  os  métodos  de  busca  seqüencial.  Para 
muitos  pesquisadores,  os  métodos  de  busca  seqüencial 
parecem  a  solução  perfeita  para  o  dilema  encontrado  na 
abordagem  confirmatória  para  atingir  o  poder  preditivo 
máximo  com  apenas  as  variáveis  que  contribuem  de  ma¬ 
neira  estatisticamente  significante.  Entretanto,  na  seleção 
de  variáveis  para  inclusão  na  variável  estatística  de  regres¬ 
são,  três  aspectos  críticos  afetam  sensivelmente  a  equação 
de  regressão  resultante. 

1.  A  multicolinearidade  entre  variáveis  independentes  tem 
substancial  impacto  sobre  a  especificação  final  do  modelo. 
Examinemos  a  situação  com  duas  variáveis  independentes 
altamente  correlacionadas  que  têm  correlações  quase  iguais 
com  a  variável  dependente.  O  critério  para  inclusão  ou  eli¬ 
minação  nessas  abordagens  é  maximizar  o  poder  preditivo 
incremental  da  variável  adicional.  Se  uma  dessas  variáveis 
entrar  no  modelo  de  regressão,  será  muito  improvável  que 
a  outra  variável  também  entre,  pois  essas  variáveis  são  al¬ 
tamente  correlacionadas  e  existe  pouca  variância  individual 
para  cada  variável  separadamente  (ver  a  discussão  adiante 
sobre  multicolinearidade).  Por  essa  razão,  o  pesquisador 
deve  avaliar  os  efeitos  da  multicolinearidade  na  interpre¬ 
tação  do  modelo  examinando  não  apenas  a  equação  de  re¬ 


gressão  final,  mas  também  as  correlações  diretas  de  todas 
as  variáveis  independentes  potenciais.  Isso  ajuda  o  pesqui¬ 
sador  a  evitar  concluir  que  as  variáveis  independentes  que 
não  entram  no  modelo  não  têm  importância  quando,  na 
realidade,  elas  estão  altamente  relacionadas  com  a  variável 
dependente,  mas  também  correlacionadas  com  variáveis  já 
presentes  no  modelo.  Apesar  de  as  abordagens  de  busca 
seqüencial  maximizarem  a  habilidade  preditiva  do  modelo 
de  regressão,  o  pesquisador  deve  ser  muito  cuidadoso  ao 
usar  tais  métodos  para  estabelecer  o  impacto  de  variáveis 
independentes  sem  considerar  multicolinearidade  entre  va¬ 
riáveis  independentes. 

2.  Todos  os  métodos  de  busca  seqüencial  criam  uma  perda 
de  controle  para  o  pesquisador.  Ainda  que  o  pesquisador 
especifique  as  variáveis  a  serem  consideradas  para  a  variá¬ 
vel  estatística  de  regressão,  é  a  técnica  de  estimação,  inter¬ 
pretando  os  dados  empíricos,  que  especifica  o  modelo  de 
regressão  final.  Em  muitos  casos,  complicações  como  mul¬ 
ticolinearidade  podem  resultar  em  um  modelo  de  regressão 
final  que  atinge  os  mais  altos  níveis  de  precisão  preditiva, 
mas  que  tem  pouca  relevância  administrativa  em  termos  de 
variáveis  incluídas  e  assim  por  diante.  Porém,  em  tais  casos, 
que  recurso  tem  o  pesquisador?  A  habilidade  para  especifi¬ 
car  o  modelo  de  regressão  final  foi  dispensada  pelo  pesqui¬ 
sador.  O  uso  dessas  técnicas  de  estimação  deve  considerar 
uma  ponderação  entre  vantagens  encontradas  nas  mesmas 
versus  a  falta  de  controle  no  estabelecimento  do  modelo  fi¬ 
nal  de  regressão. 

3.  A  terceira  advertência  se  refere  principalmente  ao  proce¬ 
dimento  stepwise.  Nessa  abordagem,  testes  de  significância 
múltipla  são  executados  no  processo  de  estimação  do  mode¬ 
lo.  Para  garantir  que  a  taxa  de  erro  geral  em  todos  os  testes 
de  significância  seja  razoável,  o  pesquisador  deve  empregar 
bases  mais  conservadoras  (por  exemplo,  0,01)  ao  acrescen¬ 
tar  ou  eliminar  variáveis. 

Os  métodos  de  estimação  seqüencial  têm  se  tornado 
amplamente  usados  devido  a  sua  eficiência  em  selecionar 
o  subconjunto  de  variáveis  independentes  que  maximiza 
a  precisão  preditiva.  Com  esse  benefício  vem  o  potencial 
para  resultados  enganadores  na  explicação  onde  apenas 
uma  em  um  conjunto  de  variáveis  altamente  correlacio¬ 
nadas  entra  na  equação  e  ocorre  uma  perda  de  contro¬ 
le  na  especificação  do  modelo.  Esses  aspectos  potenciais 
não  sugerem  que  métodos  de  busca  seqüencial  devam  ser 
evitados,  mas  que  o  pesquisador  deve  perceber  os  prós  e 
contras  envolvidos  em  seu  uso. 

Abordagem  combinatória 

O  terceiro  tipo  básico  de  técnica  de  estimação  é  a  aborda¬ 
gem  combinatória,  que  é,  principalmente,  um  processo  de 
busca  generalizado  em  todas  as  possíveis  combinações  de 
variáveis  independentes.  O  procedimento  mais  conhecido 
é  a  regressão  em  todos  os  possíveis  subconjuntos,  a  qual 
é  exatamente  o  que  o  nome  sugere.  Todas  as  possíveis 
combinações  das  variáveis  independentes  são  examinadas 
e  o  conjunto  de  variáveis  mais  adequado  é  identificado. 
Por  exemplo,  um  modelo  com  10  variáveis  independentes 
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tem  1024  possíveis  regressões  (uma  equação  apenas  com 
a  constante,  10  equações  com  uma  única  variável  inde¬ 
pendente,  45  equações  com  todas  as  combinações  de  duas 
variáveis,  e  assim  por  diante).  Com  procedimentos  de 
estimação  computadorizados,  hoje  em  dia  esse  processo 
pode  ser  gerenciado  até  mesmo  para  grandes  problemas, 
identificando  a  melhor  equação  de  regressão  geral  para 
qualquer  número  de  medidas  de  ajuste  preditivo. 

O  uso  deste  método  tem  diminuído  devido  a  críticas 
quanto  (i)  à  sua  natureza  não-teórica  e  (ii)  à  falta  de  con¬ 
siderações  de  fatores  como  multicolinearidade,  a  identifi¬ 
cação  de  observações  atípicas  e  influentes,  e  a  capacidade 
de  interpretação  dos  resultados.  Quando  esses  aspectos 
são  considerados,  a  “melhor”  equação  pode  envolver  sé¬ 
rios  problemas  que  afetam  sua  adequação,  e  outro  modelo 
pode  ser  escolhido  em  última  instância.  No  entanto,  esta 
abordagem  pode  fornecer  uma  visão  sobre  o  número  de 
modelos  de  regressão  que  são  mais  ou  menos  equivalen¬ 
tes  em  poder  preditivo,  ainda  que  possuam  combinações 
bastante  diferentes  de  variáveis  independentes. 

Visão  geral  das  abordagens  de  seleção  de  modelos 

Se  um  método  confirmatório,  de  busca  seqüencial  ou 
combinatório  for  escolhido,  o  critério  mais  importante 
é  o  bom  conhecimento  do  pesquisador  sobre  o  contexto 
da  pesquisa  e  alguma  fundamentação  teórica  que  permi¬ 
ta  uma  perspectiva  objetiva  e  bem  informada  quanto  às 
variáveis  a  serem  incluídas  e  aos  sinais  e  magnitude  espe¬ 
rados  de  seus  coeficientes  (ver  Regras  Práticas  4-5).  Sem 

-  REGRAS  PRÁTICAS  4-5  - 

Técnicas  de  estimação 

•  Não  importa  qual  técnica  de  estimação  seja  escolhida, 
a  teoria  deve  ser  um  fator  orientador  na  avaliação  do 
modelo  final  de  regressão,  pois: 

•  Especificação  confirmatória,  o  único  método  que 
permite  teste  direto  de  um  modelo  pré-especificado, 
é  também  o  mais  complexo  sob  as  perspectivas 

de  erro  de  especificação,  parcimônia  de  modelo  e 
conquista  de  máxima  precisão  preditiva. 

•  Busca  seqüencial  (p.ex.,  stepwise),  embora  maximize 
a  precisão  preditiva,  representa  uma  abordagem 
completamente  “automatizada”  para  estimação  de 
modelo,  deixando  o  pesquisador  quase  sem  controle 
sobre  a  especificação  do  modelo  final. 

•  Estimação  combinatória,  embora  considere  todos 
os  modelos  possíveis,  ainda  remove  controle  do 
pesquisador  em  termos  da  especificação  do  modelo 
final,  ainda  que  o  pesquisador  possa  ver  o  conjunto 
de  modelos  mais  ou  menos  equivalentes  em  termos 
de  precisão  preditiva. 

•  Nenhum  método  específico  é  o  melhor,  e  a  estratégia 
prudente  é  empregar  uma  combinação  de  abordagens 
para  capitalizar  sobre  os  pontos  fortes  de  cada  um  a  fim 
de  refletir  a  base  teórica  da  questão  de  pesquisa. 


esse  conhecimento,  os  resultados  da  regressão  podem  ter 
elevada  precisão  preditiva  sem  qualquer  relevância  geren¬ 
cial  ou  teórica.  Cada  método  de  estimação  tem  vantagens 
e  desvantagens,  de  modo  que  nenhum  método  é  sempre 
preferido  em  detrimento  dos  outros.  Dessa  maneira,  o 
pesquisador  jamais  deve  confiar  totalmente  em  qualquer 
uma  dessas  abordagens  sem  compreender  como  as  im¬ 
plicações  do  método  de  estimação  se  relacionam  com  os 
objetivos  do  pesquisador  de  previsão  e  explicação  e  com 
a  fundamentação  teórica  para  a  pesquisa.  Muitas  vezes,  o 
uso  de  dois  ou  mais  métodos  combinados  pode  fornecer 
uma  perspectiva  mais  equilibrada  para  o  pesquisador,  no 
lugar  de  usar  apenas  uma  técnica  e  tentar  abordar  todas 
as  questões  que  afetam  os  resultados. 

Teste  se  a  variável  estatística  de  regressão 
satisfaz  as  suposições  de  regressão 

Com  as  variáveis  independentes  selecionadas  e  os  coefi¬ 
cientes  de  regressão  estimados,  o  pesquisador  agora  deve 
avaliar  se  o  modelo  estimado  atende  às  suposições  ineren¬ 
tes  à  regressão  múltipla.  Como  discutido  no  estágio  3,  as 
variáveis  individuais  devem  satisfazer  as  suposições  de  li¬ 
nearidade,  variância  constante,  independência  e  normali¬ 
dade.  Além  das  variáveis  individuais,  a  variável  estatística 
de  regressão  deve  igualmente  satisfazer  essas  suposições. 
Os  testes  diagnósticos  discutidos  no  estágio  3  podem  ser 
aplicados  para  avaliar  o  efeito  coletivo  da  variável  esta¬ 
tística  pelo  exame  dos  resíduos.  Se  violações  substanciais 
forem  encontradas,  o  pesquisador  deverá  tomar  medidas 
corretivas  sobre  uma  ou  mais  das  variáveis  independentes 
e  então  reestimar  o  modelo  de  regressão. 

Exame  da  signíficância  estatística 
de  nosso  modelo 

Se  tomássemos  amostras  aleatórias  repetidas  de  respon- 
dentes  e  estimássemos  uma  equação  de  regressão  para 
cada  amostra,  não  esperaríamos  obter,  a  cada  vez,  exata¬ 
mente  os  mesmos  valores  para  os  coeficientes  de  regres¬ 
são.  Nem  esperaríamos  o  mesmo  nível  geral  de  ajuste  de 
modelo.  Em  vez  disso,  uma  certa  variação  ao  acaso  devi¬ 
do  a  erros  amostrais  provocaria  diferenças  entre  muitas 
amostras.  Sob  a  ótica  do  pesquisador,  tomamos  apenas 
uma  amostra  e  baseamos  nosso  modelo  preditivo  nela. 
Com  apenas  essa  amostra,  precisamos  testar  a  hipótese  de 
que  nosso  modelo  de  regressão  pode  representar  a  popu¬ 
lação  e  não  apenas  a  amostra.  Esses  testes  estatísticos  têm 
duas  formas  básicas:  um  teste  da  variação  explicada  (coe¬ 
ficiente  de  determinação)  e  um  teste  para  cada  coeficiente 
de  regressão. 

Signíficância  do  modelo  geral:  teste 
do  coeficiente  de  determinação 

Para  testar  a  hipótese  de  que  a  quantia  de  variação  expli¬ 
cada  pelo  modelo  de  regressão  é  maior  que  a  previsão  de 
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referência  (ou  seja,  que  é  signiflcativamente  maior  que 
zero),  a  razão  F é  calculada  como: 

Soma  de  quadrados  .  SS 

T-  regressão  regressão 

Graus  de  liberdade  .  df 

RâZãO  F regressão  regressão 

Soma  de  quadrados^^^^^^^^, 

Graus  de  liberdade^^^^j^^j  ^/res.duai 

onde 

^/regressão  =  Número  de  coeficientes  estimados  (incluindo 
intercepto)  - 1 

^/residual  =  Tumanho  da  amostra  -  Número  de  coeficientes 
estimados  (incluindo  intercepto) 

Três  aspectos  importantes  sobre  essa  razão  devem  ser 
observados: 

1.  Cada  soma  de  quadrados  dividida  por  seus  graus  de  liberda¬ 
de  (df)  apropriados  resulta  em  uma  estimativa  da  variância. 
O  numerador  da  razão  F  é  a  variância  explicada  pelo  mo¬ 
delo  de  regressão,  enquanto  o  denominador  é  a  variância 
não-explicada. 

2.  Intuitivamente,  se  a  razão  da  variância  explicada  pela  va¬ 
riância  não  explicada  é  alta,  a  variável  estatística  de  regres¬ 
são  deve  ser  de  valor  significante  na  explicação  da  variável 
dependente.  Usando  a  distribuição  F,  podemos  fazer  um  tes¬ 
te  estatístico  para  determinar  se  a  proporção  é  diferente  de 
zero  (i.e.,  estatisticamente  significante).  Nos  casos  em  que  é 
estatisticamente  significante,  o  pesquisador  pode  confiar  que 
o  modelo  de  regressão  não  é  específico  apenas  para  a  amos¬ 
tra,  mas  significante  em  múltiplas  amostras  da  população. 

3.  Apesar  de  valores  maiores  resultarem  em  valores  F  maio¬ 
res,  o  pesquisador  deve  basear  qualquer  avaliação  de  signi- 
ficância  prática  separadamente  de  significância  estatística. 
Como  significância  estatística  é  realmente  uma  avaliação  do 
impacto  de  erro  amostrai,  o  pesquisador  deve  ser  cuidadoso 
e  não  assumir  que  resultados  estatisticamente  significantes 
são  sempre  significantes  na  prática.  Esse  cuidado  é  particular¬ 
mente  relevante  no  caso  de  grandes  amostras  nas  quais  mes¬ 
mo  pequenos  valores  (p.ex.,  5%  ou  10%)  podem  ser  esta¬ 
tisticamente  significantes,  mas  tais  níveis  de  explicação  não 
seriam  aceitáveis  para  posterior  ação  em  uma  base  prática. 


Em  nosso  exemplo  de  uso  de  cartões  de  crédito,  a  razão 
Epara  o  modelo  de  regressão  simples  é  (16,5/1)  /(5,50/6) 
=  18,0.  A  estatística  E  tabelada  de  1  com  6  graus  de  liber¬ 
dade  em  um  nível  de  significância  de  0,05  produz  o  valor 
5,99.  Como  a  razão  F  é  maior  que  o  valor  tabelado,  rejei¬ 
tamos  a  hipótese  de  que  a  redução  no  erro  que  obtivemos 
ao  usar  o  tamanho  da  família  para  prever  o  uso  de  cartões 
de  crédito  tenha  sido  ao  acaso.  Esse  resultado  significa 
que,  considerando  a  amostra  usada  para  estimação,  po¬ 
demos  explicar  a  variação  18  vezes  mais  do  que  quando 
usamos  a  média,  e  que  isso  não  tem  muita  probabilidade 
de  ocorrer  ao  acaso  (menos  que  5%  das  vezes).  Do  mes¬ 
mo  modo,  a  razão  F  para  o  modelo  de  regressão  múltipla 


com  duas  variáveis  independentes  é  (18,96/2)/(3,04/5)  = 
15,59.  O  modelo  de  regressão  múltipla  também  é  estatisti¬ 
camente  significante,  o  que  indica  que  a  variável  indepen¬ 
dente  adicional  foi  substancial  em  acrescentar  habilidade 
preditiva  ao  modelo  de  regressão. 


Ajuste  do  coeficiente  de  determinação 

Como  discutido  anteriormente  na  definição  de  graus  de 
liberdade,  a  adição  de  uma  variável  sempre  aumenta  o 
valor  Bj.  Esse  aumento  gera  então  uma  preocupação 
com  generalidade,  pois  pj  aumentará  mesmo  que  va¬ 
riáveis  preditoras  não-significantes  sejam  adicionadas. 
O  impacto  é  melhor  percebido  quando  o  tamanho  da 
amostra  é  próximo  ao  número  de  variáveis  preditoras 
(chama-se  de  superajuste  -  quando  o  número  de  graus 
de  liberdade  é  pequeno).  Com  este  impacto  minimizado 
quando  o  tamanho  da  amostra  excede  bastante  o  núme¬ 
ro  de  variáveis  independentes,  diversas  orientações  têm 
sido  propostas,  como  discutido  anteriormente  (p.ex.,  10 
a  15  observações  por  variável  independente  para  um  mí¬ 
nimo  de  5  observações  por  variável  independente).  No 
entanto,  o  que  se  faz  necessário,  é  uma  medida  mais  ob¬ 
jetiva  relacionando  o  nível  de  superajuste  ao  obtido 
pelo  modelo. 

Essa  medida  envolve  um  ajuste  com  base  no  número 
de  variáveis  independentes  relativamente  ao  tamanho  da 
amostra.  Dessa  maneira,  acrescentar  variáveis  não-sig- 
nificantes  apenas  para  aumentar  o  pode  ser  descon¬ 
tado  de  um  modo  sistemático.  Como  parte  de  todos  os 
programas  de  regressão,  um  coeficiente  ajustado  de  de¬ 
terminação  (E^  ajustado)  é  dado  junto  com  o  coeficiente 
de  determinação.  Interpretado  da  mesma  forma  que  o 
coeficiente  de  determinação  não-ajustado,  o  ajusta¬ 
do  se  torna  menor,  uma  vez  que  temos  menos  observa¬ 
ções  por  variável  independente.  O  valor  ajustado  é 
particularmente  útil  na  comparação  entre  equações  de 
regressão  que  envolvem  diferentes  números  de  variáveis 
independentes  ou  diferentes  tamanhos  de  amostra,  pois 
ele  dá  um  desconto  para  os  graus  de  liberdade  para  cada 
modelo. 


Em  nosso  exemplo  de  uso  de  cartões  de  crédito, 
para  o  modelo  de  regressão  simples  é  0,751,  e  o  R^ 
ajustado,  0,709.  Ao  acrescentarmos  a  segunda  variável 
independente,  R^  aumenta  para  0,861,  mas  o  Rj  ajus¬ 
tado  aumenta  para  apenas  0,806.  Quando  acrescenta¬ 
mos  a  terceira  variável,  Rj'  aumenta  para  apenas  0,872 
e  o  R^  ajustado  diminui  para  0,776.  Assim,  apesar  de 
percebermos  que  R^  sempre  aumenta  perante  o  acrés¬ 
cimo  de  variáveis,  a  queda  do  R^  ajustado  diante  da 
adição  da  terceira  variável  indica  um  superajuste  dos 
dados.  Quando  discutirmos  a  avaliação  da  significân- 
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cia  estatística  de  coeficientes  de  regressão  na  próxima 
seção,  perceberemos  que  a  terceira  variável  não  era 
estatisticamente  significante.  O  ajustado  não  ape¬ 
nas  reflete  superajuste,  mas  também  a  adição  de  variá¬ 
veis  que  não  contribuem  significativamente  à  precisão 
preditiva. 


Testes  de  significância  de  coeficientes  de  regressão 

O  teste  da  significância  estatística  para  os  coeficientes  esti¬ 
mados  em  análise  de  regressão  é  apropriado  e  necessário 
quando  a  análise  é  baseada  em  uma  amostra  da  população 
e  não  em  um  censo.  Quando  utiliza  uma  amostra,  o  pes¬ 
quisador  não  está  interessado  apenas  nos  coeficientes  de 
regressão  estimados  para  aquela  amostra,  mas  está  tam¬ 
bém  interessado  em  como  os  coeficientes  devem  variar  ao 
longo  de  repetidas  amostras. 

Estabelecimento  de  um  intervalo  de  confiança.  Teste 
de  significância  de  coeficientes  de  regressão  é  uma  esti¬ 
mativa  estatisticamente  fundamentada  na  probabilidade 
de  que  os  coeficientes  estimados  em  um  grande  número 
de  amostras  de  um  certo  tamanho  serão  de  fato  diferentes 
de  zero.  Para  julgar  isso,  um  intervalo  de  confiança  deve 
ser  estabelecido  em  torno  do  coeficiente  estimado.  Se  o 
intervalo  de  confiança  não  inclui  o  valor  nulo,  então  pode- 
se  dizer  que  a  diferença  entre  o  coeficiente  e  zero  é  esta¬ 
tisticamente  significante.  Para  tanto,  o  pesquisador  conta 
com  três  conceitos: 

•  Estabelecer  o  nível  de  significância  (alfa)  denota  a  chance 
que  o  pesquisador  deseja  arriscar  de  estar  errado  quanto  à 
diferença  do  coeficiente  em  relação  a  zero.  Um  valor  típi¬ 
co  é  0,05.  A  medida  que  o  pesquisador  quer  uma  chance 
menor  de  estar  errado  e  estabelece  um  nível  menor  de  sig¬ 
nificância  (p.ex.,  0,01  ou  0,001),  o  teste  estatístico  se  torna 
mais  exigente.  Aumentar  o  nível  de  significância  para  um 
valor  maior  (p.ex.,  0,10)  permite  uma  maior  chance  de  estar 
errado,  mas  também  faz  com  seja  mais  fácil  concluir  que  o 
coeficiente  seja  diferente  de  zero. 

•  Erro  de  amostragem  é  a  causa  para  variação  nos  coeficien¬ 
tes  de  regressão  estimados  para  cada  amostra  retirada  de 
uma  população.  Para  pequenas  amostras,  o  erro  amostrai 
é  maior  e  os  coeficientes  estimados  variam  mais  facilmente 
de  amostra  para  amostra.  A  medida  que  a  amostra  aumen¬ 
ta,  torna-se  mais  representativa  da  população  (ou  seja,  o 
erro  amostrai  diminui),  e  a  variação  nos  coeficientes  esti¬ 
mados  para  grandes  amostras  se  torna  menor.  Essa  rela¬ 
ção  permanece  verdadeira  até  que  a  análise  seja  estimada 
usando  a  população.  Neste  caso,  a  necessidade  para  teste 
de  significância  é  eliminada,  pois  a  amostra  é  igual  à  popu¬ 
lação  (i.e.,  sem  erro  amostrai)  e,  portanto,  perfeitamente 
representativa  dela. 


Para  ilustrar  essa  questão,  20  amostras  aleatórias  para 
quatro  tamanhos  de  amostras  (10,  25,  50  e  100  respon- 


dentes)  foram  tiradas  de  um  grande  banco  de  dados. 
Uma  regressão  simples  foi  realizada  para  cada  amostra, 
e  os  coeficientes  de  regressão  estimados  foram  regis¬ 
trados  na  Tabela  4-8.  Como  podemos  ver,  a  variação 
nos  coeficientes  estimados  é  a  maior  para  amostras  de 
10  respondentes,  variando  de  um  baixo  coeficiente  de 
2,20  até  um  alto  de  6,06.  Quando  o  tamanho  da  amos¬ 
tra  aumenta  para  25  e  50  respondentes,  o  erro  amostrai 
diminui  consideravelmente.  Por  fim,  as  amostras  de  100 
respondentes  têm  uma  amplitude  total  de  quase  metade 
da  obtida  nas  amostras  de  10  respondentes  (2,10  versus 
3,86).  A  partir  daí,  podemos  perceber  que  a  habilidade 
do  teste  estatístico  para  determinar  se  o  coeficiente  é 
realmente  maior*  que  zero  se  torna  mais  precisa  com  as 
amostras  maiores. 


•  O  erro  padrão  é  a  variação  esperada  dos  coeficientes  esti¬ 
mados  (tanto  os  coeficientes  constantes  quanto  os  de  regres¬ 
são)  devido  a  erro  de  amostragem.  O  erro  padrão  atua  como 
o  desvio  padrão  de  uma  variável  representando  a  dispersão 
esperada  dos  coeficientes  estimados  a  partir  de  amostras  re¬ 
petidas  deste  tamanho. 

Com  o  nível  de  significância  escolhido  e  o  erro  padrão 
calculado,  podemos  estabelecer  um  intervalo  de  confian¬ 
ça  para  um  coeficiente  de  regressão  com  base  no  erro  pa¬ 
drão,  assim  como  podemos  fazer  para  uma  média  baseada 
no  desvio  padrão.  Por  exemplo,  estabelecer  o  nível  de  sig¬ 
nificância  em  0,05  resultaria  em  um  intervalo  de  confiança 
de  ±  1,96  X  erro  padrão,  denotando  os  limites  externos 
que  contêm  95%  dos  coeficientes  estimados  de  amostras 
repetidas.  Com  o  intervalo  de  confiança  em  mãos,  o  pes¬ 
quisador  agora  deve  fazer  três  perguntas  sobre  a  signifi¬ 
cância  estatística  de  qualquer  coeficiente  de  regressão: 

1.  Foi  estabelecida  a  significância  estatística?  O  pesquisador  es¬ 
tabelece  o  nível  de  significância  do  qual  se  deriva  o  intervalo 
de  confiança  (p.ex.,  um  nível  de  significância  de  5%  para 
uma  grande  amostra  corresponde  ao  intervalo  de  confian¬ 
ça  de  ±  1,96  X  erro  padrão).  Um  coeficiente  é  considerado 
estatisticamente  significante  se  o  intervalo  de  confiança  não 
incluir  o  zero. 

2.  Qual  ê  o  papel  do  tamanho  da  amostra?  Se  a  amostra  é  pe¬ 
quena,  o  erro  amostrai  pode  fazer  com  que  o  erro  padrão 
seja  tão  grande  que  o  intervalo  de  confiança  inclua  o  zero. 
Contudo,  se  a  amostra  for  maior,  o  teste  tem  maior  precisão 
porque  a  variação  nos  coeficientes  se  torna  menor  (i.e.,  o 
erro  padrão  é  menor).  Amostras  maiores  não  garantem  que 
os  coeficientes  não  se  igualarão  a  zero,  mas  farão  com  que  o 
teste  seja  mais  preciso. 

3.  Foi  fornecida  significância  prática  além  da  significância  esta¬ 
tística?  Como  vimos  na  avaliação  da  significância  estatística 
do  valor  de  só  porque  um  coeficiente  é  estatisticamente 
significante,  não  é  garantido  que  também  seja  praticamente 
significante.  Certifique-se  de  avaliar  o  sinal  e  o  tamanho  de 


*  N.  de  R.  T.  A  frase  correta  seria  “...se  o  coeficiente  é  realmente  di¬ 
ferente  de  zero...”. 
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TABELA  4-8  Variação  amostrai  para  coeficientes  de  regressão  estimados 


Tamanho  da  amostra 

Amostra 

10 

25 

50 

100 

1 

2,58 

2,52 

2,97 

3,60 

2 

2,45 

2,81 

2,91 

3,70 

3 

2,20 

3,73 

3,58 

3,88 

4 

6,06 

5,64 

5,00 

4,20 

5 

2,59 

4,00 

4,08 

3,16 

6 

5,06 

3,08 

3,89 

3,68 

7 

4,68 

2,66 

3,07 

2,80 

8 

6,00 

4,12 

3,65 

4,58 

9 

3,91 

4,05 

4,62 

3,34 

10 

3,04 

3,04 

3,68 

3,32 

11 

3,74 

3,45 

4,04 

3,48 

12 

5,20 

4,19 

4,43 

3,23 

13 

5,82 

4,68 

5,20 

3,68 

14 

2,23 

3,77 

3,99 

4,30 

15 

5,17 

4,88 

4,76 

4,90 

16 

3,69 

3,09 

4,02 

3,75 

17 

3,17 

3,14 

2,91 

3,17 

18 

2,63 

3,55 

3,72 

3,44 

19 

3,49 

5,02 

5,85 

4,31 

20 

4,57 

3,61 

5,12 

4,21 

Mínimo 

2,20 

2,52 

2,91 

2,80 

Máximo 

6,06 

5,64 

5,85 

4,90 

Amplitude  total 

3,86 

3,12 

2,94 

2,10 

Desvio  padrão 

1,28 

0,85 

0,83 

0,54 

qualquer  coeficiente  significante  para  garantir  que  ele  aten¬ 
da  às  necessidades  de  pesquisa  da  análise. 

Teste  de  sígnificâncía  no  exemplo  de  regressão  simples.  O 

teste  da  significância  de  um  coeficiente  de  regressão  pode 
ser  ilustrado  usando  nosso  exemplo  de  cartão  de  crédito 
discutido  anteriormente.  Discutimos  primeiramente  quais 
hipóteses  são  realmente  testadas  para  um  modelo  de  re¬ 
gressão  simples,  e  então  examinamos  os  níveis  de  signifi¬ 
cância  para  coeficiente  e  constante. 

Entendimento  das  hipóteses  no  teste  dos  coeficientes 
de  regressão.  Um  modelo  de  regressão  simples  implica 
hipóteses  sobre  dois  parâmetros  estimados:  o  coeficiente 
constante  e  o  de  regressão. 


A  equação  de  regressão  para  uso  de  cartões  de  crédito 
vista  anteriormente  é 

Y=b,  +  b,V, 
ou 

Y  =  2,87  +  0,971  (tamanho  da  família). 


Este  modelo  de  regressão  simples  requer  o  teste  de 
duas  hipóteses  para  cada  coeficiente  estimado  (o  valor 
constante  de  2,87  e  o  coeficiente  de  regressão  0,971).  Es¬ 
sas  hipóteses  (comumente  chamadas  de  hipótese  nula) 
podem  ser  formalmente  enunciadas  como: 

Hipótese  1.  O  valor  do  intercepto  ( termo  constan¬ 
te)  de  2,87  é  devido  a  erro  amostrai,  e  o  verdadeiro 
termo  constante  apropriado  para  a  população  é 
zero. 

Hipótese  2.  O  coeficiente  de  regressão  de  0,971  (indi¬ 
cando  que  um  aumento  de  uma  unidade  no  tamanho 
da  família  é  associado  com  um  aumento  no  número 
médio  de  cartões  de  crédito  usados  de  0,971 )  tam¬ 
bém  não  difere  significantemente  de  zero. 

Com  essas  hipóteses,  estamos  testando  se  o  termo 
constante  e  o  coeficiente  de  regressão  têm  um  impacto 
diferente  de  zero.  Se  descobrimos  que  eles  não  dife¬ 
rem  significativamente  de  zero,  consideramos  que  eles 
não  devem  ser  usados  para  fins  de  previsão  ou  expli¬ 
cação. 
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Avaliação  do  nível  de  significância.  O  teste  apro¬ 
priado  é  o  teste  t,  o  qual  normalmente  está  disponível 
em  programas  computacionais  de  análise  de  regressão. 
O  valor  t  de  um  coeficiente  é  o  coeficiente  dividido  pelo 
erro  padrão.  Assim,  o  valor  t  representa  o  número  de 
erros  padrão  que  o  coeficiente  se  distancia  de  zero.  Por 
exemplo,  um  coeficiente  de  regressão  de  2,5  com  um 
erro  padrão  de  0,5  teria  um  valor  t  de  5,0  (ou  seja,  o 
coeficiente  de  regressão  está  a  5  erros  padrão  de  zero). 
Para  determinar  se  o  coeficiente  é  significantemente  di¬ 
ferente  de  zero,  o  valor  t  computado  é  comparado  ao 
valor  de  tabela  para  o  tamanho  da  amostra  e  o  nível  de 
confiança  selecionado.  Se  nosso  valor  for  maior  que  o 
de  tabela,  poderemos  estar  confiantes  (em  nosso  sele¬ 
cionado  nível  de  confiança)  de  que  o  coeficiente  tem  um 
efeito  estatisticamente  significante  na  variável  estatísti¬ 
ca  de  regressão. 

A  maioria  dos  programas  de  computador  calcula  o  ní¬ 
vel  de  significância  para  o  valor  t  de  cada  coeficiente  de 
regressão,  mostrando  o  nível  de  significância  no  qual  o 
intervalo  de  confiança  incluiria  zero.  O  pesquisador  pode 
então  avaliar  se  esse  nível  atende  o  que  se  deseja  para  sig¬ 
nificância.  Por  exemplo,  se  a  significância  estatística  do 
coeficiente  é  0,02,  então  diríamos  que  é  significante  no  ní¬ 
vel  0,05  (pois  é  menos  que  0,05),  mas  não  significante  no 
nível  0,01. 


Usando  o  teste  t  para  o  exemplo  de  regressão  simples, 
podemos  avaliar  se  o  coeficiente  constante  ou  de  regres¬ 
são  é  significativamente  diferente  de  zero. 

•  De  um  ponto  de  vista  prático,  o  teste  de  significância 
do  termo  constante  é  necessário  apenas  quando  usado 
para  valor  explanatório.  Se  for  conceitualmente 
impossível  para  observações  existirem  com  todas  as 
variáveis  independentes  medidas  no  zero,  o  termo 
constante  estará  fora  dos  dados  e  atuará  somente  para 
posicionar  o  modelo.  Neste  exemplo,  o  intercepto  não 
tem  valor  explanatório,  pois  em  nenhum  caso  acontece 
de  todas  as  variáveis  independentes  terem  valores 
nulos  (p.ex.,  tamanho  da  família  não  pode  ser  zero). 
Assim,  significância  estatística  não  é  um  problema  na 
interpretação. 

•  Se  o  coeficiente  de  regressão  ocorrer  apenas  por  causa 
do  erro  amostrai  (i.e.,  zero  aparece  dentro  do  intervalo 
de  confiança),  concluiríamos  que  o  tamanho  da  família 
não  tem  impacto  generalizável  sobre  o  número  de 
cartões  de  crédito  usados  além  dessa  amostra.  Observe 
que  esse  não  é  um  teste  para  qualquer  valor  exato  do 
coeficiente,  mas  para  saber  se  ele  tem  algum  valor 
generalizável  além  da  amostra. 

Em  nosso  exemplo,  o  erro  padrão  de  tamanho  de 
família  no  modelo  de  regressão  simples  é  0,229.  O 


valor  calculado  t  é  4,24  (calculado  como  0,971/0,229), 
o  qual  tem  uma  probabilidade  de  0,005.  Se  estamos 
usando  um  nível  de  significância  de  0,05,  então  o 
coeficiente  é  significativamente  diferente  de  zero. 

Se  interpretamos  diretamente  o  valor  de  0,005,  isso 
significa  que  podemos  estar  certos  com  um  grau 
elevado  de  certeza  (99,5%)  de  que  o  coeficiente  é 
diferente  de  zero  e  portanto  deve  ser  incluído  na 
equação  de  regressão. 


O  pesquisador  deve  lembrar  que  o  teste  estatístico  dos 
coeficientes  de  regressão  e  constante  é  para  garantir  -  em 
todas  as  possíveis  amostras  que  podemos  obter  -  que  os 
parâmetros  estimados  sejam  diferentes  de  zero  dentro  de 
um  nível  de  erro  aceitável. 

Resumo 

Os  testes  de  significância  de  coeficientes  de  regressão 
fornecem  ao  pesquisador  uma  avaliação  empírica  de  seu 
“verdadeiro”  impacto.  Apesar  de  este  não  ser  um  teste 
de  validade,  ele  determina  se  os  impactos  representados 
pelos  coeficientes  são  generalizáveis  a  outras  amostras 
dessa  população.  Uma  observação  importante  referente  à 
variação  em  coeficientes  de  regressão  é  que  muitas  vezes 
os  pesquisadores  esquecem  que  os  coeficientes  estimados 
em  sua  análise  de  regressão  são  específicos  da  amostra 
usada  na  estimação.  Eles  são  as  melhores  estimativas  para 
aquela  amostra  de  observações,  mas,  como  os  resultados 
anteriores  mostram,  os  coeficientes  podem  variar  muito 
de  uma  amostra  para  outra.  Essa  variação  potencial  apon¬ 
ta  para  a  necessidade  de  esforços  canalizados  para  validar 
qualquer  análise  de  regressão  em  amostra(s)  diferente(s). 
Fazendo  isso,  o  pesquisador  deve  esperar  que  os  coefi¬ 
cientes  variem,  mas  a  meta  é  demonstrar  que  a  relação 
geralmente  vale  em  outras  amostras,  de  forma  que  os 
resultados  podem  ser  considerados  generalizáveis  para 
qualquer  amostra  da  população. 

Identificação  de  observações  influentes 

Até  agora,  nos  concentramos  em  identificar  padrões  ge¬ 
rais  no  conjunto  inteiro  de  observações.  Aqui,  desviamos 
nossa  atenção  para  observações  individuais,  com  o  objeti¬ 
vo  de  encontrar  as  observações  que 

•  estão  fora  dos  padrões  gerais  do  conjunto  de  dados,  ou 

•  que  influenciam  fortemente  os  resultados  de  regressão. 

Essas  observações  não  são  necessariamente  “ruins”, 
no  sentido  de  que  devam  ser  eliminadas.  Em  muitos  casos 
elas  representam  os  elementos  distintivos  do  conjunto  de 
dados.  No  entanto,  devemos  primeiramente  identificá-las 
e  avaliar  seu  impacto  antes  de  seguir  adiante.  Esta  seção 
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introduz  o  conceito  de  observações  influentes  e  seu  im¬ 
pacto  potencial  sobre  os  resultados  de  regressão.  Uma 
discussão  mais  detalhada  dos  procedimentos  de  identifi¬ 
cação  de  observações  influentes  está  disponível  em  www. 
prenhall.com/hair  (em  inglês). 

Tipos  de  observações  influentes 
Observações  influentes  no  sentido  mais  amplo,  incluem 
todas  as  observações  que  têm  um  efeito  desproporcional 
sobre  os  resultados  da  regressão.  Os  três  tipos  básicos  são 
baseados  na  natureza  de  seu  impacto  sobre  os  resultados 
da  regressão: 

•  Observações  atípicas  são  aquelas  que  têm  grandes  valo¬ 
res  residuais  e  podem  ser  identificadas  apenas  em  relação 
a  um  modelo  específico  de  regressão.  As  observações  atí¬ 
picas  eram  tradicionalmente  a  única  forma  de  observação 
influente  considerada  em  modelos  de  regressão,  e  métodos 
de  regressão  especializados  (p.ex.,  regressão  robusta)  foram 
até  mesmo  desenvolvidos  para  lidar  especificamente  com 
o  impacto  das  observações  atípicas  sobre  os  resultados  de 
regressão  [1,12].  O  Capítulo  2  fornece  procedimentos  adi¬ 
cionais  para  identificar  observações  atípicas. 

•  Os  pontos  de  alavancagem  são  observações  diferentes  das 
demais,  com  base  em  seus  valores  para  variáveis  indepen¬ 
dentes.  Seu  impacto  é  particularmente  perceptível  nos  co¬ 
eficientes  estimados  para  uma  ou  mais  variáveis  indepen¬ 
dentes. 

•  Observações  influentes  são  a  categoria  mais  ampla,  incluin¬ 
do  todas  as  observações  que  têm  um  efeito  desproporcional 
sobre  os  resultados  de  regressão.  As  observações  influentes 
potencialmente  incluem  as  atípicas  e  os  pontos  de  alavanca¬ 
gem,  mas  podem  incluir  outras  observações  também.  Além 
disso,  nem  todas  as  observações  atípicas  ou  pontos  de  ala¬ 
vancagem  são  necessariamente  observações  influentes. 

Identiflcação  de  observações  influentes 

Observações  influentes  muitas  vezes  são  difíceis  de  iden¬ 
tificar  através  da  análise  tradicional  de  resíduos  quando 
se  procura  por  observações  atípicas.  Seus  padrões  de  resí¬ 
duos  passariam  não  detectados  porque  o  resíduo  para  os 
pontos  influentes  (a  distância  perpendicular  entre  o  pon¬ 
to  e  a  reta  de  regressão  estimada)  não  seria  tão  grande 
a  ponto  de  ser  classificado  como  uma  observação  atípica. 
Assim,  a  concentração  apenas  em  grandes  resíduos  igno¬ 
raria  em  geral  essas  observações  influentes. 

A  Figura  4-8  ilustra  diversas  formas  de  observações  in¬ 
fluentes  e  seu  correspondente  padrão  de  resíduos: 

•  Reforço:  Na  Figura  4-8a,  o  ponto  influente  é  um  “bom” 
ponto,  reforçando  o  padrão  geral  dos  dados  e  baixando  o 
erro  padrão  da  previsão  e  dos  coeficientes.  É  um  ponto  de 
alavancagem,  mas  tem  um  valor  residual  pequeno  ou  nulo, 
uma  vez  que  é  bem  previsto  pelo  modelo  de  regressão. 

•  Conflito:  Pontos  influentes  podem  ter  um  efeito  contrário 
ao  padrão  geral  dos  demais  dados,  mas  ainda  ter  pequenos 
resíduos  (ver  Figuras  4-8b  e  4-8c).  Na  Figura  4-8b,  duas 
observações  influentes  explicam  quase  totalmente  a  rela¬ 


ção  observada,  pois  sem  elas  nenhum  padrão  real  emerge 
dos  outros  dados.  Elas  também  não  seriam  identificadas  se 
apenas  resíduos  grandes  fossem  considerados,  pois  seu  va¬ 
lor  residual  seria  pequeno.  Na  Figura  4-8c,  é  percebido  um 
efeito  ainda  mais  profundo,  no  qual  as  observações  influen¬ 
tes  agem  contrariamente  ao  padrão  geral  dos  demais  dados. 
Nesse  caso,  os  dados  “reais”  teriam  resíduos  maiores  do  que 
os  pontos  influentes  ruins. 

Múltiplos  pontos  influentes  também  podem  funcionar 
na  direção  do  mesmo  resultado.  Na  Figura  4-8e,  dois  pontos 
influentes  têm  a  mesma  posição  relativa,  tornando  a  detec¬ 
ção  algo  mais  difícil.  Na  Figura  4-8f,  observações  influentes 
têm  posições  muito  diferentes  mas  um  efeito  similar  sobre 
os  resultados. 

•  Desvio:  As  observações  influentes  podem  afetar  todos  os  re¬ 
sultados  de  uma  maneira  semelhante.  Um  exemplo  é  mos¬ 
trado  na  Figura  4-8d,  onde  o  coeficiente  angular  (inclinação) 
permanece  constante  mas  o  intercepto  é  deslocado.  Assim, 
a  relação  entre  todas  as  observações  permanece  inalterada, 
exceto  pelo  deslocamento  no  modelo  de  regressão.  Além 
disso,  ainda  que  todos  os  resíduos  sejam  afetados,  pouca 
coisa  na  distinção  de  características  entre  eles  ajudaria  no 
diagnóstico. 

Esses  exemplos  ilustram  que  devemos  desenvolver 
mais  métodos  para  identificar  esses  casos  influentes.  Os 
procedimentos  para  identificar  todos  os  tipos  de  observa¬ 
ções  influentes  estão  se  tornando  bem  difundidos,  entre¬ 
tanto,  são  ainda  menos  conhecidos  e  pouco  utilizados  em 
análise  de  regressão.  Todos  os  programas  de  computador 
fornecem  uma  análise  de  resíduos  onde  aqueles  com  gran¬ 
des  valores  (particularmente  resíduos  padronizados  maio¬ 
res  que  2,0)  podem  ser  facilmente  identificados.  Ademais, 
a  maioria  dos  programas  de  computador  agora  dispõe  de 
pelo  menos  algumas  das  medidas  diagnósticas  para  iden¬ 
tiflcação  de  pontos  de  alavancagem  e  outras  observações 
influentes. 

Ações  corretivas  para  observações  influentes 

A  necessidade  de  estudo  adicional  de  pontos  de  alavan¬ 
cagem  e  observações  influentes  é  destacada  quando  per¬ 
cebemos  a  extensão  substancial  em  que  a  generalização 
dos  resultados  e  as  conclusões  substanciais  (a  importância 
de  variáveis,  nível  de  ajuste  e  assim  por  diante)  podem 
ser  mudadas  por  apenas  um  pequeno  número  de  obser¬ 
vações.  Sejam  boas  (enfatizando  os  resultados)  ou  ruins 
(significativamente  mudando  os  resultados),  essas  obser¬ 
vações  devem  ser  identificadas  para  avaliar  seu  impacto. 
Observações  influentes,  atípicas  e  pontos  de  alavancagem 
são  baseados  em  uma  de  quatro  condições,  cada  qual  com 
um  curso  específico  de  ação  corretiva: 

1.  Um  erro  em  observações  ou  entrada  de  dados:  Remedie  cor¬ 
rigindo  os  dados  ou  eliminando  o  caso. 

2.  Uma  observação  válida,  mas  excepcional,  explicável  por  uma 
situação  extraordinária:  Remedie  com  eliminação  do  caso  a 
menos  que  variáveis  refletindo  a  situação  extraordinária  se¬ 
jam  incluídas  na  equação  de  regressão. 
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. Coeficiente  anguiar  da  regressão  sem  pontos  infiuentes  O  Observação  típica 

-  Coeficiente  anguiar  da  regressão  com  pontos  infiuentes  •  Observação  influente 

FIGURA  4-8  Padrões  de  observações  infiuentes. 

Fonte:  Adaptado  de  Beisley  et  ai.  e  Mason  e  Perreauit  [2,9]. 
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3.  Uma  observação  excepcional  sem  explicação  convincente: 
Apresenta  um  problema  especial,  pois  faltam  razões  para 
eliminar  o  caso;  porém  sua  inclusão  também  não  pode  ser 
justificada,  o  que  sugere  análises  com  e  sem  as  observações 
para  uma  completa  avaliação. 

4.  Uma  observação  comum  em  suas  características  individuais, 
mas  excepcional  em  sua  combinação  de  características:  Indi¬ 
ca  modificações  na  base  conceituai  do  modelo  de  regressão, 
e  deve  ser  mantida. 

Em  todas  as  situações,  o  pesquisador  é  encorajado  a 
eliminar  observações  verdadeiramente  excepcionais,  mas 
ainda  assim  evitar  a  eliminação  daquelas  que,  apesar  de 
diferentes,  são  representativas  da  população.  Lembre  que 
o  objetivo  é  garantir  o  modelo  mais  representativo  para  os 
dados  da  amostra,  de  modo  que  esta  melhor  reflita  a  po¬ 
pulação  da  qual  foi  tirada.  Essa  prática  vai  além  de  atingir 
o  melhor  ajuste  preditivo,  pois  algumas  observações  atípi¬ 
cas  podem  ser  casos  válidos  que  o  modelo  deveria  tentar 
prever,  ainda  que  precariamente.  O  pesquisador  também 
deve  estar  ciente  de  casos  nos  quais  os  resultados  seriam 
substancialmente  mudados  pela  eliminação  de  apenas 
uma  observação  ou  de  um  número  de  observações  muito 
pequeno. 


-  REGRAS  PRÁTICAS  4-6  - 

Signiíicâiicia  estatística  e 
observações  influentes 

Sempre  garanta  significância  prática  quando  estiver 
usando  amostras  grandes,  pois  os  resultados  do  mo¬ 
delo  e  os  coeficientes  de  regressão  podem  ser  consi¬ 
derados  irrelevantes  mesmo  quando  são  estatistica¬ 
mente  significantes,  devido  ao  poder  estatístico  que 
surge  de  grandes  amostras. 

Use  o  ajustado  como  sua  medida  de  precisão  pre- 
ditiva  geral  do  modelo. 

Significância  estatística  é  exigida  para  que  uma  rela¬ 
ção  tenha  validade,  mas  significância  estatística  sem 
apoio  teórico  não  suporta  validade. 

Apesar  de  observações  atípicas  serem  facilmente 
identificáveis,  as  outras  formas  de  observações  in¬ 
fluentes  que  requerem  métodos  diagnósticos  mais 
especializados  poder  ser  igualmente  ou  mais  impac- 
tantes  sobre  os  resultados. 
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ESTÁGIO  5:  INTERPRETAÇÃO 
DA  VARIÁVEL  ESTATÍSTICA 
DE  REGRESSÃO 

A  próxima  tarefa  do  pesquisador  é  interpretar  a  variá¬ 
vel  estatística  de  regressão  pela  avaliação  dos  coeficien¬ 
tes  de  regressão  estimados  em  termos  de  sua  explicação 
da  variável  dependente.  O  pesquisador  deve  avaliar  não 
apenas  o  modelo  de  regressão  estimado,  mas  também  as 
variáveis  independentes  potenciais  que  foram  omitidas 
se  uma  abordagem  de  busca  seqüencial  ou  combinatória 
foi  empregada.  Nessas  abordagens,  a  multicolinearidade 
pode  afetar  substancialmente  as  variáveis  incluídas  por 
último  na  variável  estatística  de  regressão.  Assim,  além 
de  avaliar  os  coeficientes  estimados,  o  pesquisador  deve 
também  avaliar  o  impacto  potencial  de  variáveis  omitidas 
para  garantir  que  a  significância  gerencial  seja  avaliada 
juntamente  com  a  significância  estatística. 

Utilização  dos  coeficientes  de  regressão 

Os  coeficientes  de  regressão  estimados,  chamados  de  co¬ 
eficientes  b,  representam  ambos  os  tipos  de  relação  (po¬ 
sitiva  ou  negativa)  e  a  força  da  relação  entre  variáveis 
independentes  e  dependente  na  variável  estatística  de 
regressão.  O  sinal  do  coeficiente  denota  se  a  relação  é  po¬ 
sitiva  ou  negativa,  enquanto  o  valor  do  coeficiente  indica 
a  variação  no  valor  dependente  cada  vez  que  a  variável 
independente  muda  em  uma  unidade. 


Por  exemplo,  no  modelo  de  regressão  simples  para  uso 
de  cartões  de  crédito  com  tamanho  de  família  como  a 
única  variável  independente,  o  coeficiente  para  tamanho 
de  família  era  0,971.  Este  coeficiente  denota  uma  relação 
positiva  que  mostra  que  quando  uma  família  adiciona 
um  membro,  espera-se  que  o  uso  de  cartões  de  crédito 
aumente  em  quase  uma  unidade  (0,971).  Além  disso,  se 
o  tamanho  da  família  diminui  em  um  membro,  o  uso  de 
cartões  de  crédito  também  deve  diminuir  em  quase  uma 
unidade  (-0,971). 


Os  coeficientes  de  regressão  têm  duas  funções-chave 
para  atender  os  objetivos  de  previsão  e  explicação  para 
qualquer  análise  de  regressão. 

Previsão 

Previsão  é  um  elemento  integral  na  análise  de  regressão, 
tanto  no  processo  de  estimação  quanto  em  situações  de 
previsão.  Como  descrito  na  primeira  seção  do  capítulo, 
regressão  envolve  o  emprego  de  uma  variável  estatística 
(o  modelo  de  regressão)  para  estimar  um  único  valor  para 
a  variável  dependente.  Este  processo  é  usado  não  apenas 
para  calcular  os  valores  previstos  no  procedimento  de  es¬ 
timação,  mas  também  com  amostras  adicionais  utilizadas 
para  validação  ou  para  fins  de  previsão. 


Estimação.  Primeiro,  no  procedimento  de  estimação  de 
mínimos  quadrados  ordinários  (OLS)  usado  para  obter  a 
variável  estatística  de  regressão,  uma  previsão  da  variável 
dependente  é  feita  para  cada  observação  no  conjunto  de 
dados.  O  procedimento  de  estimação  estabelece  os  pe¬ 
sos  da  variável  estatística  de  regressão  para  minimizar  os 
resíduos  (p.ex.,  minimizando  as  diferenças  entre  valores 
previstos  e  reais  da  variável  dependente).  Não  importa 
quantas  variáveis  independentes  são  incluídas  no  mode¬ 
lo  de  regressão,  apenas  um  valor  previsto  é  calculado. 
Como  tal,  o  valor  previsto  representa  o  total  dos  efeitos 
do  modelo  de  regressão  e  permite  que  os  resíduos,  como 
anteriormente  discutido,  sejam  usados  extensivamente 
como  uma  medida  diagnóstica  para  o  modelo  de  regres¬ 
são  geral. 

Previsão.  Apesar  de  previsão  ser  um  elemento  integral 
no  processo  de  estimação,  os  benefícios  reais  de  previsão 
surgem  em  aplicações.  Um  modelo  de  regressão  é  usado 
nesses  casos  para  previsão  com  um  conjunto  de  observa¬ 
ções  não  usadas  na  estimação.  Por  exemplo,  considere 
que  um  gerente  desenvolveu  uma  equação  para  prever 
vendas  mensais  de  um  produto.  Após  validar  o  modelo,  o 
gerente  de  vendas  insere  os  valores  esperados  do  próximo 
mês  para  as  variáveis  independentes  e  calcula  um  valor  de 
vendas  esperadas. 


Um  exemplo  simples  de  uma  aplicação  de  previsão  pode 
ser  mostrado  usando  o  caso  de  uso  de  cartões  de  crédito. 
Considere  que  estamos  usando  a  seguinte  equação  de 
regressão  que  foi  desenvolvida  para  estimar  o  número 
de  cartões  de  crédito  (Y)  usados  por  uma  família: 

Y  =  0,286  -H  0,635  Ui  -r  0,200^2  -r  0,272y3 

Suponha  agora  que  temos  uma  família  com  as  se¬ 
guintes  características:  tamanho  da  família  (Yj)  de  duas 
pessoas,  renda  familiar  ( Yj)  de  22  ($22.000,00)  e  número 
de  automóveis  (Y3)  sendo  três.  Qual  seria  o  número  es¬ 
perado  de  cartões  de  crédito  para  tal  família? 

Substituímos  os  valores  para  Yj,  Yj  e  Y3  na  equação 
de  regressão  e  calculamos  o  valor  previsto: 

Y  =  0, 286  -H  0, 635(2)  +  0, 200(22)  -1-  0, 272(3) 

=  0, 286 -h1,270 -h4, 40 -H  0,819 

=  6,775 

Nossa  equação  de  regressão  prevê  que  esta  família 
teria  6,775  cartões  de  crédito. 


Explicação 

Muitas  vezes  o  pesquisador  está  interessado  em  mais  do 
que  simples  previsão.  É  importante  que  um  modelo  de  re¬ 
gressão  tenha  previsões  precisas  para  suportar  sua  valida¬ 
de,  mas  muitas  questões  de  pesquisa  são  mais  focadas  na 
avaliação  da  natureza  e  impacto  de  cada  variável  indepen- 
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dente  para  fazer  a  previsão  da  dependente.  No  exemplo  de 
regressão  múltipla  discutido  anteriormente,  uma  questão 
apropriada  é  qual  variável  -  tamanho  de  família  ou  renda 
-  tem  o  maior  efeito  na  previsão  do  número  de  cartões  de 
crédito  usados  por  uma  família.  Variáveis  independentes 
com  coeficientes  de  regressão  maiores,  e  todos  os  demais 
ingredientes  iguais,  fariam  uma  contribuição  maior  para 
o  valor  previsto.  Uma  melhor  visão  sobre  a  relação  entre 
variáveis  independentes  e  dependente  é  conquistada  com 
o  exame  das  contribuições  relativas  de  cada  variável  inde¬ 
pendente.  Em  nosso  exemplo  simples,  um  representante 
querendo  vender  cartões  de  crédito  adicionais  e  procuran¬ 
do  famílias  com  mais  cartões  saberia  se  deveria  procurar 
por  famílias  com  base  em  seus  tamanhos  ou  rendas. 

Interpretação  com  coeficientes  de  regressão.  Assim, 
para  fins  de  explicação,  os  coeficientes  de  regressão  se 
tornam  indicadores  do  impacto  relativo  e  importância  das 
variáveis  independentes  em  sua  relação  com  a  variável 
dependente.  Infelizmente,  em  muitos  casos  os  coeficien¬ 
tes  de  regressão  não  nos  fornecem  essa  informação  dire¬ 
tamente,  sendo  que  a  questão-chave  é  “todas  as  outras 
coisas  iguais”.  Como  veremos,  a  escala  das  variáveis  inde¬ 
pendentes  também  entra  em  cena.  Para  ilustrar,  usamos 
um  exemplo  simples. 


Suponha  que  queremos  prever  o  quanto  um  casal  gasta 
em  restaurantes  durante  um  mês.  Após  reunir  algumas 
variáveis,  descobriu-se  que  duas  variáveis,  renda  anual 
do  marido  e  da  esposa,  eram  os  melhores  previsores.  A 
equação  de  regressão  que  se  segue  foi  calculada  usando 
o  método  de  mínimos  quadrados: 

y  =  30  -H  4/ACi  -H  0,004/AC2 

onde 

/ACj  =  Renda  anual  do  marido  (em  milhares  de  dólares) 

INC2  =  Renda  anual  da  esposa  (em  reais) 

Se  só  soubéssemos  que  INC^  e  INC2  são  rendas  anuais 
dos  dois  cônjuges,  então  provavelmente  concluiríamos 
que  a  renda  do  marido  é  muito  mais  importante  (na  rea¬ 
lidade,  mil  vezes  mais)  do  que  a  da  esposa.  Olhando  mais 
de  perto,  porém,  podemos  ver  que  as  duas  rendas  são  na 
realidade  iguais  em  importância,  sendo  que  a  diferença 
está  na  maneira  como  são  medidas.  A  renda  do  marido 
está  em  milhares  de  dólares,  de  modo  que  uma  renda  de 
$40.000,00  é  usada  na  equação  como  40,  enquanto  uma 
renda  de  $40.000,00  da  esposa  entra  como  40.000,00.  Se 
prevemos  o  uso  de  restaurantes  devido  apenas  à  renda 
da  esposa,  ele  seria  de  $160,00  (40.000,00x0,004),  o  que 
seria  exatamente  o  mesmo  para  uma  renda  do  marido 
de  $40.000,00  (40x4).  Assim,  a  renda  de  cada  cônjuge  é 
igualmente  importante,  mas  esta  interpretação  prova¬ 
velmente  não  aconteceria  com  um  exame  apenas  dos 
coeficientes  de  regressão. 


Com  o  objetivo  de  usar  os  coeficientes  de  regressão 
para  fins  de  explicação,  devemos  primeiramente  garan¬ 
tir  que  todas  as  variáveis  independentes  estão  em  escalas 
comparáveis.  Mesmo  assim,  diferenças  em  variabilidade 
de  variável  para  variável  podem  afetar  o  valor  do  coefi¬ 
ciente  de  regressão.  O  que  é  necessário  é  uma  maneira 
de  tornar  todas  as  variáveis  independentes  comparáveis 
em  escala  e  variabilidade.  Podemos  atingir  esses  objetivos 
e  resolver  esse  problema  na  explicação  usando  um  coefi¬ 
ciente  de  regressão  modificado  chamado  coeficiente  beta. 

Padronização  dos  coeficientes  de  regressão:  coeficien¬ 
tes  beta.  A  variação  em  escala  e  a  variabilidade  entre 
variáveis  tornam  a  interpretação  direta  algo  problemá¬ 
tico.  O  que  aconteceria  se  cada  uma  de  nossas  variáveis 
independentes  fosse  padronizada  antes  de  estimarmos  a 
equação  de  regressão?  A  padronização  converte  variá¬ 
veis  a  uma  escala  e  uma  variabilidade  em  comum,  sendo 
que  as  mais  comuns  são  uma  média  de  zero  (0,0)  e  um 
desvio  padrão  de  um  (1,0).  Desse  modo,  garantimos  que 
todas  as  variáveis  são  comparáveis.  Se  ainda  queremos 
os  coeficientes  originais  de  regressão  para  fins  prediti- 
vos,  será  que  nosso  único  recurso  é  a  padronização  de 
todas  as  variáveis  e  então  executar  uma  segunda  análise 
de  regressão? 

Por  sorte,  regressão  múltipla  nos  dá  não  apenas  co¬ 
eficientes  de  regressão,  mas  também  coeficientes  resul¬ 
tantes  da  análise  de  dados  padronizados  chamados  de 
coeficientes  beta  (/3).  A  vantagem  deles  é  que  eliminam  o 
problema  de  se  lidar  com  diferentes  unidades  de  medida 
(como  previamente  ilustrado)  e  assim  refletem  o  impac¬ 
to  relativo  sobre  a  variável  dependente  de  uma  mudança 
em  um  desvio  padrão  em  qualquer  variável.  Agora  que 
temos  uma  unidade  comum  de  medida,  podemos  deter¬ 
minar  qual  variável  tem  o  maior  impacto.  Retornamos  ao 
nosso  exemplo  com  cartões  de  crédito  para  ver  as  dife¬ 
renças  entre  os  coeficientes  de  regressão  (b)  e  os  coefi¬ 
cientes  beta  (p). 


No  exemplo  dos  cartões  de  crédito,  os  coeficientes  de  re¬ 
gressão  (b)  e  beta  (P)  para  a  equação  com  três  variáveis 
independentes  (Uj,  Uj  e  V^)  são  mostrados  aqui: 


Variável 

Coeficientes 

Regressão  (è) 

Beta  (P) 

Vj  Tamanho  da  família 

0,635 

0,566 

V2  Renda  familiar 

0,200 

0,416 

U  Número  de  automóveis 

0,272 

0,108 

A  interpretação  usando  coeficientes  de  regressão 
versus  beta  leva  a  resultados  substancialmente  diferen¬ 
tes.  Os  coeficientes  de  regressão  indicam  que  é  sensi¬ 
velmente  mais  importante  do  que  V2  ou  V^,  os  quais  são 
mais  ou  menos  parecidos.  Os  coeficientes  beta  contam 
uma  história  diferente.  Uj  continua  sendo  o  mais  impor¬ 
tante,  mas  V2  é  agora  quase  tão  importante  quanto  V^, 
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enquanto  tem  importância  no  máximo  periférica.  Es¬ 
ses  resultados  simples  retratam  as  imprecisões  na  inter¬ 
pretação  que  podem  acontecer  quando  coeficientes  de 
regressão  são  usados  com  variáveis  de  diferentes  escalas 
e  variabilidades. 


A  despeito  de  os  coeficientes  beta  representarem  uma 
medida  objetiva  de  importância  que  pode  ser  diretamente 
comparada,  dois  cuidados  devem  ser  observados  em  seu 
uso: 

•  Primeiro,  eles  devem  ser  usados  como  uma  diretriz  para  a 
importância  relativa  de  variáveis  independentes  individuais 
somente  quando  a  colinearidade  é  mínima.  Como  veremos 
na  seção  a  seguir,  colinearidade  pode  distorcer  as  contribui¬ 
ções  de  qualquer  variável  independente  mesmo  que  coefi¬ 
cientes  beta  sejam  utilizados. 

•  Segundo,  os  valores  beta  podem  ser  interpretados  apenas 
no  contexto  das  outras  variáveis  na  equação.  Por  exemplo, 
um  valor  beta  para  tamanho  de  família  reflete  sua  impor¬ 
tância  só  em  relação  a  renda  familiar,  e  não  em  qualquer 
sentido  absoluto.  Se  outra  variável  independente  fosse 
acrescentada  à  equação,  o  coeficiente  beta  para  tamanho 
de  família  provavelmente  mudaria,  pois  alguma  relação 
entre  tamanho  de  família  e  a  nova  variável  independente 
é  provável. 

Em  resumo,  os  coeficientes  beta  devem  ser  usados 
apenas  como  uma  orientação  para  a  importância  relati¬ 
va  das  variáveis  independentes  incluídas  na  equação  e 
somente  para  aquelas  variáveis  com  multicolinearidade 
mínima. 

Avaliação  da  multicolinearidade 

Uma  questão-chave  na  interpretação  da  variável  es¬ 
tatística  de  regressão  é  a  correlação  entre  as  variáveis 
independentes.  Esse  é  um  problema  de  dados,  e  não 
de  especificação  de  modelo.  A  situação  ideal  para  um 
pesquisador  seria  ter  diversas  variáveis  independentes 
altamente  correlacionadas  com  a  variável  dependente, 
mas  com  pouca  correlação  entre  elas  próprias.  Se  você 
consultar  o  Capítulo  3  e  nossa  discussão  sobre  análise 
fatorial,  o  uso  de  escores  fatoriais  que  são  ortogonais 
(não-correlacionados)  foi  sugerido  para  atingir  tal  con¬ 
figuração. 

Todavia,  na  maioria  das  situações,  particularmente  nas 
que  envolvem  dados  de  respostas  de  consumidores,  have¬ 
rá  algum  grau  de  multicolinearidade.  Em  algumas  outras 
ocasiões,  como  o  uso  de  variáveis  dicotômicas  para  repre¬ 
sentar  variáveis  não-métricas  ou  termos  polinomiais  para 
efeitos  não-lineares,  o  pesquisador  está  criando  situações 
de  alta  multicolinearidade.  A  tarefa  do  pesquisador  inclui 
o  seguinte: 

•  Avaliar  o  grau  de  multicolinearidade. 

•  Determinar  seu  impacto  sobre  os  resultados. 

•  Aplicar  as  necessárias  ações  corretivas,  se  for  o  caso. 


Nas  seções  a  seguir,  discutimos  em  detalhes  alguns 
procedimentos  diagnósticos  úteis,  os  efeitos  de  multicoli¬ 
nearidade,  e  depois  ações  corretivas  possíveis. 

Identificação  de  multicolinearidade 

A  maneira  mais  simples  e  óbvia  de  identificar  colineari¬ 
dade  é  um  exame  da  matriz  de  correlação  para  as  variá¬ 
veis  independentes.  A  presença  de  elevadas  correlações 
(geralmente  0,90  ou  maiores)  é  a  primeira  indicação  de 
colinearidade  substancial.  No  entanto,  a  falta  de  valores 
elevados  de  correlação  não  garante  ausência  de  colineari¬ 
dade.  Colinearidade  pode  ser  proveniente  do  efeito  com¬ 
binado  de  duas  ou  mais  variáveis  independentes  (o  que  se 
chama  de  multicolinearidade). 

Para  avaliar  multicolinearidade  precisamos  de  uma 
medida  que  expresse  o  grau  em  que  cada  variável  inde¬ 
pendente  é  explicada  pelo  conjunto  de  outras  variáveis 
independentes.  Em  termos  simples,  cada  variável  inde¬ 
pendente  se  torna  uma  variável  dependente  e  é  regredida 
relativamente  às  demais  variáveis  independentes.  As  duas 
medidas  mais  comuns  para  se  avaliar  colinearidade  aos 
pares  ou  múltipla  são  a  tolerância  e  sua  inversa,  o  fator  de 
inflação  de  variância. 

Tolerância.  Uma  medida  direta  de  multicolinearidade  é 
tolerância,  a  qual  é  definida  como  a  quantia  de  variabili¬ 
dade  da  variável  independente  selecionada  não  explicada 
pelas  outras  variáveis  independentes.  Assim,  para  qualquer 
modelo  de  regressão  com  duas  ou  mais  variáveis  indepen¬ 
dentes,  a  tolerância  pode  ser  simplesmente  definida  em 
dois  passos: 

1.  Considere  cada  variável  independente,  uma  por  vez,  e  cal¬ 
cule  -  a  quantia  da  variável  em  questão  que  é  explicada 
por  todas  as  demais  variáveis  independentes  no  modelo  de 
regressão.  Neste  processo,  a  variável  independente  escolhi¬ 
da  é  transformada  em  uma  dependente  prevista  pelas  de¬ 
mais. 

2.  Tolerância  é  então  calculada  como  1  -  .  Por  exemplo,  se 

as  outras  variáveis  independentes  explicam  25%  da  variável 
independente  Aj  =  0,25),  então  o  valor  de  tolerância  de 
Al  é  0,75  (1,0-0,25  =  0,75). 

O  valor  de  tolerância  deve  ser  alto,  o  que  significa  um 
pequeno  grau  de  multicolinearidade  (i.e.,  as  outras  va¬ 
riáveis  independentes  coletivamente  não  têm  qualquer 
quantia  considerável  de  variância  compartilhada).  A  de¬ 
terminação  de  níveis  apropriados  de  tolerância  será  abor¬ 
dada  em  uma  seção  adiante. 

Fator  de  inflação  de  variância.  Uma  segunda  medida 
de  multicolinearidade  é  o  fator  de  inflação  de  variância 
(VIF),  o  qual  é  calculado  simplesmente  como  o  inverso 
do  valor  de  tolerância.  No  exemplo  anterior  com  uma  to¬ 
lerância  de  0,75,  o  VIF  seria  1,33  (1,0/0,75  =  1,33).  Assim, 
casos  com  níveis  maiores  de  multicolinearidade  são  refle¬ 
tidos  em  valores  de  tolerância  menores  e  valores  maiores 
para  VIF.  O  VIF  tem  seu  nome  devido  ao  fato  de  que  a 
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raiz  quadrada  dele  (Vvif)  é  o  grau  em  que  o  erro  padrão 
aumentou  devido  à  multicolinearidade.  Examinemos 
exemplos  para  ilustrar  a  inter-relação  de  tolerância,  VIF  e 
o  impacto  sobre  erro  padrão. 


Por  exemplo,  se  o  VIF  é  igual  a  1,0  (o  que  significa  que  a 
tolerância  é  1,0  e  assim  não  há  multicolinearidade),  en¬ 
tão  VvTF  =  1,0  e  o  erro  padrão  não  é  afetado.  No  entan¬ 
to,  consideremos  que  a  tolerância  é  0,25  (o  que  implica 
uma  multicolinearidade  razoavelmente  elevada,  uma 
vez  que  75%  da  variância  da  variável  é  explicada  por 
outras  variáveis  independentes).  Neste  caso,  o  VIF  é  4,0 
(1,0/0,25  =  4)  e  o  erro  padrão  dobrou  (^4  =  2)  por  conta 
da  multicolinearidade. 


O  VIF  traduz  o  valor  de  tolerância,  o  qual  expressa 
diretamente  o  grau  de  multicolinearidade  em  um  impac¬ 
to  sobre  o  processo  de  estimação.  Quando  o  erro  padrão 
aumenta,  os  intervalos  de  confiança  em  torno  dos  coefi¬ 
cientes  estimados  ficam  maiores,  tornando  mais  difícil  a 
demonstração  de  que  o  coeficiente  é  significativamente 
diferente  de  zero. 

Os  efeitos  da  multicolinearidade 

Os  efeitos  da  multicolinearidade  podem  ser  classificados 
em  termos  de  explicação  ou  estimação.  No  entanto,  em 
qualquer  caso  o  motivo  inerente  é  o  mesmo:  multicoline¬ 
aridade  cria  variância  “compartilhada”  entre  variáveis, 
diminuindo  assim  a  capacidade  de  prever  a  medida  de¬ 
pendente,  bem  como  averiguar  os  papéis  relativos  de  cada 
variável  independente.  A  Figura  4-9  retrata  as  proporções 
de  variância  compartilhada  e  única  para  duas  variáveis  in¬ 
dependentes  em  diferentes  casos  de  colinearidade.  Se  a 
colinearidade  dessas  variáveis  for  nula,  então  as  variáveis 
individuais  prevêem  36%  e  25%  da  variância  na  variável 


dependente,  para  uma  previsão  geral  {R^)  de  61%.  À  me¬ 
dida  que  a  multicolinearidade  aumenta,  a  variância  total 
explicada  diminui  (estimação).  Além  disso,  a  quantia  de 
variância  única  para  as  variáveis  independentes  é  redu¬ 
zida  a  níveis  que  tornam  a  estimação  de  seus  efeitos  indi¬ 
viduais  bastante  problemática  (explicação).  As  seções  a 
seguir  tratam  desses  impactos  com  mais  detalhes. 

Impactos  sobre  estimação.  Multicolinearidade  pode  ter 
efeitos  consideráveis  não  apenas  sobre  a  habilidade  predi- 
tiva  do  modelo  de  regressão  (como  descrito  acima),  mas 
também  sobre  a  estimação  dos  coeficientes  de  regressão  e 
seus  testes  de  significância  estatística. 

1.  Primeiro,  o  caso  extremo  de  multicolinearidade  no  qual 
duas  ou  mais  variáveis  estão  perfeitamente  correlacionadas, 
o  que  se  chama  de  singularidade,  impede  a  estimação  de 
qualquer  coeficiente.  Apesar  de  singularidades  poderem  na¬ 
turalmente  ocorrer  entre  as  variáveis  independentes,  muitas 
vezes  elas  são  um  resultado  de  erro  de  pesquisa.  Um  engano 
comum  é  incluir  todas  as  variáveis  dicotômicas  usadas  para 
representar  uma  variável  não-métrica,  em  vez  de  omitir  uma 
como  a  categoria  de  referência.  Além  disso,  ações  como  a 
inclusão  de  uma  escala  múltipla  junto  com  as  variáveis  in¬ 
dividuais  que  a  criaram  resultarão  em  singularidades.  Não 
obstante,  qualquer  que  seja  o  motivo,  a  singularidade  deve 
ser  removida  antes  que  se  possa  proceder  com  a  estimação 
dos  coeficientes. 

2.  Quando  a  multicolinearidade  aumenta,  a  capacidade  para 
mostrar  que  os  coeficientes  de  regressão  estimados  são 
significativamente  diferentes  de  zero  pode  ficar  seriamen¬ 
te  comprometida  devido  a  aumentos  no  erro  padrão  como 
mostrado  no  valor  VIF.  Essa  questão  é  especialmente  pro¬ 
blemática  em  amostras  menores,  onde  os  erros  padrão  são 
geralmente  maiores  por  conta  de  erro  de  amostragem. 

3.  Além  de  afetar  os  testes  estatísticos  dos  coeficientes  ou  o 
modelo  geral,  elevados  graus  de  multicolinearidade  podem 
também  resultar  em  coeficientes  de  regressão  que  são  incor- 


Corelação  entre  variáveis  dependente  e  independente: 
X,  e  dependente  (0,60),  e  dependente  (0,50) 


FIGURA  4-9  Proporções  de  variância  única  e  compartiihada  por  níveis  de  muiticoiinearidade. 
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retamente  estimados  e  até  mesmo  com  sinais  errados.  Dois 
exemplos  ilustram  esta  questão. 


Nosso  primeiro  exemplo  (ver  Tabela  4-9)  ilustra  a  situação 
de  inversão  de  sinais  devido  à  elevada  correlação  negativa 
entre  duas  variáveis.  No  Exemplo  A,  está  claro  no  exame 
da  matriz  de  correlação  e  das  regressões  simples  que  a  re¬ 
lação  entre  Y  eV^é  positiva,  enquanto  a  relação  entre  Y 
e  Tj  é  negativa.  A  equação  de  regressão  múltipla,  porém, 
não  mantém  as  relações  das  regressões  simples.  Poderia 
parecer  para  o  observador  casual  que  examina  apenas  os 
coeficientes  de  regressão  múltipla  que  ambas  as  relações 
(y  e  Pj,  y  e  Pj)  são  negativas,  quando  sabemos  não  ser  o 
caso  para  y  e  Pj.  O  sinal  do  coeficiente  de  regressão  de  Pj 
está  errado  em  um  sentido  intuitivo,  mas  a  forte  correlação 
negativa  entre  Pj  e  Pj  resulta  na  inversão  de  sinal  para  Pj. 
Apesar  de  esses  efeitos  sobre  o  procedimento  de  estima¬ 
ção  ocorrerem  principalmente  em  níveis  relativamente  al¬ 
tos  de  multicolinearidade  (acima  de  0,80),  a  possibilidade 
de  resultados  contra-intuitivos  e  enganosos  demanda  uma 
cuidadosa  análise  de  cada  variável  estatística  de  regressão 
em  busca  de  uma  possível  multicolinearidade. 

Uma  situação  parecida  pode  ser  vista  no  Exemplo 
B  da  Tabela  4-9.  Aqui,  Zj  e  Zj  são  positivamente  cor¬ 
relacionadas  com  a  medida  dependente  (0,293  e  0,631, 
respectivamente),  mas  têm  uma  inter-correlação  maior 
(0,642).  Nesse  modelo  de  regressão,  ainda  que  ambas 
as  correlações  bivariadas  das  variáveis  independentes 
sejam  positivas  com  a  dependente,  e  as  duas  variáveis 
independentes  estejam  positivamente  inter-correlacio- 
nadas,  quando  a  equação  de  regressão  é  estimada,  o 
coeficiente  de  Zj  se  torna  negativo  (-0,343)  enquanto  o 
outro  coeficiente  é  positivo  (0,702).  Isso  exemplifica  o 
caso  de  elevada  multicolinearidade  que  inverte  os  sinais 
das  variáveis  independentes  mais  fracas  (i.e.,  correlações 
menores  com  a  variável  dependente). 


Em  alguns  casos  essa  inversão  de  sinais  é  esperada  e 
desejável.  Chamada  de  efeito  de  supressão,  ela  denota  ca¬ 
sos  em  que  a  “verdadeira”  relação  entre  a  variável  depen¬ 
dente  e  a(s)  independente(s)  fica  oculta  nas  correlações 
bivariadas  (p.ex.,  as  relações  esperadas  são  não-significan- 
tes  ou  mesmo  invertidas  no  sinal).  Acrescentando  variá¬ 
veis  independentes  extras  e  induzindo  multicolinearidade, 
alguma  variância  compartilhada  indesejável  é  explicada, 
e  a  variância  única  remanescente  permite  que  os  coefi¬ 
cientes  estimados  fiquem  na  direção  esperada.  Descrições 
mais  detalhadas  de  todos  os  casos  potenciais  de  efeitos  de 
supressão  são  mostradas  em  [5]. 

No  entanto,  em  outros  casos,  as  relações  teoricamen¬ 
te  embasadas  são  invertidas  por  conta  da  multicolineari¬ 
dade,  deixando  ao  pesquisador  a  explicação  do  por  quê 
de  os  coeficientes  terem  sinais  invertidos  em  relação  ao 
esperado.  Nesses  casos,  o  pesquisador  pode  precisar  in¬ 
verter  para  usar  as  correlações  bivariadas  para  descrever 


a  relação  ao  invés  dos  coeficientes  estimados  que  sofrem 
impacto  devido  à  multicolinearidade. 

Os  sinais  inversos  podem  ser  encontrados  em  todos  os 
procedimentos  de  estimação,  mas  são  vistos  mais  freqüen- 
temente  em  processos  de  estimação  confirmatória,  onde 
um  conjunto  de  variáveis  entra  no  modelo  de  regressão 
e  a  possibilidade  de  variáveis  mais  fracas  serem  afetadas 
pela  multicolinearidade  aumenta. 

Impactos  sobre  explicação.  Os  efeitos  na  explicação  se 
referem  principalmente  à  habilidade  do  procedimento  de 
regressão  e  do  pesquisador  em  representar  e  compreender 
os  efeitos  de  cada  variável  independente  na  variável  es¬ 
tatística  de  regressão.  Quando  ocorre  multicolinearidade 
(mesmo  em  níveis  relativamente  baixos  de  0,30  ou  próxi¬ 
mos  disso),  o  processo  de  identificação  de  efeitos  únicos  de 
variáveis  independentes  se  torna  mais  difícil.  Lembre-se 
que  os  coeficientes  de  regressão  representam  a  quantia  de 
variância  única  explicada  por  conta  de  cada  variável  inde¬ 
pendente.  Como  multicolinearidade  resulta  em  porções 
maiores  de  variância  compartilhada  e  menores  níveis  de 
variância  única,  os  efeitos  das  variáveis  independentes  in¬ 
dividuais  se  tornam  menos  distinguíveis.  É  até  mesmo  pos¬ 
sível  encontrar  aquelas  situações  nas  quais  a  multicolinea¬ 
ridade  é  tão  alta  que  nenhum  dos  coeficientes  de  regressão 
independentes  é  estatisticamente  signiflcante,  mesmo  que 
o  modelo  de  regressão  geral  tenha  um  nível  signiflcante  de 
precisão  preditiva.  O  Adendo  4-1  fornece  mais  detalhes 
sobre  o  cálculo  de  previsões  de  variância  única  e  comparti¬ 
lhada  entre  variáveis  independentes  correlacionadas. 

Quanto  de  multicolinearidade  é  excessivo? 

Como  o  valor  de  tolerância  se  refere  a  quanto  uma  variá¬ 
vel  é  não-explicada  pelas  demais  variáveis  independentes, 
pequenos  valores  de  tolerância  (e  assim  grandes  valores 
VIF,  pois  VIF  =  l/tolerância)  denotam  elevada  colineari- 
dade.  Uma  referência  de  corte  muito  comum  é  um  valor 
de  tolerância  de  0,10,  o  que  corresponde  a  um  valor  VIF 
de  10.  No  entanto,  especialmente  quando  as  amostras  são 
menores,  o  pesquisador  pode  querer  ser  mais  restritivo 
devido  a  aumentos  nos  erros  padrão  por  conta  de  mul¬ 
ticolinearidade.  Com  um  VIF  de  referência  de  10,  essa 
tolerância  corresponderia  a  erros  padrão  sendo  “inflacio- 
nados”  mais  do  que  o  triplo  (-v/lõ  =  3,16)  do  que  seriam  se 
não  houvesse  multicolinearidade. 

Cada  pesquisador  deve  determinar  o  grau  de  colinea- 
ridade  que  é  aceitável,  pois  a  maioria  das  referências  re¬ 
comendadas  ainda  permite  substancial  colinearidade.  Por 
exemplo,  o  corte  sugerido  para  o  valor  de  tolerância  de 
0,10  corresponde  a  uma  correlação  múltipla  de  0,95.  Além 
disso,  uma  correlação  múltipla  de  0,9  entre  uma  variável 
independente  e  todas  as  demais  (semelhante  à  regra  que 
aplicamos  na  matriz  de  correlação  aos  pares)  resultaria 
em  um  valor  de  tolerância  de  0,19.  Logo,  qualquer  variá¬ 
vel  com  tolerância  abaixo  de  0,19  (ou  acima  de  um  VIF  de 
5,3)  teria  uma  correlação  superior  a  0,90. 
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TABELA  4-9  Estimativas  de  regressão  com  dados  multicolineares 


EXEMPLO  A 

EXEMPLO  B 

Dados 

Dados 

Identificação  Y 

V, 

V, 

Identificação 

Y 

^2 

1 

5 

6 

13 

1 

3,7 

3,2 

2,9 

2 

3 

8 

13 

2 

3,7 

3,3 

4,2 

3 

9 

8 

11 

3 

4,2 

3,7 

4,9 

4 

9 

10 

11 

4 

4,3 

3,3 

5,1 

5 

13 

10 

9 

5 

5,1 

4,1 

5,5 

6 

11 

12 

9 

6 

5,2 

3,8 

6,0 

7 

17 

12 

7 

7 

5,2 

2,8 

4,9 

8 

15 

14 

7 

8 

5,6 

2,6 

4,3 

9 

5,6 

3,6 

5,4 

10 

6,0 

4,1 

5,5 

Matriz  de  correiação 

Matriz  de  correiação 

Y 

V, 

Y 

^2 

Y 

1,0 

Y 

1,0 

V, 

0,823 

1,0 

A 

0,293 

1,0 

V, 

-0,977 

-0,913 

1,0 

z. 

0,631 

0,642 

1,0 

Estimativas  de  regressão 

Estimativas  de  regressão 

Regressão  simples  (l/,): 

Regressão  simples  (Z,): 

y'=-4,75  +  1,51/, 

y=  2,996  +  0,5257, 

Regressão  simples  (I4): 

Regressão  simples  (Z^): 

y=  29,75- 

•1,9514 

y=  1,999  +  0,58772 

Regressão  múltipla  (l/,,  14): 

Regressão  múltipla  (7,,  ZA- 

y=  44,75- 

■0,751/, -2,714 

y=  2,659- 

0,3437,  +  0,70272 

Adendo  4-1  Cálculo  da  Variância  Única  e  Compartilhada 
entre  Variáveis  Independentes 


A  base  para  estimar  todas  as  relações  de  regressão  é  a 
correlação,  que  mede  a  associação  entre  duas  variáveis. 
Na  análise  de  regressão,  as  correlações  entre  as  variáveis 
independentes  e  a  variável  dependente  fornecem  a  base 
para  formar  a  variável  estatística  de  regressão  por  meio  da 
estimação  dos  coeficientes  de  regressão  (pesos)  para  cada 
variável  independente  que  maximiza  a  previsão  (variân¬ 
cia  explicada)  da  variável  dependente.  Quando  a  variável 
estatística  contém  apenas  uma  variável  independente,  o 
cálculo  dos  coeficientes  de  regressão  é  direto  e  baseado  na 
correlação  bivariada  (ou  de  ordem  zero)  entre  a  variável 
independente  e  a  dependente.  O  percentual  de  variância 
explicada  da  variável  dependente  é  simplesmente  o  qua¬ 
drado  da  correlação  bivariada. 

Mas  conforme  variáveis  independentes  são  acrescenta¬ 
das  à  variável  estatística,  os  cálculos  também  devem  con¬ 
siderar  as  inter-correlações  entre  variáveis  independentes. 
Se  as  variáveis  independentes  são  correlacionadas,  então 
elas  “compartilham”  algo  de  seu  poder  preditivo.  Como 
usamos  apenas  a  previsão  da  variável  estatística  geral,  a 
variância  compartilhada  não  deve  ser  “contada  duas  ve¬ 
zes”  usando  apenas  as  correlações  bivariadas.  Logo,  cal¬ 


culamos  duas  formas  adicionais  da  correlação  para  repre¬ 
sentar  esses  efeitos  compartilhados: 

1.  O  coeficiente  de  correlação  parcial  é  a  correlação  de  uma 
variável  independente  (A,)  e  dependente  (Y)  quando  os 
efeitos  da(s)  outra(s)  variável(eis)  independente(s)  foram 
removidos  de  A;  e  Y. 

2.  A  correlação  semiparcial  reflete  a  correlação  entre  uma  va¬ 
riável  independente  e  a  dependente  enquanto  controla  os 
efeitos  preditivos  de  todas  as  demais  variáveis  independen¬ 
tes  sobre  A,. 

As  duas  formas  de  correlação  diferem  no  sentido  de 
que  a  correlação  parcial  remove  os  efeitos  de  outras  va¬ 
riáveis  independentes  de  X-  e  Y,  enquanto  a  correlação 
semiparcial  remove  os  efeitos  apenas  de  X-.  A  correlação 
parcial  representa  o  efeito  preditivo  incremental  de  uma 
variável  independente  a  partir  do  efeito  coletivo  de  todas 
as  demais  e  é  usada  para  identificar  variáveis  independen¬ 
tes  que  têm  o  maior  poder  preditivo  incremental  quando 
um  conjunto  de  variáveis  independentes  já  está  na  va¬ 
riável  estatística  de  regressão.  A  correlação  semiparcial 
representa  a  única  relação  prevista  por  uma  variável  in¬ 
dependente  depois  que  as  previsões  compartilhadas  com 
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todas  as  outras  variáveis  independentes  são  desconsidera¬ 
das.  Assim,  a  correlação  semiparcial  é  usada  na  distribui¬ 
ção  de  variância  entre  as  variáveis  independentes.  Elevar 
ao  quadrado  a  correlação  semiparcial  fornece  a  variância 
única  explicada  pela  variável  independente. 

O  diagrama  a  seguir  retrata  a  variância  compartilhada  e 
única  entre  duas  variáveis  independentes  correlacionadas. 


entre  e  Aj  significa  que  uma  porção  substancial  desse 
poder  preditivo  pode  ser  compartilhada.  A  correlação  se¬ 
miparcial  de  Xj  e  y  controlando  {^y,xi(X2^  ®  ^  variância 
única  prevista  por  X^  pode  ser  calculada  como: 


0,60 -(0,50x0, 70) 

i  ■"  =  U,  J  J 

Vl,0-0,70^ 


Y 


a  =  variância  de  Y explicada  unicamente  por  X, 
b  =  variância  de  Y explicada  unicamente  por 
c  =  variância  de  Y expiicada  juntamente  por  X,  e  X^ 
d  =  variância  de  Y  nâo  explicada  por  X,  ou  X^ 

A  variância  associada  com  a  correlação  parcial  de  Xj 
controlando  Xj  pode  ser  representada  como  bl  {d  +  b), 
onde  d  +  b  representa  a  variância  não-explicada  depois  da 
contribuição  explicativa  de  Xj.  A  correlação  semiparcial  de 
Xj  controlando  X^  é  b/  {a  +  b  +  c  +  d),  onde  a+  b  +  c  +  d 
representa  a  variância  total  de  Y,  e  b  é  a  quantia  explicada 
unicamente  por  Xj. 

O  analista  pode  também  determinar  a  variância  com¬ 
partilhada  e  única  para  variáveis  independentes  através  de 
cálculo  simples.  A  correlação  semiparcial  entre  a  variável 
dependente  (Y)  e  uma  independente  (Xj)  enquanto  se  con¬ 
trola  uma  segunda  variável  independente  (Xj)  é  calculada 
pela  seguinte  equação: 

Correlação  semiparcial  de  Y,  Xj,  dado  Xj  = 

Corr  de  Y,  Xj  -  (Corr  de  Y,  X^ x  Corr  de  Y^,  XJ 

^l,0-(Corr  deX,,XJ* 

Um  exemplo  simples  de  duas  variáveis  independentes 
(Xj  e  Xj)  ilustra  o  cálculo  da  variância  tanto  compartilhada 
quanto  única  da  variável  dependente  (Y).  As  correlações 
diretas  e  a  correlação  entre  Xj  e  Xj  são  exibidas  na  matriz 
de  correlações  a  seguir: 


Y 

X2 

Y 

1,0 

0,60 

1,0 

X2 

0,50 

0,70 

1,0 

As  correlações  diretas  de  0,60  e  0,50  representam  rela¬ 
ções  razoavelmente  fortes  com  Y,  mas  a  correlação  de  0,70 

*  N.  de  R.  T.:  O  denominador  correto  seria  J.O  -  (Corr  de  X,, 


Variância  única  prevista  por  Xj  =  0,35^  =  0,1225 

Como  a  correlação  direta  de  Xj  e  Y  é  0,60,  também 
sabemos  que  a  variância  total  prevista  por  Xj  é  0,60^,  ou 
0,36.  Se  a  variância  única  é  0,1225,  então  a  variância  com¬ 
partilhada  deve  ser  0,2375  (0,36  -  0,1225). 

Podemos  calcular  a  variância  única  explicada  por  Xj  e 
confirmar  a  variância  compartilhada  da  seguinte  manei¬ 
ra: 


0,50 -(0,60x0, 70) 
Vl,0-0,70^ 


Variância  única  prevista  por  X2  =  0,11^  =  0,0125. 

Com  a  variância  total  explicada  por  Xj  sendo  0,50^,  ou 
0,25,  a  variância  compartilhada  é  calculada  como  0,2375 
(0,25  -  0,0125).  Este  resultado  confirma  o  que  se  encon¬ 
trou  nos  cálculos  para  Xj. 

Logo,  a  variância  total  (R^)  explicada  pelas  duas  variá¬ 


veis  independentes  é 

Variância  única  explicada  por  Xj  0,1225 

Variância  única  explicada  por  Xj  0,0125 

Variância  compartilhada  explicada  por  Xj  e  Xj  0,2375 
Variância  total  explicada  por  Xj  e  X2  0,3725 


Esses  cálculos  podem  ser  estendidos  para  mais  de  duas 
variáveis,  mas  à  medida  que  o  número  de  variáveis  au¬ 
menta,  fica  mais  fácil  permitir  que  programas  estatísticos 
façam  os  cálculos. 

O  cálculo  de  variância  compartilhada  e  única  ilustra 
os  efeitos  de  multicolinearidade  sobre  a  habilidade  das 
variáveis  independentes  para  preverem  a  dependente.  A 
Figura  4-9  mostra  esses  efeitos  diante  de  níveis  altos  e  bai¬ 
xos  de  multicolinearidade.  ■ 


Insistimos  que  o  pesquisador  sempre  deve  especificar 
os  valores  de  tolerância  em  programas  de  regressão,  pois 
os  valores  padrão  para  exclusão  de  variáveis  colineares 
permitem  um  grau  elevado  de  colinearidade.  Por  exem¬ 
plo,  o  valor  padrão  de  tolerância  no  SPSS  para  exclusão 
de  uma  variável  é  0,0001,  o  que  significa  que,  até  com  mais 
do  que  99,99%  da  variância  prevista  pelas  outras  variáveis 
independentes,  a  variável  poderia  ser  incluída  na  equação 
de  regressão.  Estimativas  dos  efeitos  reais  da  colinearida¬ 
de  alta  sobre  os  coeficientes  estimados  são  possíveis,  mas 
estão  além  do  escopo  deste  texto  (ver  Neter  etal.  [11]). 
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Mesmo  com  diagnósticos  que  usam  valores  de  VIF  ou 
de  tolerância,  ainda  não  sabemos  necessariamente  quais 
variáveis  estão  intercorrelacionadas.  Um  procedimento 
devido  a  Belsley  et  al.  [2]  permite  que  as  variáveis  correla¬ 
cionadas  sejam  identificadas,  mesmo  que  tenhamos  corre¬ 
lação  entre  diversas  variáveis.  Ele  fornece  ao  pesquisador 
maior  poder  diagnóstico  na  avaliação  da  extensão  e  do 
impacto  de  multicolinearidade  e  é  discutido  no  suplemen¬ 
to  deste  capítulo,  encontrado  na  Web  em  www.bookman. 
com.br. 

Ações  corretivas  para  multicolinearidade 

As  ações  corretivas  para  a  multicolinearidade  variam  des¬ 
de  a  modificação  da  variável  estatística  de  regressão  até  o 
uso  de  procedimentos  especializados  de  estimação.  Assim 
que  o  grau  de  colinearidade  tenha  sido  determinado,  o 
pesquisador  tem  várias  opções: 

1.  Omitir  uma  ou  mais  variáveis  independentes  altamente  cor¬ 
relacionadas  e  identificar  outras  variáveis  independentes 
para  ajudar  na  previsão.  No  entanto,  o  pesquisador  deve  ser 
cuidadoso  ao  seguir  esta  opção,  para  evitar  a  criação  de  um 
erro  de  especificação  quando  eliminar  uma  ou  mais  variá¬ 
veis  independentes. 

2.  Usar  o  modelo  com  as  variáveis  independentes  altamente 
correlacionadas  apenas  para  previsão  (ou  seja,  jamais  tentar 
interpretar  os  coeficientes  de  regressão),  apesar  de  se  reco¬ 
nhecer  o  menor  nível  de  habilidade  preditiva  geral. 

3.  Usar  as  correlações  simples  entre  cada  variável  independen¬ 
te  e  a  dependente  para  compreender  a  relação  entre  variá¬ 
veis  independentes  e  dependente. 

-  REGRAS  PRÁTICAS  4-7  - 

Interpretação  da  variável  estatística  de  regressão 

•  Interprete  o  impacto  de  cada  variável  independente 
relativamente  às  demais  variáveis  no  modelo,  pois 
reespecificação  de  modelo  pode  ter  profundo  efeito  sobre 
as  outras  variáveis: 

•  Use  pesos  beta  quando  comparar  importância  relativa 
entre  variáveis  independentes 

•  Coeficientes  de  regressão  descrevem  mudanças  na 
variável  dependente,  mas  podem  ser  difíceis  para 
comparar  ao  longo  de  variáveis  independentes  se  os 
formatos  das  respostas  variarem 

•  Multicolinearidade  pode  ser  considerada  "boa"  quando 
revela  um  efeito  supressor,  mas  geralmente  é  vista 
como  inconveniente  pelo  fato  de  que  aumentos  na 
multicolinearidade: 

•  Reduzem  o  geral  que  pode  ser  conseguido 

•  Confundem  a  estimação  dos  coeficientes  de  regressão 

•  Afetam  negativamente  os  testes  de  significância 
estatística  de  coeficientes 

•  Níveis  geralmente  aceitos  de  multicolinearidade  (valores 
de  tolerância  de  até  0,10,  correspondendo  a  um  VIF  de 
10)  devem  ser  diminuídos  em  amostras  menores  devido  a 
aumentos  no  erro  padrão  atribuíveis  à  multicolinearidade. 


4.  Usar  um  método  mais  sofisticado  de  análise,  como  a  regres¬ 
são  Bayesiana  (ou  um  caso  especial  -  regressão  ridge)  ou  a 
regressão  sobre  componentes  principais  para  obter  um  mo¬ 
delo  que  reflita  mais  claramente  os  efeitos  simples  das  va¬ 
riáveis  independentes.  Esses  procedimentos  são  discutidos 
com  mais  detalhes  em  vários  textos  [2, 11]. 

Cada  opção  requer  que  o  pesquisador  faça  um  julga¬ 
mento  das  variáveis  incluídas  na  variável  estatística  de  re¬ 
gressão,  o  qual  deve  sempre  ser  guiado  pela  base  teórica 
do  estudo. 


ESTÁGIO  6:  VALIDAÇÃO 
DOS  RESULTADOS 

Após  identificar  o  melhor  modelo  de  regressão,  o  passo 
final  é  garantir  que  ele  represente  a  população  geral  (ge¬ 
neralização)  e  seja  apropriado  às  situações  nas  quais  será 
usado  (transferibilidade).  O  melhor  critério  é  a  extensão 
em  que  o  modelo  de  regressão  se  ajusta  a  um  modelo  teó¬ 
rico  existente  ou  um  conjunto  de  resultados  previamente 
validados  sobre  o  mesmo  tópico.  Em  muitos  casos,  con¬ 
tudo,  não  há  resultados  anteriores  ou  teoria  disponíveis. 
Assim,  também  discutimos  abordagens  empíricas  para  a 
validação  de  modelo. 

Amostras  adicionais  ou  particionadas 

A  abordagem  empírica  de  validação  mais  apropriada  é 
testar  o  modelo  de  regressão  em  uma  nova  amostra  tira¬ 
da  da  população  geral.  Uma  nova  amostra  garantirá  re- 
presentatividade  e  pode  ser  usada  de  diversas  maneiras. 
Primeiro,  o  modelo  original  pode  prever  valores  na  nova 
amostra  e  o  ajuste  preditivo  pode  ser  calculado.  Segundo, 
um  modelo  separado  pode  ser  estimado  com  a  nova  amos¬ 
tra  e  então  comparado  com  a  equação  original  em  relação 
a  características  como  as  variáveis  significantes  incluídas; 
sinal,  tamanho  e  importância  relativa  de  variáveis;  e  pre¬ 
cisão  preditiva.  Em  ambos  os  casos,  o  pesquisador  deter¬ 
mina  a  validade  do  modelo  original,  comparando-o  com 
modelos  de  regressão  estimados  com  a  nova  amostra. 

Muitas  vezes,  a  habilidade  de  coletar  novos  dados  é  li¬ 
mitada  ou  impraticável  por  fatores  como  custo,  pressões  de 
tempo  ou  disponibilidade  de  respondentes.  Quando  esse  é 
o  caso,  o  pesquisador  pode  dividir  a  amostra  em  duas  par¬ 
tes:  uma  subamostra  de  estimação  para  criar  o  modelo  de 
regressão,  e  uma  subamostra  de  reserva  ou  validação,  usa¬ 
da  para  “testar”  a  equação.  Muitos  procedimentos,  tanto 
aleatórios  quanto  sistemáticos,  estão  disponíveis  para  divi¬ 
dir  os  dados,  de  modo  que  cada  um  tire  duas  amostras  in¬ 
dependentes  do  conjunto  único  de  dados.  Todos  os  pacotes 
estatísticos  populares  têm  opções  específicas  para  permitir 
estimação  e  validação  em  subamostras  separadas.  O  Capí¬ 
tulo  5  apresenta  uma  discussão  sobre  o  uso  de  subamostras 
de  estimação  e  validação  em  análise  discriminante. 
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Seja  uma  nova  amostra  definida  ou  não,  é  provável 
que  ocorram  diferenças  entre  o  modelo  original  e  outros 
esforços  de  validação.  O  papel  do  pesquisador  agora  passa 
a  ser  o  de  um  mediador  entre  os  vários  resultados,  procu¬ 
rando  o  melhor  modelo  ao  longo  de  todas  as  amostras.  A 
necessidade  de  empreendimentos  contínuos  de  validação 
e  refinamentos  do  modelo  nos  lembra  que  nenhum  mo¬ 
delo  de  regressão,  a  não  ser  que  seja  estimado  a  partir  da 
população  inteira,  é  o  modelo  final  e  absoluto. 

Cálculo  da  estatística  PRESS 

Uma  abordagem  alternativa  para  obter  amostras  adicio¬ 
nais  para  fins  de  validação  é  empregar  a  amostra  original 
de  uma  maneira  especializada,  calculando  a  estatística 
PRESS,  uma  medida  semelhante  a  F^,  usada  para  avaliar 
a  precisão  preditiva  do  modelo  de  regressão  estimado.  Di¬ 
fere  das  abordagens  anteriores  no  sentido  de  que  não  um, 
mas  n-1  modelos  de  regressão  são  estimados.  O  proce¬ 
dimento  omite  uma  observação  na  estimação  do  modelo 
de  regressão  e  então  prevê  a  observação  omitida  com  o 
modelo  estimado.  Logo,  a  observação  não  pode  afetar 
os  coeficientes  do  modelo  usado  para  calcular  seu  valor 
previsto.  O  procedimento  é  aplicado  novamente,  omitin¬ 
do  uma  outra  observação,  estimando  um  novo  modelo  e 
fazendo  a  previsão.  Os  resíduos  para  as  observações  po¬ 
dem  então  ser  somados  para  fornecer  uma  medida  geral 
de  ajuste  preditivo. 

Comparação  de  modelos  de  regressão 

Quando  se  comparam  modelos  de  regressão,  o  critério 
mais  comum  empregado  é  o  ajuste  preditivo  geral,  ií^nos 
fornece  essa  informação,  mas  apresenta  uma  desvantagem: 
à  medida  que  mais  variáveis  são  acrescentadas,  sempre 
aumenta.  Assim,  incluindo  todas  as  variáveis  independen¬ 
tes,  jamais  encontraremos  outro  modelo  com  maior, 
mas  podemos  descobrir  que  um  número  menor  de  variá¬ 
veis  independentes  resulta  em  um  valor  quase  idêntico. 
Portanto,  para  comparar  modelos  com  diferentes  núme¬ 
ros  de  variáveis  independentes,  usamos  o  E}  ajustado.  O 
ajustado  é  igualmente  útil  na  comparação  de  modelos 
com  diferentes  conjuntos  de  dados,  uma  vez  que  faz  uma 
compensação  para  os  diferentes  tamanhos  de  amostras. 

Previsão  com  o  modelo 

As  previsões  sempre  podem  ser  feitas  aplicando  o  mode¬ 
lo  estimado  a  um  novo  conjunto  dos  valores  de  variáveis 
independentes  e  calculando  os  valores  da  variável  depen¬ 
dente.  No  entanto,  fazendo  isso,  devemos  considerar  di¬ 
versos  fatores  que  podem  ter  um  sério  impacto  na  quali¬ 
dade  das  novas  previsões: 

1.  Quando  aplicamos  o  modelo  a  uma  nova  amostra,  devemos 
lembrar  que  as  previsões  agora  têm  não  apenas  as  varia¬ 


ções  em  relação  à  amostra  original,  mas  também  aquelas  da 
amostra  recém-obtida.  Assim,  sempre  devemos  calcular  os 
intervalos  de  confiança  de  nossas  previsões  junto  com  a  es¬ 
timativa  pontual  para  ver  a  amplitude  esperada  dos  valores 
da  variável  dependente. 

2.  Devemos  estar  certos  de  que  as  condições  e  relações  me¬ 
didas  no  momento  em  que  a  amostra  original  foi  obtida 
não  mudaram  substancialmente.  Por  exemplo,  em  nosso 
exemplo  de  cartões  de  crédito,  se  a  maioria  das  empresas 
começasse  a  cobrar  maiores  taxas  por  seus  cartões,  o  uso  de 
cartões  de  crédito  poderia  mudar  substancialmente,  ainda 
que  essa  informação  não  fosse  incluída  no  modelo. 

3.  Finalmente,  não  devemos  usar  o  modelo  para  estimar  além 
da  amplitude  das  variáveis  independentes  encontradas  na 
amostra.  Por  exemplo,  em  nosso  caso  de  cartões  de  crédi¬ 
to,  se  a  maior  família  tem  seis  membros,  pode  ser  impru¬ 
dente  prever  uso  de  cartões  de  crédito  para  famílias  com 
10  membros.  Não  se  pode  assumir  que  as  relações  são  as 
mesmas  para  valores  das  variáveis  independentes  substan¬ 
cialmente  maiores  ou  menores  que  os  da  amostra  original 
de  estimação. 


ILUSTRAÇÃO  DE  UMA 
ANÁLISE  DE  REGRESSÃO 

As  questões  referentes  à  aplicação  e  interpretação  da 
análise  de  regressão  foram  discutidas  nas  seções  pre¬ 
cedentes  seguindo-se  a  estrutura  de  seis  estágios  para 
construção  de  modelo  introduzida  no  Capítulo  1  e  dis¬ 
cutida  no  presente  capítulo.  Para  fornecer  uma  ilustra¬ 
ção  das  questões  importantes  em  cada  estágio,  apresen¬ 
tamos  um  exemplo  que  detalha  a  aplicação  da  regressão 
múltipla  a  um  problema  de  pesquisa  especificado  pela 
HBAT.  O  Capítulo  1  introduziu  uma  pesquisa  na  qual 
a  HBAT  obteve  várias  medidas  em  uma  enquete  entre 
clientes.  Para  demonstrar  o  uso  da  regressão  múltipla, 
mostramos  os  procedimentos  usados  por  pesquisadores 
para  tentar  prever  satisfação  de  clientela  dos  indivíduos 
na  amostra  com  um  conjunto  de  13  variáveis  indepen¬ 
dentes. 

Estágio  1:  Objetivos  da  regressão  múltipla 

A  administração  da  HBAT  há  muito  tem  se  interessado 
por  previsões  mais  precisas  do  nível  de  satisfação  de  seus 
clientes.  Se  bem  sucedida,  isso  forneceria  uma  melhor 
fundamentação  para  seus  esforços  de  marketing.  Para 
este  propósito,  pesquisadores  da  HBAT  propuseram  que 
análise  de  regressão  múltipla  deveria  ser  tentada  para 
prever  a  satisfação  de  clientes  com  base  em  suas  percep¬ 
ções  do  desempenho  de  HBAT.  Além  de  encontrar  um 
meio  de  prever  com  precisão  a  satisfação,  os  pesquisa¬ 
dores  também  estavam  interessados  na  identificação  dos 
fatores  que  conduzem  à  satisfação  aumentada  para  uso 
em  campanhas  diferenciadas  de  marketing. 
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Para  aplicar  o  procedimento  de  regressão,  os  pesquisa¬ 
dores  selecionaram  satisfação  do  cliente  (Aj,)  como  a 
variável  dependente  (L)  a  ser  prevista  por  variáveis  in¬ 
dependentes  que  representavam  percepções  da  atuação 
da  HBAT.  As  13  variáveis  a  seguir  foram  incluídas  como 
independentes: 

Ag  Qualidade  do  produto 
X-i  Comércio  eletrônico 
Xg  Suporte  técnico 
Xg  Solução  de  reclamação 
Ajq  Anúncio 
Ajj  Linha  do  produto 
Aj2  Imagem  da  equipe  de  venda 
Preço  competitivo 
Garantia  e  reclamações 
Ajj  Novos  produtos 
Ajg  Encomenda  e  cobrança 
Flexibilidade  de  preço 
Ajg  Velocidade  de  entrega 


A  relação  entre  as  13  variáveis  independentes  e  a  satis¬ 
fação  do  cliente  foi  considerada  estatística,  não  funcional, 
porque  envolvia  percepções  de  atuação  e  poderia  ter  ní¬ 
veis  de  erro  de  medida. 

Estágio  2:  Planejamento  de  pesqnisa  de 
nma  análise  de  regressão  múltipla 

A  pesquisa  da  HBAT  obteve  100  respondentes  de  sua  base 
de  clientes.  Todos  deram  respostas  completas,  que  resulta¬ 
ram  em  100  observações  disponíveis  para  análise.  A  pri¬ 
meira  questão  a  ser  respondida  referente  ao  tamanho  da 
amostra  é  o  nível  de  relação  (R^)  que  pode  ser  detectado 
em  conformidade  com  a  análise  de  regressão  proposta. 


A  Tabela  4-7  indica  que  a  amostra  de  100,  com  13  variá¬ 
veis  potencialmente  independentes,  é  capaz  de  detectar 
relações  com  valores  de  aproximadamente  23%  a  um 
poder  de  0,80  com  o  nível  de  significância  fixado  em  0,01. 
Se  o  nível  de  significância  for  relaxado  para  0,05,  então 
a  análise  identificará  relações  que  explicam  em  torno  de 
18%  da  variância.  A  amostra  de  100  observações  tam¬ 
bém  atende  à  diretriz  de  proporção  mínima  de  observa¬ 
ções  por  variáveis  independentes  (5:1)  com  uma  propor¬ 
ção  real  de  7:1  (100  observações  com  13  variáveis). 


A  análise  de  regressão  proposta  foi  considerada  sufi¬ 
ciente  para  identificar  não  apenas  relações  estatisticamente 
significantes,  mas  também  relações  que  tinham  significân¬ 
cia  gerencial.  Apesar  de  pesquisadores  HBAT  poderem 


estar  razoavelmente  certos  de  que  eles  não  estão  em  pe¬ 
rigo  de  superajustar  a  amostra,  eles  ainda  devem  validar 
os  resultados,  se  possível,  para  garantir  a  generalidade  das 
descobertas  para  a  base  inteira  de  clientes,  particularmen¬ 
te  quando  usarem  uma  técnica  de  estimação  stepwise. 

Estágio  3:  Suposições  em  análise 
de  regressão  múltipla 

Atender  às  suposições  da  análise  de  regressão  é  essencial 
para  garantir  que  os  resultados  obtidos  são  verdadeiramen¬ 
te  representativos  da  amostra  e  que  obtemos  os  melhores 
resultados  possíveis.  Quaisquer  violações  sérias  das  suposi¬ 
ções  devem  ser  detectadas  e  corrigidas,  se  possível.  A  análi¬ 
se  para  garantir  que  a  pesquisa  está  atendendo  às  suposições 
básicas  da  análise  de  regressão  envolve  dois  passos:  (1)  tes¬ 
tar  as  variáveis  individuais  dependente  e  independentes  e 
(2)  testar  a  relação  geral  após  a  estimação  do  modelo.  Esta 
seção  aborda  a  avaliação  de  variáveis  individuais.  A  relação 
geral  será  examinada  depois  que  o  modelo  for  estimado. 

As  três  suposições  a  serem  abordadas  para  as  variáveis 
individuais  são  linearidade,  variância  constante  (homoce- 
dasticidade)  e  normalidade.  Para  os  propósitos  da  análi¬ 
se  de  regressão,  resumimos  os  resultados  encontrados  no 
Capítulo  2  detalhando  o  exame  das  variáveis  dependente 
e  independentes. 


Primeiro,  os  diagramas  de  dispersão  das  variáveis  in¬ 
dividuais  não  indicaram  relações  não-lineares  entre  a 
variável  dependente  e  as  independentes.  Qs  testes  para 
heteroscedasticidade  descobriram  que  apenas  duas  va¬ 
riáveis  {Xg  e  X^i)  violaram  ligeiramente  essa  suposição, 
não  necessitando  qualquer  ação  corretiva.  Finalmente, 
nos  testes  de  normalidade,  seis  variáveis  {Xg,  X-j,  Ajj,  A^, 
Ajg  e  Ajy)  demonstraram  ter  violado  os  testes  estatísti¬ 
cos.  Para  todas  as  variáveis,  exceto  uma  (Ajj),  transfor¬ 
mações  eram  ações  corretivas  suficientes. 


Apesar  de  a  análise  de  regressão  ter  se  mostrado  bas¬ 
tante  robusta  mesmo  quando  a  suposição  de  normalidade 
é  violada,  os  pesquisadores  devem  estimar  a  análise  de  re¬ 
gressão  com  as  variáveis  originais  e  também  com  as  trans¬ 
formadas  para  avaliar  as  conseqüências  da  não-normalida- 
de  das  variáveis  independentes  sobre  a  interpretação  dos 
resultados.  Para  este  fim,  as  variáveis  originais  são  usadas 
primeiramente,  e  resultados  posteriores  para  as  variáveis 
transformadas  são  mostrados  para  comparação. 

Estágio  4:  Estimação  do  modelo  de  regressão 
e  avaliação  do  ajuste  geral  do  modelo 

Com  a  análise  de  regressão  especificada  em  termos  de  va¬ 
riáveis  dependente  e  independentes,  a  amostra  considera- 
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da  adequada  para  os  objetivos  do  estudo  e  as  suposições 
avaliadas  para  as  variáveis  individuais,  o  processo  de  cons¬ 
trução  do  modelo  agora  segue  para  a  estimação  do  modelo 
de  regressão  e  a  avaliação  do  ajuste  geral  do  modelo.  Para 
fins  de  ilustração,  o  procedimento  stepwise  é  empregado 
para  selecionar  variáveis  para  inclusão  na  variável  estatís¬ 
tica  de  regressão.  Depois  que  o  modelo  de  regressão  for 
estimado,  a  variável  estatística  será  avaliada  em  relação  às 
suposições  da  análise  de  regressão.  Finalmente,  as  obser¬ 
vações  serão  examinadas  para  determinar  se  alguma  ob¬ 
servação  deve  ser  considerada  influente.  Todas  essas  ques¬ 
tões  são  discutidas  nas  seções  que  se  seguem. 

Estimação  stepwise;  seleção 
da  primeira  variável 

O  procedimento  de  estimação  stepwise  maximiza  a  variân¬ 
cia  explicada  incremental  em  cada  passo  da  construção  do 
modelo.  No  primeiro  passo,  a  mais  elevada  correlação  bi- 
variada  (também  a  mais  elevada  correlação  parcial,  uma 
vez  que  nenhuma  outra  variável  está  na  equação)  será  sele¬ 
cionada.  O  processo  para  o  exemplo  HBAT  segue  abaixo. 


A  Tabela  4-10  mostra  todas  as  correlações  entre  as  13 
variáveis  independentes  e  suas  correlações  com  a  de¬ 
pendente  (Ajg,  Satisfação  do  cliente).  O  exame  da  ma¬ 
triz  de  correlação  (olhando-se  a  primeira  coluna)  indica 
que  a  solução  de  reclamação  (Xg)  tem  a  mais  elevada 
correlação  bivariada  com  a  variável  dependente  (0,603). 
O  primeiro  passo  é  construir  uma  equação  de  regressão 
usando  apenas  essa  variável  independente.  Os  resulta¬ 
dos  deste  primeiro  passo  são  exibidos  na  Tabela  4-11. 


Ajuste  geral  do  modelo.  A  partir  da  Tabela  4-11  o  pes¬ 
quisador  pode  abordar  questões  concernentes  ao  ajuste 
geral  do  modelo,  bem  como  à  estimação  stepwise  do  mo¬ 
delo  de  regressão. 


R  múltiplo.  R  múltiplo  é  o  coeficiente  de  correlação 
(neste  passo)  para  a  regressão  simples  de  A,  e  a  variável 
dependente.  Não  tem  sinal  negativo  ou  positivo  porque, 
em  regressão  múltipla,  os  sinais  das  variáveis  individuais 
podem  variar,  e  assim  este  coeficiente  reflete  apenas  o 
grau  de  associação.  No  primeiro  passo  da  estimação  ste¬ 
pwise,  o  R  múltiplo  coincide  com  a  correlação  bivariada 
(0,603),  pois  a  equação  contém  somente  uma  variável. 

R  quadrado.  R  quadrado  {R^)  é  o  coeficiente  de  cor¬ 
relação  ao  quadrado  (0,603^  =  0,364),  também  conhecido 
como  o  coeficiente  de  determinação.  Esse  valor  indica  o 
percentual  de  variação  total  de  Y  (Ajg,  Satisfação  do  clien¬ 
te)  explicado  pelo  modelo  de  regressão  consistindo  de  Xg. 

Erro  padrão  da  estimativa.  O  erro  padrão  da 
estimativa  é  uma  outra  medida  da  precisão  de  nossas 


previsões.  É  a  raiz  quadrada  da  soma  dos  quadrados 
dos  erros  dividida  pelo  número  de  graus  de  liberdade, 
também  representada  pela  raiz  quadrada  do 
(^89, 45  98  =0,955).  Representa  uma  estimativa  do 
desvio-padrão  dos  valores  reais  dependentes  em  torno  da 
reta  de  regressão;  ou  seja,  é  uma  medida  de  variação  em 
torno  da  reta  de  regressão.  O  erro  padrão  da  estimativa 
também  pode  ser  visto  como  o  desvio-padrão  dos  erros 
de  previsão,  de  modo  que  se  torna  uma  medida  para  ava¬ 
liar  o  tamanho  absoluto  do  erro  de  previsão.  Também  é 
usado  para  estimar  o  tamanho  do  intervalo  de  confiança 
para  as  previsões.  Ver  Neter  etal.  [11]  para  detalhes  refe¬ 
rentes  a  esse  procedimento. 

ANOVA  e  Razão  F.  A  análise  ANO  VA  fornece  o 
teste  estatístico  para  o  ajuste  geral  do  modelo  em  termos 
da  razão  F.  A  soma  total  de  quadrados  (51,178  -r  89,450 
=  140,628)  é  o  erro  quadrado  que  ocorreria  se  usássemos 
apenas  a  média  de  Y  para  prever  a  variável  dependen¬ 
te.  O  uso  dos  valores  de  Xg  reduz  esse  erro  em  36,4% 
(51,178/140,628).  Tal  redução  é  considerada  estatistica¬ 
mente  significante  com  uma  razão  Fde  56,070  e  um  nível 
de  significância  de  0,000. 


Variáveis  na  equação  (passo  1).  No  passo  1,  uma  úni¬ 
ca  variável  independente  (Xg)  é  utilizada  para  calcular  a 
equação  de  regressão  para  prever  a  variável  dependente. 
Para  cada  variável  na  equação,  diversas  medidas  precisam 
ser  definidas:  o  coeficiente  de  regressão,  o  erro  padrão  do 
coeficiente,  o  valor  t  de  variáveis  na  equação,  e  os  diagnó- 
ticos  de  colinearidade  (tolerância  e  VIF). 

Coeficientes  de  regressão  (B  e  Beta).  O  coeficiente 
de  regressão  (b)  e  o  coeficiente  padronizado  ((3)  refle¬ 
tem  a  mudança  na  medida  dependente  para  cada  unida¬ 
de  de  mudança  na  variável  independente.  Comparação 
entre  coeficientes  de  regressão  viabiliza  uma  avaliação 
relativa  da  importância  de  cada  variável  no  modelo  de 
regressão. 


O  valor  0,595  é  o  coeficiente  de  regressão  (bg)  para  a  variá¬ 
vel  independente  (A,).  O  valor  previsto  para  cada  obser¬ 
vação  é  o  intercepto  (3,680)  mais  o  coeficiente  de  regres¬ 
são  (0,595)  vezes  seu  valor  da  variável  independente  (F  = 
3,680  -I-  0,595Ag).  O  coeficiente  de  regressão  padronizado, 
ou  valor  beta,  de  0,603  é  o  valor  calculado  a  partir  dos  da¬ 
dos  padronizados.  Com  apenas  uma  variável  independen¬ 
te,  o  coeficiente  beta  ao  quadrado  se  iguala  ao  coeficiente 
de  determinação.  O  valor  beta  permite  comparar  o  efeito 
de  Xg  sobre  Y  com  o  efeito  sobre  Y  de  outras  variáveis 
independentes  em  cada  estágio,  pois  esse  valor  reduz  o 
coeficiente  de  regressão  a  uma  unidade  comparável,  o  nú¬ 
mero  de  desvios-padrão.  (Note  que  neste  momento  não 
dispomos  de  outras  variáveis  para  comparação.) 
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TABELA  4-1 1  Exemplo  de  resultado:  passo  1  do  exemplo  de  regressão  múltipla  da  HBAT 


Passo  1  -  Variável  introduzida:  X,  Solução  de  reclamação 


R  múltiplo 

0,603 

Coeficiente  de  determinação  (R®) 

0,364 

Ff  ajustado 

0,357 

Erro  padrão  da  estimativa 

0,955 

Anãlise  de  variância 

Soma  de 
quadrados 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

51,178 

1 

51,178 

56,070 

0,000 

Resíduo 

89,450 

98 

0,913 

Total 

140,628 

99 

Variãveis  introduzidas  no  modelo  de  regressão 

Coeficientes  de  regressão 

Significância 

estatística 

Correiações 

Estatísticas  de 
coiinearidade 

Variáveis  introduzidas 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parcial 

Semi- 

parcial 

Tolerância  VIF 

(Constante) 

Xg  Solução  de  reclamação 

3,680 

0,595 

0,443 

0,079 

0,603 

8,310 

7,488 

0,000 

0,000 

0,603 

0,603 

0,603 

1 ,000  1 ,000 

Variãveis  fora  do  modelo  de  regressão 

Significância 

Estatísticas  de 

estatística 

coiinearidade 

Correlação 

Beta 

t 

Sig. 

parcial 

Tolerância 

VIF 

><■6 

Qualidade  do  produto 

0,427 

6,193 

0,000 

0,532 

0,989 

1,011 

Comércio  eletrônico 

0,202 

2,553 

0,012 

0,251 

0,980 

1,020 

><■8 

Suporte  técnico 

0,055 

0,675 

0,501 

0,068 

0,991 

1,009 

Anúncio 

0,193 

2,410 

0,018 

0,238 

0,961 

1,040 

Linha  do  produto 

0,309 

3,338 

0,001 

0,321 

0,685 

1,460 

X,, 

Imagem  da  equipe  de  venda 

0,382 

5,185 

0,000 

0,466 

0,947 

1,056 

Preço  competitivo 

-0,133 

-1 ,655 

0,101 

-0,166 

0,984 

1,017 

Garantia  e  reclamações 

0,095 

1,166 

0,246 

0,118 

0,980 

1,020 

Novos  produtos 

0,035 

0,434 

0,665 

0,044 

0,996 

1,004 

^16 

Encomenda  e  cobrança 

0,153 

1,241 

0,218 

0,125 

0,427 

2,341 

Flexibilidade  de  preço 

-0,216 

-2,526 

0,013 

-0,248 

0,844 

1,184 

>^18 

Velocidade  de  entrega 

0,219 

1,371 

0,173 

0,138 

0,252 

3,974 

Erro  padrão  do  coeficiente.  O  erro  padrão  do  coefi¬ 
ciente  de  regressão  é  uma  estimativa  do  quanto  que  o  co¬ 
eficiente  de  regressão  irá  variar  entre  amostras  do  mesmo 
tamanho  tomadas  da  mesma  população.  De  uma  maneira 
simples,  é  o  desvio  padrão  das  estimativas  de  ò,  ao  longo 
de  múltiplas  amostras.  Se  tomássemos  múltiplas  amostras 
de  mesmo  tamanho  da  mesma  população  e  as  usássemos 
para  calcular  a  equação  de  regressão,  o  erro  padrão  seria 
uma  estimativa  de  quanto  o  coeficiente  de  regressão  iria 
variar  de  amostra  para  amostra.  Um  erro  padrão  menor 
implica  uma  previsão  mais  confiável  e,  portanto,  interva¬ 
los  de  confiança  menores. 


O  erro  padrão  de  bg  é  0,079,  denotando  que  o  intervalo  de 
confiança  de  95%  para  bg  seria  de  0,595  ±  (1,96  x  0,079), 
ou  variando  de  um  mínimo  de  0,44  a  um  máximo  de  0,75. 
O  valor  de  bg  dividido  pelo  erro  padrão  (0,595/0,079  = 
7,488)  é  o  valor  t  calculado  para  um  teste  t  da  hipótese  bg 
=  0  (ver  a  discussão  a  seguir). 


Valor  t  de  variáveis  na  equação.  O  valor  t  de  variá¬ 
veis  na  equação,  como  já  calculado,  mede  a  significância 
da  correlação  parcial  da  variável  refletida  no  coeficiente 
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de  regressão.  Como  tal,  ele  indica  se  o  pesquisador  pode 
confiantemente  dizer,  com  um  nível  estabelecido  de  erro, 
que  o  coeficiente  não  é  nulo.  Valores  f  podem  ser  dados 
neste  estágio  ao  invés  de  valores  t.  Eles  são  diretamente 
comparáveis,  pois  o  valor  í  é  aproximadamente  a  raiz  qua¬ 
drada  do  valor  F. 

O  valor  t  é  também  particularmente  útil  no  procedimen¬ 
to  stepwise  (ver  Figura  4-7)  para  ajudar  a  determinar  se  al¬ 
guma  variável  deve  ser  descartada  da  equação  uma  vez  que 
outra  variável  independente  tenha  sido  acrescentada.  O  ní¬ 
vel  calculado  de  significância  é  comparado  com  o  nível  de 
referência  estabelecido  pelo  pesquisador  para  descartar  a 
variável.  Em  nosso  exemplo,  estabelecemos  um  nível  de  0,10 
para  a  eliminação  de  variáveis  da  equação.  O  valor  crítico 
para  um  nível  de  significância  de  0,10  com  98  graus  de  liber¬ 
dade  é  1,658.  A  medida  que  mais  variáveis  são  adicionadas 
à  equação  de  regressão,  cada  variável  é  checada  para  que  se 
examine  se  a  mesma  ainda  está  dentro  dessa  referência.  Se 
cair  fora  (significância  maior  do  que  0,10),  é  eliminada  da 
equação  de  regressão,  e  o  modelo  é  novamente  estimado. 


Em  nosso  exemplo,  o  valor  t  (como  obtido  pela  divisão 
do  coeficiente  de  regressão  pelo  erro  padrão)  é  7,488, 
que  é  estatisticamente  significante  no  nível  0,000.  Ele  dá 
ao  pesquisador  um  elevado  nível  de  segurança  de  que  o 
coeficiente  não  é  igual  a  zero  e  pode  ser  avaliado  como 
um  preditor  de  satisfação  de  cliente. 


Correlações.  Três  diferentes  correlações  são  dadas 
como  uma  ajuda  na  avaliação  do  processo  de  estimação.  A 
correlação  de  ordem  zero  é  a  correlação  bivariada  simples 
entre  a  variável  independente  e  a  dependente.  A  correla¬ 
ção  parcial  denota  o  efeito  preditivo  incremental  de  uma 
variável  independente  sobre  a  dependente  controlando 
outras  variáveis  no  modelo  de  regressão.  Essa  medida  é 
empregada  para  julgar  qual  variável  é  adicionada  a  seguir 
em  métodos  de  busca  seqüencial.  Finalmente,  a  correla¬ 
ção  semíparcíal  corresponde  ao  efeito  único  atribuível  a 
cada  variável  independente. 


Para  o  primeiro  passo  em  uma  solução  stepwise,  todas  as 
três  correlações  são  idênticas  (0,603)  pois  nenhuma  outra 
variável  está  na  equação.  A  medida  que  variáveis  forem 
acrescentadas,  esses  valores  se  tornarão  diferentes,  cada  um 
refletindo  suas  perspectivas  sobre  a  contribuição  de  cada  va¬ 
riável  independente  ao  modelo  de  regressão. 


Estatística  de  colinearidade.  Ambas  as  medidas 
de  colinearidade  (tolerância  e  VIF)  são  dadas  para  for¬ 


necerem  uma  perspectiva  sobre  o  impacto  de  colineari¬ 
dade  nas  variáveis  independentes  da  equação  de  regres¬ 
são.  Lembre-se  que  o  valor  de  tolerância  é  a  quantia  de 
capacidade  preditiva  de  uma  variável  independente  que 
não  é  prevista  pelas  demais  variáveis  independentes  na 
equação.  Assim,  ele  representa  a  variância  única  rema¬ 
nescente  para  cada  variável.  O  VIF  é  o  inverso  do  valor 
de  tolerância. 


No  caso  de  uma  única  variável  no  modelo  de  regressão, 
a  tolerância  é  1,00,  indicando  que  é  totalmente  não  afe¬ 
tada  por  outras  variáveis  independentes  (como  deveria 
ser,  uma  vez  que  é  a  única  variável  no  modelo).  Além 
disso,  o  VIF  é  1,00,  ambos  os  valores  indicando  uma 
completa  falta  de  multicolinearidade. 


Variáveis  fora  da  equação.  Com  Xg  incluída  na  equação 
de  regressão,  12  outras  variáveis  potencialmente  indepen¬ 
dentes  permanecem  para  serem  incluídas  de  modo  a  me¬ 
lhorar  a  previsão  da  variável  dependente.  Para  tais  valo¬ 
res,  quatro  tipos  de  medidas  estão  disponíveis  para  avaliar 
sua  potencial  contribuição  ao  modelo  de  regressão:  cor¬ 
relações  parciais,  medidas  de  colinearidade,  coeficientes 
padronizados  (Beta)  e  valores  t. 

Medidas  de  correlação  parcial  e  colinearidade.  A 

correlação  parcial  é  uma  medida  da  variação  em  Y  que 
pode  ser  explicada  por  conta  de  cada  variável  adicional, 
controlando  as  variáveis  já  presentes  na  equação  (apenas 
Xg  no  passo  1).  Como  tais,  os  métodos  de  busca  seqüen¬ 
cial  usam  esse  valor  para  denotar  o  próximo  candidato  à 
inclusão.  Se  a  variável  com  a  maior  correlação  parcial  ex¬ 
ceder  a  referência  de  significância  estatística  exigida  para 
inclusão,  será  adicionada  ao  modelo  de  regressão  no  pró¬ 
ximo  passo. 

A  correlação  parcial  representa  a  correlação  de  cada 
variável  não  presente  no  modelo  com  a  porção  inexplica- 
da  da  variável  dependente.  Dessa  forma,  a  contribuição 
da  correlação  parcial  (o  quadrado  da  correlação  parcial) 
é  aquele  percentual  da  variância  não-explicada  que  passa 
a  ser  explicada  com  o  acréscimo  desta  variável  indepen¬ 
dente.  Considere  que  as  variáveis  no  modelo  de  regressão 
já  explicam  60%  da  medida  dependente  (R^  =  0,60  com 
variância  não-explicada  igual  a  0,40).  Se  uma  correlação 
parcial  tem  um  valor  de  0,5,  então  a  variância  explicada 
extra  correspondente  é  o  quadrado  da  correlação  parcial 
vezes  a  quantia  inexplicada  de  variância.  Neste  exemplo 
simples,  temos  0,5^  x  0,40,  ou  10%.  Acrescentando  essa 
variável,  esperamos  que  o  valor  aumente  10%  (de  0,60 
para  0,70). 
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Para  nosso  exemplo,  os  valores  de  correlações  parciais 
variam  de  um  máximo  de  0,532  a  um  mínimo  de  0,044. 

com  o  maior  valor  de  0,532,  deveria  ser  a  próxima 
variável  a  entrar  se  for  descoberto  que  tal  correlação 
parcial  é  estatisticamente  significante  (ver  a  próxima  se¬ 
ção).  É  interessante  observar,  porém,  que  Ag  tinha  ape¬ 
nas  a  sexta  maior  correlação  bivariada  com  X^g.  Por  que 
ela  foi  a  segunda  variável  a  entrar  na  equação  stepwise, 
à  frente  das  variáveis  com  maiores  correlações?  As  va¬ 
riáveis  com  a  segunda,  terceira  e  quarta  maior  correla¬ 
ção  com  eram  X^g  (0,577),  (0,551)  e  Ajg  (0,522). 

Ambas  Ajg  e  Ajg  tinham  elevadas  correlações  com  A,, 
refletidas  em  seus  baixos  valores  de  tolerância  de  0,252 
e  0,427,  respectivamente.  Deve  ser  notado  que  esse  ele¬ 
vado  nível  de  multicolinearidade  não  é  inesperado,  pois 
essas  três  variáveis  (Ag,  Ajg  e  Ajg)  constituem  o  primeiro 
fator  obtido  no  Capítulo  3.  Ajj,  apesar  de  não  ter  feito 
parte  deste  fator,  está  altamente  correlacionada  com  Ag 
(0,561)  na  medida  em  que  a  tolerância  é  de  apenas  0,685. 
Finalmente,  A^j,  a  quinta  maior  correlação  bivariada 
com  Ajg,  tem  uma  correlação  com  Ag  de  apenas  0,230, 
mas  que  foi  suficiente  para  tornar  a  correlação  parcial 
ligeiramente  menor  do  que  a  de  Ag.  A  correlação  de  Ag  e 
Ag  de  apenas  0,106  resultou  em  uma  tolerância  de  0,989 
e  transformou  a  correlação  bivariada  de  0,486  em  uma 
correlação  parcial  de  0,532,  a  qual  era  a  mais  alta  entre 
todas  as  demais  12  variáveis. 

Se  Ag  for  acrescentada,  então  o  valor  deve  aumen¬ 
tar  o  equivalente  ao  quadrado  da  correlação  parcial  ve¬ 
zes  a  variância  não-explicada  (variação  em  =  0,532^  x 
0,636  =  0,180).  Como  36,4%  já  foi  explicado  por  Ag,  Ag 
pode  explicar  apenas  18,0%  da  variância  remanescente. 
Um  diagrama  de  Venn  ilustra  este  conceito. 

A  área  sombreada  de  Ag  como  uma  proporção  da 
área  sombreada  de  Y  representa  a  correlação  parcial  de 
Ag  com  Y  dada  Ag.  A  área  sombreada,  como  uma  pro¬ 
porção  de  Y,  denota  a  variância  incremental  explicada 
por  Ag  dado  que  A,  já  está  na  equação. 


Note  que  variância  total  explicada  (todas  as  áreas 
que  se  sobrepõem  para  Y)  só  não  é  igual  às  áreas  asso¬ 
ciadas  com  as  correlações  parciais  de  Ag  e  Ag.  Parte  da 
explicação  é  proveniente  dos  efeitos  compartilhados  de 
Ag  e  Ag.  Os  efeitos  compartilhados  são  denotados  pela 
seção  média  onde  essas  duas  variáveis  se  sobrepõem  en¬ 
tre  si  e  com  Y.  O  cálculo  da  variância  única  associada 


com  o  acréscimo  de  Ag  pode  também  ser  determinado 
através  da  correlação  semiparcial,  como  descrito  no 
Adendo  4.1. 

Coeficientes  padronizados.  Para  cada  variável  fora 
da  equação,  o  coeficiente  padronizado  (Beta)  que  a  va¬ 
riável  teria  se  fosse  incorporada  à  mesma  é  calculado. 
Desse  modo,  o  pesquisador  pode  avaliar  a  magnitude  re¬ 
lativa  desta  variável  se  acrescentada  àquelas  já  presentes 
na  equação.  Além  disso,  isso  permite  uma  avaliação  de 
significância  prática  em  termos  de  poder  preditivo  relati¬ 
vo  da  variável  adicionada. 


Na  Tabela  4-11,  percebemos  que  Ag,  a  variável  com  mais 
alta  correlação  parcial,  tem  também  o  mais  alto  coefi¬ 
ciente  Beta  se  adicionada.  Ainda  que  a  magnitude  de 
0,427  seja  substancial,  pode  também  ser  comparada  com 
o  beta  para  a  variável  agora  no  modelo  (Ag  com  um  beta 
de  0,603),  indicando  que  Ag  fará  uma  contribuição  subs¬ 
tancial  à  explicação  do  modelo  de  regressão,  bem  como  à 
sua  capacidade  preditiva. 


Valores  t  de  variáveis  fora  da  equação.  O  valor  t 
mede  a  significância  das  correlações  parciais  para  variá¬ 
veis  fora  da  equação.  Elas  são  calculadas  como  uma  razão 
da  soma  adicional  de  quadrados  explicada  pela  inclusão 
de  uma  variável  particular  com  a  soma  de  quadrados  após 
acrescentar  aquela  mesma  variável.  Se  esse  valor  t  não  ex¬ 
ceder  um  nível  de  significância  especificado  (p.ex.,  0,05),  a 
variável  não  poderá  entrar  na  equação.  O  valor  t  tabelado 
para  um  nível  de  significância  de  0,05  com  97  graus  de  li¬ 
berdade  é  1,98. 


Olhando  para  a  coluna  de  valores  t  na  Tabela  4-11,  no¬ 
tamos  que  seis  variáveis  (Ag,  A,,  Ajg,  Ajj,  Ajje  X^j)  ex¬ 
cedem  esse  valor  e  são  candidatas  à  inclusão.  Apesar 
de  serem  todas  significantes,  a  variável  adicionada  será 
aquela  com  a  maior  correlação  parcial.  Devemos  obser¬ 
var  que  estabelecer  a  referência  de  significância  estatís¬ 
tica  antes  que  uma  variável  seja  adicionada  inviabiliza  o 
acréscimo  de  variáveis  sem  significância,  ainda  que  elas 
aumentem  o  R^  geral. 


Olhando  adiante.  Com  o  primeiro  passo  do  procedi¬ 
mento  stepwise  completado,  a  tarefa  final  é  avaliar  as 
variáveis  fora  da  equação  e  determinar  se  outra  variável 
atende  aos  critérios  e  se  pode  ser  acrescentada  ao  mo¬ 
delo  de  regressão.  Como  anteriormente  observado,  a 
correlação  parcial  deve  ser  grande  o  bastante  para  ser 
estatisticamente  significante  no  nível  especificado  (geral¬ 
mente  0,05).  Se  duas  ou  mais  variáveis  atendem  tal  cri¬ 
tério,  então  a  variável  com  a  maior  correlação  parcial  é 
escolhida. 
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Como  descrito  anteriormente,  (Qualidade  do  produ¬ 
to)  apresenta  a  maior  correlação  parcial  neste  estágio, 
mesmo  que  outras  quatro  variáveis  tenham  correlações 
bivariadas  maiores  com  a  variável  dependente.  Em  cada 
caso,  multicolinearidade  com  X^,  adicionada  no  primeiro 
passo,  fez  com  que  as  correlações  parciais  diminuíssem 
abaixo  daquela  de  X^. 

Sabemos  que  uma  porção  significativa  da  variância  na 
variável  dependente  é  explicada  por  Xg,  mas  o  procedi¬ 
mento  stepwise  indica  que  se  adicionamos  X^  ao  maior  co¬ 
eficiente  de  correlação  parcial  com  a  variável  dependente 
e  um  valor  t  significante  no  nível  0,05,  faremos  um  aumen¬ 
to  significante  no  poder  preditivo  do  modelo  de  regressão 
geral.  Assim,  podemos  agora  olhar  o  novo  modelo  usan¬ 
do  ambas  Xg  e  X^. 


Estimação  stepwise:  adição  de 
uma  segunda  variável  (Xg) 

O  próximo  passo  em  uma  estimação  stepwise  é  checar  e  des¬ 
cartar  qualquer  variável  na  equação  que  agora  fique  abaixo 
do  valor  de  referência  de  significância,  e,  uma  vez  feito  isso, 
adicionar  a  variável  com  a  mais  alta  correlação  parcial  esta¬ 
tisticamente  significante.  A  seção  a  seguir  detalha  o  recém 
formado  modelo  de  regressão  e  as  questões  referentes  a  seu 
ajuste  geral,  os  coeficientes  estimados,  o  impacto  de  multico¬ 
linearidade  e  a  identificação  de  uma  variável  a  acrescentar 
no  próximo  passo. 


Ajuste  geral  do  modelo.  Como  descrito  na  seção  ante¬ 
rior,  Xj  foi  a  próxima  variável  a  ser  adicionada  ao  modelo 
de  regressão  no  procedimento  stepwise.  Os  valores  múlti¬ 
plos  R  e  aumentaram  com  a  adição  de  X^  (ver  Tabela 
4-12).  O  R^  aumentou  em  18,0%,  a  quantia  que  previmos 
quando  examinamos  o  coeficiente  de  correlação  parcial  de 
Xg  de  0,532,  multiplicando  os  63,6%  de  variação  que  não 
era  explicada  depois  do  passo  1,  pela  correlação  parcial  ao 
quadrado  (63,6  x  0,532^  =  18,0).  Em  seguida,  dos  63,3%* 
inexplicados  com  Xg,  (0,532)^  dessa  variância  foi  explicada 
pelo  acréscimo  de  X^,  levando  a  uma  variância  total  expli¬ 
cada  (R^)  de  0,544.  O  i?’  ajustado  também  aumentou  para 
0,535,  e  o  erro  padrão  da  estimativa  diminuiu  de  0,955  para 
0,813.  Ambas  as  medidas  demonstram  também  a  melhora 
no  ajuste  geral  do  modelo. 

Coeficientes  estimados.  O  coeficiente  de  regressão  para 
Xj  é  0,364  e  o  peso  beta  é  0,427.  A  despeito  de  não  ser 
tão  grande  quanto  o  beta  para  Xg  (0,558),  Xg  ainda  tem 
um  substancial  impacto  no  modelo  de  regressão  geral.  O 
coeficiente  é  estatisticamente  significante,  e  a  multicoline¬ 
aridade  é  mínima  com  Xg  (como  descrito  na  seção  ante¬ 
rior).  Logo,  tolerância  é  bastante  aceitável  com  um  valor 


*  N.  de  R.  T.:  A  frase  correta  seria  “dos  63%  inexplicados  com  X,”. 


de  0,989  indicando  que  somente  1,1%  de  qualquer  variável 
é  explicado  pela  outra. 

Impacto  de  multicolinearidade.  A  falta  de  multicolineari¬ 
dade  resulta  em  pouca  mudança  para  o  valor  de  bg  (0,550) 
ou  o  beta  de  Xg  (0,558)  em  relação  ao  passo  1.  Também 
indica  que  as  variáveis  Xg  e  Xg  são  relativamente  indepen¬ 
dentes  (a  correlação  simples  entre  as  duas  é  de  0,106).  Se 
o  efeito  de  Xg  sobre  Y  fosse  totalmente  independente  do 
efeito  de  Xg,  o  coeficiente  bg  não  mudaria  de  forma  alguma. 
Os  valores  t  indicam  que  Xg  e  Xg  são  preditores  estatistica¬ 
mente  significantes  de  Y.  O  valor  t  para  Xg  é  agora  8,092, 
enquanto  no  passo  1  era  7,488.  O  valor  t  para  Xg  examina  a 
contribuição  dessa  variável  dado  que  Xg**  já  está  na  equa¬ 
ção.  Note  que  o  valor  t  para  Xg  (6,193)  é  o  mesmo  valor 
mostrado  para  Xg  no  passo  1  sob  o  título  “Variáveis  fora  do 
modelo  de  regressão”  (ver  Tabela  4-11). 


Identificação  de  variáveis  para  acrescentar.  Como  Xg  e 
Xgtêm  contribuições  significantes,  nenhuma  será  elimina¬ 
da  no  procedimento  de  estimação  stepwise.  Podemos  ago¬ 
ra  perguntar:  “há  outros  preditores  disponíveis?”.  Para 
abordar  essa  questão,  podemos  olhar  na  Tabela  4-12  sob  a 
seção  “Variáveis  fora  do  modelo  de  regressão”. 


Olhando  as  correlações  parciais  para  as  variáveis  fora 
da  equação  na  Tabela  4-12,  percebemos  que  Xjjtem  a 
maior  correlação  parcial  (0,676),  a  qual  é  também  es¬ 
tatisticamente  significante  no  nível  0,000.  Essa  variável 
explicaria  45,7%  da  variância  (0,676^=  0,457),  até  então 
inexplicada,  ou  20,9%  da  variância  total  (0,676^  x  0,456). 
Essa  substancial  contribuição  na  verdade  ultrapassa  li¬ 
geiramente  a  contribuição  incremental  de  Xg,  a  segunda 
variável  adicionada  no  procedimento  stepwise. 


Estimação  stepwise:  uma  terceira 
variável  (Xj^)  é  adicionada 

O  próximo  passo  em  uma  estimação  stepwise  segue  o  mes¬ 
mo  padrão  de  (1)  primeiro  checar  e  eliminar  variáveis  na 
equação  que  estão  abaixo  da  significância  de  referência 
e  então  (2)  adicionar  a  variável  com  a  maior  correlação 
parcial  estatisticamente  significante.  A  seção  a  seguir  de¬ 
talha  o  modelo  de  regressão  recém  formado  e  as  questões 
relativas  a  seu  ajuste  geral,  os  coeficientes  estimados,  o 
impacto  de  multicolinearidade,  e  a  identificação  de  uma 
variável  a  acrescentar  no  próximo  passo. 


Ajuste  geral  do  modelo.  Com  X^  na  equação  de  re¬ 
gressão,  os  resultados  são  exibidos  na  Tabela  4-13. 
Como  previsto,  o  valor  de  R^  aumenta  em  20,9%  (0,753 
-  0,544  =  0,209).  Além  disso,  o  R^  ajustado  aumenta  para 

(Continua) 


**  N.  de  R.  T.:  A  frase  correta  seria  “dado  que  X^já  está  na  equação”. 
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TABELA  4-12  Exemplo  de  resultado:  passo  2  do  exemplo  da  regressão  múltipla  HBAT 


Passo  2  -  Variável  incluída:  Xg  Qualidade  do  produto 


R  múltiplo 

0,738 

Coeficiente  de  determinação  (R®) 

0,544 

Ff  ajustado 

0,535 

Erro  padrão  da  estimativa 

0,813 

Análise  de  variância 

Soma  de 
quadrados 

df 

Quadrado  médio 

F 

Sign. 

Regressão 

76,527 

2 

38,263 

57,902 

0,000 

Resíduo 

64,101 

97 

0,661 

Total 

140,628 

99 

Variáveis  incluídas  no  modelo  de  regressão 

Variáveis  incluídas 

Coeficientes  de  regressão 

Significância 

estatística 

Correlações 

Estatísticas  de 
coiinearidade 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parciais 

Semi- 

parciais 

Tolerância 

VIF 

(Constante) 

1,077 

0,564 

1,909 

0,059 

Xg  Solução  de  reclamação 

0,550 

0,068 

0,558 

8,092 

0,000 

0,603 

0,635 

0,555 

0,989 

1,011 

Xg  Qualidade  do  produto 

0,364 

0,059 

0,427 

6,193 

0,000 

0,486 

0,532 

0,425 

0,989 

1,011 

Variáveis  fora  do  modelo  de  regressão 

Significância 

estatística 

Correlação 

parcial 

Estatística  de 
coiinearidade 

Beta 

t 

Sig. 

Tolerância 

VIF 

Comércio  eletrônico 

0,275 

4,256 

0,000 

0,398 

0,957 

1,045 

><■8 

Suporte  técnico 

0,018 

0,261 

0,794 

0,027 

0,983 

1,017 

^,0 

Anúncio 

0,228 

3,432 

0,001 

0,330 

0,956 

1,046 

Linha  de  produto 

0,066 

0,683 

0,496 

0,070 

0,508 

1,967 

X,g 

Imagem  da  equipe  de  venda 

0,477 

8,992 

0,000 

0,676 

0,916 

1,092 

Preço  competitivo 

0,041 

0,549 

0,584 

0,056 

0,832 

1,202 

Garantia  e  reclamações 

0,063 

0,908 

0,366 

0,092 

0,975 

1,026 

Novos  produtos 

0,026 

0,382 

0,703 

0,039 

0,996 

1,004 

Encomenda  e  cobrança 

0,129 

1,231 

0,221 

0,125 

0,427 

2,344 

Flexibilidade  de  preço 

0,084 

0,909 

0,366 

0,092 

0,555 

1,803 

>í,8 

Velocidade  de  entrega 

0,334 

2,487 

0,015 

0,246 

0,247 

4,041 

(Continuação) 

0,745  e  o  erro  padrão  da  estimativa  diminui  para  0,602. 
Novamente,  como  aconteceu  com  no  passo  anterior, 
a  nova  variável  computada  (X^^)  substancial  contri¬ 
buição  ao  ajuste  geral  do  modelo. 

Coeficientes  estimados.  A  adição  de  trouxe  um 
terceiro  preditor  estatisticamente  significante  da  satisfa¬ 
ção  de  cliente  na  equação.  O  peso  de  regressão  de  0,530 
é  completado  por  um  peso  beta  de  0,477,  o  segundo 
maior  entre  as  três  variáveis  no  modelo  (atrás  do  0,512 
de  X,). 

Impacto  de  multicolinearidade.  Vale  notar  que  mes¬ 
mo  com  a  terceira  variável  na  equação  de  regressão, 
multicolinearidade  é  mantida  mínima.  O  menor  valor 
de  tolerância  é  para  (0,916),  indicando  que  apenas 


8,4%  da  variância  de  Ajj  é  explicada  pelas  outras  duas 
variáveis.  Esse  padrão  de  variáveis  entrando  no  proce¬ 
dimento  stepwise  deve  ser  esperado,  porém,  quando 
visto  sob  a  perspectiva  da  análise  fatorial  feita  no  Capí¬ 
tulo  2.  A  partir  daqueles  resultados,  percebemos  que  as 
três  variáveis  agora  presentes  na  equação  {Xg,  X^  e  Xjj) 
eram  elementos  de  diferentes  fatores  naquela  análise. 
Como  variáveis  no  mesmo  fator  exibem  um  elevado 
grau  de  multicolinearidade,  espera-se  que  quando  uma 
variável  de  um  fator  entra  em  uma  equação  de  regres¬ 
são,  as  chances  de  outra  variável  do  mesmo  fator  en¬ 
trarem  na  equação  são  pequenas  (e  se  isso  ocorrer,  o 
impacto  das  duas  variáveis  será  reduzido  devido  à  mul¬ 
ticolinearidade). 

{Continua) 
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{Continuação) 

Olhando  adiante.  Neste  estágio  da  análise,  somente 
três  variáveis  {Xj,  e  Ajg)  têm  as  correlações  parciais 
estatisticamente  significantes  necessárias  para  inclusão 
na  equação  de  regressão.  O  que  aconteceu  com  o  poder 
preditivo  das  demais  variáveis?  Revendo  as  correlações 
bivariadas  de  cada  variável  com  X^g  na  Tabela  4-10,  po¬ 
demos  ver  que  entre  as  13  variáveis  independentes  origi¬ 
nais,  três  tinham  correlações  bivariadas  não-significantes 
com  a  variável  dependente  (Ag,  Ajj  e  A^y).  Logo,  Ajg,  A^, 
Aj4  e  Ajj  têm  correlações  bivariadas  significantes,  ainda 
que  suas  correlações  parciais  sejam  agora  não-significan- 
tes.  Para  Ajg,  a  elevada  correlação  bivariada  de  0,522  foi 
sensivelmente  reduzida  pela  alta  multicolinearidade  (va¬ 
lor  de  tolerância  de  0,426,  denota  que  menos  da  metade 
do  poder  preditivo  original  se  manteve).  Para  as  outras 
três  variáveis,  Aj^,  Ajj  e  Aj4,  suas  correlações  bivariadas 
menores  (0,305,  -0,208  e  0,178)  foram  reduzidas  pela  mul¬ 
ticolinearidade  o  suficiente  para  serem  não-significantes. 


Neste  estágio  pularemos  para  o  modelo  final  de  regres¬ 
são  e  detalharemos  a  entrada  das  duas  variáveis  finais  (A, 
e  Aji)  em  um  único  estágio  para  fins  de  concisão. 

Estimação  stepwise:  quarta  e  quinta 
variáveis  (X-^  e  X^)  são  adicionadas 

O  modelo  final  de  regressão  (Tabela  4-14)  é  o  resultado 
de  duas  variáveis  a  mais  (A,  e  Ajj)  sendo  adicionadas. 
Para  fins  de  concisão,  omitimos  os  detalhes  envolvidos  na 
entrada  de  X-,  e  concentramos  a  atenção  sobre  o  modelo 
final  de  regressão  com  ambas  as  variáveis  incluídas. 


Ajuste  geral  do  modelo.  O  modelo  final  de  regressão 
com  cinco  variáveis  independentes  (A,,  Ag,  Ajj,  A^  e  AjJ 
explica  quase  80%  da  variância  da  satisfação  de  cliente 
(Ajg).  O  ajustado  de  0,780  indica  nenhum  superajuste 
do  modelo  e  que  os  resultados  devem  ser  generalizáveis 
sob  a  perspectiva  da  proporção  de  observações  em  rela¬ 
ção  às  variáveis  na  equação  (20:1  para  o  modelo  final). 
Além  disso,  o  erro  padrão  da  estimativa  foi  reduzido 
para  0,559,  o  que  significa  que  no  nível  de  95%  de  con¬ 
fiança  (±  1,96  X  erro  padrão  da  estimativa),  a  margem  de 
erro  para  qualquer  valor  previsto  de  X^g  pode  ser  calcu¬ 
lada  como  sendo  ±1,1. 

Coeficientes  estimados.  Os  cinco  coeficientes  de  re¬ 
gressão,  mais  a  constante,  são  todos  significantes  no 
nível  0,05,  e  todos,  exceto  a  constante,  são  significantes 
no  nível  0,01.  A  próxima  seção  (estágio  5)  fornece  uma 
discussão  mais  detalhada  dos  coeficientes  de  regressão  e 
beta,  uma  vez  que  eles  se  relacionam  com  a  interpreta¬ 
ção  da  variável  estatística. 

Impacto  de  multicolinearidade.  O  impacto  de  multico¬ 
linearidade,  mesmo  entre  apenas  essas  cinco  variáveis, 


é  substancial.  Das  cinco  variáveis  na  equação,  três  delas 
(Aj2,  Xg  e  Ajj)  têm  valores  de  tolerância  menores  do  que 
0,50,  indicando  que  mais  da  metade  de  sua  variância  é 
explicada  pelas  demais  variáveis  na  equação.  Além  dis¬ 
so,  essas  variáveis  foram  as  últimas  três  a  entrarem  no 
processo  stepwise. 

Se  examinarmos  as  correlações  de  ordem  zero  (bi¬ 
variadas)  e  parciais,  podemos  ver  mais  diretamente  os 
efeitos  da  multicolinearidade.  Por  exemplo,  Aj^  tem  a 
terceira  mais  alta  correlação  bivariada  (0,551)  entre  to¬ 
das  as  13  variáveis,  ainda  que  multicolinearidade  (tole¬ 
rância  de  0,492)  a  reduza  para  uma  correlação  parcial 
de  apenas  0,135,  tornando-a  um  contribuinte  marginal 
para  a  equação  de  regressão.  Em  contraste,  Ajj  tem  uma 
correlação  bivariada  (0,500)  que  mesmo  com  elevada 
multicolinearidade  (tolerância  de  0,347)  ainda  tem  uma 
correlação  parcial  de  0,411.  Assim,  multicolinearidade 
sempre  afetará  a  contribuição  de  uma  variável  ao  mode¬ 
lo  de  regressão,  mas  deve  ser  examinada  para  se  avaliar 
o  real  grau  de  impacto. 

Se  tomarmos  uma  perspectiva  mais  ampla,  as  variá¬ 
veis  incluídas  entrando  na  equação  de  regressão  corres¬ 
pondem  quase  exatamente  aos  fatores  derivados  no  Ca¬ 
pítulo  3.  Ag  e  Ag  são  elementos  de  fatores  distintos,  com 
multicolinearidade  reduzindo  as  correlações  parciais  de 
outros  membros  desses  fatores  a  um  nível  não-signifi- 
cante.  Ajj  e  A,  são  ambos  membros  de  um  terceiro  fator, 
mas  multicolinearidade  provocou  uma  mudança  no  sinal 
do  coeficiente  estimado  para  A,  (ver  uma  discussão  mais 
detalhada  no  estágio  5).  Finalmente,  Ajj  não  carregou 
sobre  qualquer  um  dos  fatores,  mas  foi  um  contribuinte 
periférico  no  modelo  de  regressão. 


O  impacto  de  multicolinearidade  como  refletido  na 
estrutura  fatorial  se  torna  mais  aparente  quando  se  usa 
um  procedimento  de  estimação  stepwise,  e  será  discutido 
com  mais  detalhes  no  quinto  estágio.  Não  obstante,  fora 
questões  de  explicação,  multicolinearidade  pode  ter  um 
substancial  impacto  sobre  a  habilidade  preditiva  geral  de 
qualquer  conjunto  de  variáveis  independentes. 


Olhando  adiante.  Como  previamente  observado,  o 
modelo  de  regressão  neste  estágio  consiste  das  cinco 
variáveis  independentes  com  o  acréscimo  de  Ajj.  Exa¬ 
minando  as  correlações  parciais  de  variáveis  fora  do 
modelo  neste  estágio  (ver  Tabela  4-14),  percebemos 
que  nenhuma  das  variáveis  remanescentes  tem  uma 
correlação  parcial  significante  no  nível  0,05  necessário 
para  entrada.  Além  disso,  todas  as  variáveis  no  mode¬ 
lo  permanecem  estatisticamente  significantes,  evitando 
a  necessidade  de  remover  uma  variável  no  processo 
stepwise.  Logo,  nenhuma  outra  variável  é  considerada 
para  entrada  ou  saída,  e  o  modelo  está  finalizado. 
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TABELA  4-13  Exemplo  de  resultado:  passo  3  do  exemplo  da  regressão  múltipla  HBAT 

Passo  3  -  Variável  incluída:  Imagem  da  equipe  de  venda 


R  múltiplo  0,868 

Coeficiente  de  determinação  (R®)  0,753 

Ff  ajustado  0,745 

Erro  padrão  da  estimativa  0,602 


Análise  de  variância 


Soma  de 


quadrados 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

105,833 

3 

35,278 

97,333 

0,000 

Resíduo 

34,794 

96 

0,362 

Total 

140,628 

99 

Variáveis  incluídas  no  modelo  de  regressão 

Coeficientes  de  regressão 

Significância 

estatística 

Correiações 

Estatísticas  de 
coiinearidade 

Variáveis  incluídas 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parciais 

Semi- 

parciais 

Toierãncia 

VIF 

(Constante) 

-1,569 

0,511 

-3,069 

0,003 

Xg  Solução  de  reclamação 

0,433 

0,052 

0,439 

8,329 

0,000 

0,603 

0,648 

0,423 

0,927 

1,079 

Xg  Qualidade  do  produto 

0,437 

0,044 

0,512 

9,861 

0,000 

0,486 

0,709 

0,501 

0,956 

1,046 

X,2  Imagem  da  equipe  de  venda 

0,530 

0,059 

0,477 

8,992 

0,000 

0,500 

0,676 

0,457 

0,916 

1,092 

Variáveis  fora  do  modelo  de  regressão 


Beta 

Significância 

estatística 

Correlação 

parcial 

Estatísticas  de 
coiinearidade 

t 

Sig. 

Tolerância 

VIF 

Comércio  eletrônico 

-0,232 

-2,890 

0,005 

-0,284 

0,372 

2,692 

^8 

Suporte  técnico 

0,013 

0,259 

0,796 

0,027 

0,983 

1,017 

Anúncio 

-0,019 

-0,307 

0,760 

-0,031 

0,700 

1,428 

Linha  de  produto 

0,180 

2,559 

0,012 

0,254 

0,494 

2,026 

Preço  competitivo 

-0,094 

-1 ,643 

0,104 

-0,166 

0,776 

1,288 

Garantia  e  reclamações 

0,020 

0,387 

0,700 

0,040 

0,966 

1,035 

Novos  produtos 

0,016 

0,312 

0,755 

0,032 

0,996 

1,004 

^16 

Encomenda  e  cobrança 

0,101 

1,297 

0,198 

0,132 

0,426 

2,348 

Flexibilidade  de  preço 

-0,063 

-0,892 

0,374 

-0,091 

0,525 

1,906 

>^18 

Velocidade  de  entrega 

0,219 

2,172 

0,032 

0,217 

0,243 

4,110 

Uma  revisão  do  processo  stepwise 

O  procedimento  de  estimação  stepwise  é  planejado  para 
desenvolver  um  modelo  de  regressão  com  o  menor  número 
de  variáveis  independentes  estatisticamente  significantes  e 
o  máximo  de  precisão  preditiva.  No  entanto,  fazendo  isso, 
o  modelo  de  regressão  pode  ser  sensivelmente  afetado  por 
questões  como  multicolinearidade.  Além  disso,  o  pesquisa¬ 
dor  abre  mão  de  controle  sobre  a  formação  do  modelo  de 
regressão  e  corre  um  risco  maior  de  diminuir  generalidade. 
A  seção  a  seguir  fornece  uma  visão  geral  da  estimação  do 
modelo  de  regressão  stepwise  discutido  anteriormente  sob 
a  perspectiva  de  ajuste  geral  do  modelo.  Aspectos  relativos 
à  interpretação  da  variável  estatística,  outros  procedimen¬ 
tos  de  estimação,  e  especificações  alternativas  de  modelo 
serão  abordadas  em  seções  subseqüentes. 


A  Tabela  4-15  fornece  um  resumo  passo  a  passo  deta¬ 
lhando  as  medidas  de  ajuste  geral  para  o  modelo  de 
regressão  usado  pela  HBAT  na  previsão  de  satisfação 
de  clientes.  Cada  uma  das  três  primeiras  variáveis  adi¬ 
cionadas  à  equação  faz  contribuições  substanciais  ao 
ajuste  geral  do  modelo,  com  significativos  aumentos  no 
e  no  ajustado,  ao  mesmo  tempo  em  que  diminui  o 
erro  padrão  da  estimativa.  Com  apenas  as  três  primei¬ 
ras  variáveis,  75%  da  variação  em  satisfação  de  cliente  é 
explicada  com  um  intervalo  de  confiança  de  ±  1,2.  Duas 
variáveis  adicionais  foram  acrescentadas  para  chegar  no 
modelo  final,  mas  essas  variáveis,  apesar  de  estatistica¬ 
mente  significantes,  fazem  contribuições  muito  menores. 

(Continua) 
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TABELA  4-14  Exemplo  de  resultado:  passo  5  do  exemplo  da  regressão  múltipla  HBAT 

Passo  5  -  Variável  incluída:  Linha  do  produto 


R  múltiplo  0,889 

Coeficiente  de  determinação  (ff)  0,791 

Ff  ajustado  0,780 

Erro  padrão  da  estimativa  0,559 


Análise  de  variância 


Análise  de  variância 


Soma  de 
quadrados 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

1 1 1 ,205 

5 

22,241 

71,058 

0,000 

Resíduo 

29,422 

94 

0,313 

Total 

140,628 

99 

Variáveis  incluídas  no  modelo  de  regressão 


Significãncia  Estatísticas  de 

Coeficientes  de  regressão  estatística  Correiações  coiinearidade 


Variáveis  incluídas 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parciais 

Semi- 

parciais 

Toierância 

VIF 

(Constante) 

- 1,151 

0,500 

-2,303 

0,023 

Xg  Solução  de  reclamação 

0,319 

0,061 

0,323 

5,256 

0,000 

0,603 

0,477 

0,248 

0,588 

1,701 

Xg  Qualidade  do  produto 

0,369 

0,047 

0,432 

7,820 

0,000 

0,486 

0,628 

0,369 

0,728 

1,373 

X,2  Imagem  de  equipe  de  venda 

0,775 

0,089 

0,697 

8,711 

0,000 

0,500 

0,668 

0,411 

0,347 

2,880 

Xj  Comércio  eletrônico 

-0,417 

0,132 

-0,245 

-3,162 

0,002 

0,283 

-0,310 

-0,149 

0,370 

2,701 

X„  Linha  do  produto 

0,174 

0,061 

0,192 

2,860 

0,005 

0,551 

0,283 

0,135 

0,492 

2,033 

Variáveis  fora  do  modelo  de  regressão 

Beta 

Significãncia 

estatística 

Correlação 

parcial 

Estatísticas  de 
coiinearidade 

t 

Sig. 

Tolerância 

VIF 

Xg  Suporte  técnico 

-0,009 

-0,187 

0,852 

-0,019 

0,961 

1,041 

X,g  Anúncio 

-0,009 

-0,162 

0,872 

-0,017 

0,698 

1,432 

X,3  Preço  competitivo 

-0,040 

-0,685 

0,495 

-0,071 

0,667 

1,498 

X,g  Garantia  e  reclamações 

-0,023 

-0,462 

0,645 

-0,048 

0,901 

1,110 

X,5  Novos  produtos 

0,002 

0,050 

0,960 

0,005 

0,989 

1,012 

X,g  Encomenda  e  cobrança 

0,124 

1,727 

0,088 

0,176 

0,423 

2,366 

X„  Flexibilidade  de  preço 

0,129 

1,429 

0,156 

0,147 

0,272 

3,674 

X,g  Velocidade  de  entrega 

0,138 

1,299 

0,197 

0,133 

0,197 

5,075 

(Continuação) 

O  n  aumenta  em  3%  e  o  intervalo  de  confiança  diminui 
para  ±  1,1,  o  que  corresponde  a  uma  melhora  de  0,1.  Os 
impactos  relativos  de  cada  variável  serão  discutidos  no 
estágio  5,  mas  o  procedimento  stepwise  destaca  a  impor¬ 
tância  das  três  primeiras  variáveis  na  avaliação  do  ajuste 
geral  do  modelo. 


Ao  avaliarmos  a  equação  estimada,  consideramos 
significãncia  estatística.  Devemos  também  tratar  com 
às  duas  questões  básicas:  (1)  atender  às  suposições  ine¬ 
rentes  à  regressão  e  (2)  identificar  os  pontos  influentes. 
Consideramos  cada  um  desses  tópicos  nas  seções  que  se 
seguem. 


Avaliação  da  variável  estatística  para  as 
suposições  da  análise  de  regressão 

Até  aqui,  examinamos  as  variáveis  individuais  para  saber¬ 
mos  se  as  mesmas  atendem  às  suposições  exigidas  para 
análise  de  regressão.  Contudo,  devemos  avaliar  a  variável 
estatística  para  sabermos  se  ela  atende  a  tais  suposições 
também.  As  suposições  a  serem  examinadas  são  lineari¬ 
dade,  homocedasticidade,  independência  dos  resíduos,  e 
normalidade.  A  principal  medida  usada  na  avaliação  da 
variável  estatística  de  regressão  é  o  resíduo  -  a  diferen¬ 
ça  entre  o  valor  real  da  variável  dependente  e  seu  valor 
previsto.  Para  comparação,  usamos  os  resíduos  estudanti- 
zados,  uma  forma  de  resíduos  padronizados  (ver  Termos- 
chave). 
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TABELA  4-15  Resumo  do  modelo  segundo  o  método  de  regressão  múltipla  stepwise 

Resumo  do  modelo 


Ajuste  geral  do  modelo  Estatísticas  de  mudança  no  ff 


Passo 

R 

ff 

ff  ajustado 

Erro  padrão 
da  estimativa 

Mudança 
no  ff 

Valor  Fpara 
mudança 
no  ff 

df1 

df2 

Significân¬ 
cia  da  mu¬ 
dança  no  ff 

1 

0,603 

0,364 

0,357 

0,955 

0,364 

56,070 

1 

98 

0,000 

2 

0,738 

0,544 

0,535 

0,813 

0,180 

38,359 

1 

97 

0,000 

3 

0,868 

0,753 

0,745 

0,602 

0,208 

80,858 

1 

96 

0,000 

4 

0,879 

0,773 

0,763 

0,580 

0,020 

8,351 

1 

95 

0,005 

5 

0,889 

0,791 

0,780 

0,559 

0,018 

8,182 

1 

94 

0,005 

Passo  1 :  Xg 

Solução  de  reclamação 

Passo  2:  Xg 

Solução  de  reclamação,  X, 

5  Qualidade  do 

produto 

Passo  3:  Xg 

Solução  de  reclamação,  X( 

5  Qualidade  do 

produto,  X,2  Imagem  da  equipe  de  venda 

Passo  4:  Xg 

Solução  de  reclamação,  X, 

5  Qualidade  do 

produto,  X,2  Imagem  da  equipe  de  venda,  X^ 

Comércio  eletrônico 

Passo  5:  Xg 

Solução  de  reclamação,  X, 

5  Qualidade  do 

produto,  X,2  Imagem  da  equipe  de  venda,  Xy 

Comércio  eletrônico. 

^1, 

Linha  de  produto 

Nota:  Constante  (termo  de  intercepto)  incluída  em  todos  os  modelos  de  regressão. 


O  tipo  mais  básico  de  gráfico  de  resíduo  é  mostrado  na 
Figura  4-10,  os  resíduos  estudantizados  versus  os  valores 
previstos.  Como  podemos  ver,  os  resíduos  geralmente  es¬ 
tão  em  um  padrão  aleatório,  muito  semelhante  ao  gráfico 
nulo  na  Figura  4-5a.  No  entanto,  devemos  fazer  testes  es¬ 
pecíficos  para  cada  suposição  para  verificar  violações. 


Linearidade  A  primeira  suposição,  linearidade,  será 
avaliada  por  meio  de  uma  análise  de  resíduos  (teste  da 
variável  estatística  geral)  e  gráficos  de  regressão  parcial 
(para  cada  variável  independente  na  análise). 


A  Figura  4-10  não  exibe  qualquer  padrão  não-linear  nos 
resíduos,  garantindo  assim  que  a  equação  geral  é  linear. 


Mas  também  devemos  nos  certificar,  ao  usarmos  mais  de 
uma  variável  independente,  que  cada  relação  com  a  variá¬ 
vel  independente  seja  igualmente  linear  para  garantir  sua 
melhor  representação  na  equação.  Para  fazer  isso,  utiliza¬ 
mos  o  gráfico  de  regressão  parcial  para  cada  variável  in¬ 
dependente  na  equação.  Na  Figura  4-11,  vemos  que  as  re¬ 
lações  para  X^,  Ajj  são  razoavelmente  bem  definidas; 
ou  seja,  elas  têm  efeitos  fortes  e  significantes  na  equação 
de  regressão.  As  variáveis  X-,  e  X^^  não  são  tão  bem  defi¬ 
nidas,  tanto  no  coeficiente  angular  quanto  na  dispersão 
dos  pontos,  o  que  explica  o  menor  efeito  na  equação  (evi¬ 
denciado  pelo  coeficiente,  pelo  valor  beta  e  pelo  nível  de 
significância  menores).  Para  as  cinco  variáveis,  nenhum 
padrão  não-linear  é  mostrado,  atendendo  assim  à  suposi¬ 
ção  de  linearidade  para  cada  variável  independente. 

(Continua) 


Valor  previsto  padronizado 


FIGURA  4-10  Análise  de  resíduos  padronizados. 
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Xg  Qualidade  de  produto 


Xg  Solução  de  reclamação 


X^2  Imagem  da  equipe  de  venda 
FIGURA  4-1 1  Gráficos  de  regressão  parcial  padronizada. 


(Continuação) 

Homocedasticidade  A  próxima  suposição  lida  com  a 
constância  dos  resíduos  ao  longo  dos  valores  das  variá¬ 
veis  independentes.  Nossa  análise  é  novamente  realizada 
pelo  exame  dos  resíduos  (Figura  4-10),  que  não  mostra 
padrão  de  resíduos  crescentes  ou  decrescentes.  Essa  des¬ 
coberta  aponta  homocedasticidade  no  caso  multivariado 
(o  conjunto  de  variáveis  independentes). 


Independência  dos  resídnos  A  terceira  suposição  lida 
com  o  efeito  de  envolvimento  de  uma  observação  com  a 
outra,  tornando  assim  o  resíduo  não-independente.  Quan¬ 
do  é  encontrado  envolvimento  em  casos  como  dados  em 
séries  temporais,  o  pesquisador  deve  identificar  as  poten¬ 
ciais  variáveis  seqüenciais  (como  tempo  em  um  problema 
de  séries  temporais)  e  fazer  o  gráfico  dos  resíduos  por  essa 
variável.  Por  exemplo,  considere  que  o  número  de  identi- 


Xii  Linha  de  produto 


ficação  representa  a  ordem  na  qual  coletamos  nossas  res¬ 
postas.  Poderíamos  fazer  o  gráfico  dos  resíduos  e  ver  se 
surge  algum  padrão. 


Em  nosso  exemplo,  diversas  variáveis,  incluindo  o  núme¬ 
ro  de  identificação  e  cada  variável  independente,  foram 
testadas  e  nenhum  padrão  consistente  foi  encontrado. 
Devemos  usar  os  resíduos  nessa  análise,  não  os  valores 
originais  da  variável  dependente,  porque  o  foco  está  nos 
erros  de  previsão  e  não  na  relação  obtida  na  equação  de 
regressão. 


Normalidade  A  suposição  final  que  verificaremos  é  a 
normalidade  do  termo  de  erro  da  variável  estatística  com 
uma  inspeção  visual  dos  gráficos  de  probabilidade  normal 
dos  resíduos. 
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Observado 

FIGURA  4-12  Gráfico  de  probabilidade  normal:  resíduos  padronizados. 


Como  mostrado  na  Figura  4-12,  os  valores  estão  ao  lon¬ 
go  da  diagonal  sem  desvios  substanciais  ou  sistemáticos; 
logo,  os  resíduos  são  considerados  representativos  de 
uma  distribuição  normal.  A  variável  estatística  de  re¬ 
gressão  satisfaz  a  suposição  de  normalidade. 


Aplicação  de  ações  corretivas  para  violações  de  supo¬ 
sições.  Após  testar  violações  das  quatro  suposições 
básicas  da  regressão  multivariada  para  as  variáveis  in¬ 
dividuais  e  para  a  variável  estatística  de  regressão,  o 
pesquisador  deve  avaliar  o  impacto  de  ações  corretivas 
sobre  os  resultados. 


No  exame  de  variáveis  individuais  no  Capítulo  2,  as  úni¬ 
cas  ações  corretivas  necessárias  eram  as  transformações 
de  Aj,  Ay,  Ajj,  Aj3,  e  Ajy.  Somente  no  caso  de  X^2  ^ 
transformação  não  atingiu  normalidade.  Se  substituirmos 
essas  variáveis  por  seus  valores  originais  e  reestimarmos 
a  equação  de  regressão  com  um  procedimento  stepwise, 
conseguiremos  resultados  quase  idênticos  (ver  Tabela 
4-16).  As  mesmas  variáveis  entram  na  equação  sem  dife¬ 
renças  significativas,  seja  nos  coeficientes  estimados,  seja 
no  ajuste  geral  do  modelo  como  avaliado  com  e  erro 
padrão  da  estimativa.  As  variáveis  independentes  fora  da 
equação  ainda  exibem  níveis  não-significantes  para  en¬ 
trada  -  mesmo  aquelas  que  foram  transformadas.  Assim, 
nesse  caso,  as  ações  corretivas  para  violação  das  suposi¬ 
ções  melhoraram  um  pouco  a  previsão,  mas  não  altera¬ 
ram  as  descobertas  importantes. 


Identificação  de  observações  atípicas 
como  observações  influentes 

Para  nossa  análise  final,  tentamos  identificar  observações 
que  sejam  influentes  (tenham  um  impacto  desproporcio¬ 


nal  sobre  os  resultados  de  regressão)  e  determinar  se  elas 
deveriam  ser  excluídas  da  análise.  Apesar  de  procedimen¬ 
tos  mais  detalhados  estarem  disponíveis  para  a  identifica¬ 
ção  de  observações  atípicas  como  observações  influentes, 
abordamos  o  uso  de  resíduos  para  identificar  observações 
atípicas  na  próxima  seção. 


A  ferramenta  diagnóstica  mais  básica  envolve  os  resíduos 
e  a  identificação  de  quaisquer  observações  atípicas  -  ou 
seja,  observações  que  não  foram  bem  previstas  pela  equa¬ 
ção  de  regressão  e  que  têm  grandes  resíduos.  A  Figura 
4-13  mostra  os  resíduos  estudantizados  para  cada  obser¬ 
vação.  Como  os  valores  correspondem  a  valores  í,  os  li¬ 
mites  superior  e  inferior  podem  ser  definidos  assim  que  o 
intervalo  de  confiança  desejado  tenha  sido  estabelecido. 
Talvez  o  nível  mais  amplamente  usado  seja  uma  confiança 
de  95%  (a  =  0,05).  O  valor  t  correspondente  é  1,96,  iden- 
tificando-se  assim  resíduos  estatisticamente  significantes 
como  aqueles  com  resíduos  maiores  que  este  valor  (1,96). 
Sete  observações  podem  ser  vistas  na  Figura  4-13  (2, 10, 
20, 45, 52, 80  e  99)  como  tendo  resíduos  significantes,  e  as¬ 
sim  são  classificadas  como  observações  atípicas.  Estas  são 
importantes  por  serem  observações  não  representadas 
pela  equação  de  regressão  por  uma  ou  mais  razões,  sendo 
que  qualquer  uma  pode  ser  um  efeito  influente  sobre  a 
equação  que  demanda  uma  ação  corretiva. 

O  exame  dos  resíduos  também  pode  ser  feito  por 
meio  dos  gráficos  de  regressão  parcial  (ver  Figura  4-11). 
Esses  gráficos  ajudam  a  identificar  observações  influen¬ 
tes  para  cada  relação  entre  variáveis  dependente  e  inde¬ 
pendentes.  Consistentemente  ao  longo  de  cada  gráfico 
na  Figura  4-11,  os  pontos  na  porção  inferior  são  aquelas 
observações  identificadas  como  tendo  elevados  resíduos 
negativos  (observações  2, 10, 20, 45, 52, 80  e  99  na  Figura 
4-13).  Tais  pontos  não  são  bem  representados  pela  rela¬ 
ção  e,  portanto,  afetam  a  correlação  parcial  também. 
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TABELA  4-16  Resultados  de  regressão  múltipla  após  ações  corretivas  para  violações  de  suposições 

Regressão  stepwise  com  variáveis  transformadas 


R  múltiplo 

0,890 

Coeficiente  de  determinação  (R®) 

0,792 

íf  ajustado 

0,781 

Erro  padrão  da  estimativa 

0,558 

Anáiise  de  variância 


Soma  de 
quadra¬ 
dos 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

111,319 

5 

22,264 

71 ,407 

0,000 

Resíduo 

29,308 

94 

0,312 

Total 

140,628 

99 

Variáveis  inciuídas  no  modeio  de  regressão 


Significância  Estatísticas  de 

Coeficientes  de  regressão  estatística  Correiações  coiinearidade 

Erro  Ordem  Semi- 


Variáveis  inciuídas 

B 

padrão 

Beta 

t 

Sig. 

zero 

Parciais 

parciais 

Tolerância 

VIF 

(Constante) 

0,825 

0,500 

1,650 

0,102 

Xg  Solução  de  reclamação 

0,309 

0,061 

0,314 

5,095 

0,000 

0,603 

0,465 

0,240 

0,585 

1,710 

Xg  Qualidade  do  produto 

0,024 

0,003 

0,433 

7,849 

0,000 

0,507 

0,629 

0,370 

0,729 

1,372 

X,2  Imagem  da  equipe  de  venda 

0,761 

0,088 

0,685 

8,647 

0,000 

0,500 

0,666 

0,407 

0,353 

2,829 

Xj  Comércio  eletrônico 

-  3,561 

1,116 

-0,244 

-3,192 

0,002 

0,254 

-0,313 

-0,150 

0,379 

2,640 

X„  Linha  do  produto 

0,169 

0,061 

0,186 

2,769 

0,007 

0,551 

0,275 

0,130 

0,491 

2,037 

Nota:  Xg  (Qualidade  do  produto)  e  X-,  (Comércio  eletrônico)  são  variáveis  transformadas 


o 

T3 

ra 


1  4  7  10  13  16  19  22  25  28  31  34  37  40  43  46  49  52  55  58  61  64  67  70  73  76  79  82  85  88  91  94  97  100 

Identificação 


FiGURA  4-13  Gráfico  de  resíduos  estudantizados. 
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Análises  mais  detalhadas  para  verificar  se  alguma  das 
observações  pode  ser  classificada  como  influente,  bem 
como  avaliação  de  possíveis  ações  corretivas,  estão  no 
suplemento  deste  capítulo,  disponível  na  Web  em  www. 
bookman.com.br. 

Estágio  5:  Interpretação  da  variável 
estatística  de  regressão 

Com  a  estimação  do  modelo  concluída,  a  variável  estatís¬ 
tica  de  regressão  especificada  e  os  testes  diagnósticos  que 
confirmam  a  adequação  dos  resultados  administrados, 
agora  podemos  examinar  nossa  equação  preditiva  baseada 
em  cinco  variáveis  independentes  (X^,  X^,  Xg,  Xjj  e  X^2)- 

Interpretação  dos  coeficientes  de  regressão 

A  primeira  tarefa  é  avaliar  os  coeficientes  de  regressão 
quanto  aos  sinais  estimados,  concentrando-se  naqueles  de 
direção  inesperada. 


A  seção  da  Tabela  4-14  chamada  “Variáveis  incluídas  no 
modelo  de  regressão”  fornece  a  equação  de  previsão  a 
partir  da  coluna  rotulada  “Coeficiente  de  regressão:  B”. 
Dessa  coluna,  lemos  o  termo  constante  (-1,151)  e  os  co¬ 
eficientes  (0,319, 0,369, 0,775,  -0,417  e  0,174)  para  Xg,  X^, 
X^2,  V^e  Ajj,  respectivamente.  A  equação  preditiva  seria 
escrita  como: 

Y  =  -1,151  -t  0,319Vg  -t  0,369Ag  -t  OJISX^^ 

+  (-  0,417)^7  -t  0,174Aii 

Nota:  O  coeficiente  de  X-,  está  incluído  entre  parên¬ 
teses  para  evitar  confusão  devido  ao  valor  negativo  do 
mesmo. 

Com  essa  equação,  o  nível  esperado  de  satisfação  do 
cliente  para  qualquer  um  deles  pode  ser  calculado  se  suas 
avaliações  da  HBAT  forem  conhecidas.  Para  ilustração, 
suponhamos  que  um  cliente  considerou  a  HBAT  com 
um  valor  de  6,0  para  cada  uma  dessas  cinco  medidas.  O 
nível  previsto  de  satisfação  para  aquele  cliente  seria 

Cliente  previsto  =  —1,151  +  0,319  x  6  4-  0,369  x  6  -I- 
0,775  X 6  -f  (-0,417)  x6  +  0,174 x 6 
Satisfação  =  -1,151-t  1,914  -t  2,214  -t  4,650  - 
2,502  -t  1,044  =  6,169 

Primeiro  começamos  com  uma  interpretação  da  cons¬ 
tante.  Ela  é  estatisticamente  significante  (significância  = 
0,023),  fazendo  assim  uma  importante  contribuição  à  pre¬ 
visão.  Contudo,  como  em  nossa  situação  é  altamente  im¬ 
provável  que  qualquer  respondente  atribua  nota  zero  em 
todas  as  percepções  sobre  a  HBAT,  a  constante  meramen¬ 
te  participa  do  processo  de  previsão  e  não  fornece  qual¬ 
quer  pista  para  interpretação. 

Ao  se  verem  os  coeficientes  de  regressão,  o  sinal  é  uma 
indicação  da  relação  (positiva  ou  negativa)  entre  as  variá¬ 
veis  dependente  e  independentes.  Todas  as  variáveis,  exce¬ 


to  uma,  têm  coeficientes  positivos.  De  particular  interesse 
é  o  sinal  invertido  de  X-j  (Comércio  eletrônico),  sugerindo 
que  um  aumento  em  percepções  sobre  essa  variável  tem 
um  impacto  negativo  sobre  a  satisfação  prevista  de  cliente. 
Todas  as  demais  variáveis  têm  coeficientes  positivos,  o  que 
significa  que  percepções  mais  positivas  de  HBAT  (valores 
maiores)  aumentam  a  satisfação  do  cliente. 

De  alguma  forma,  então,  X-,  opera  diferentemente  das 
outras  variáveis?  Neste  caso,  a  correlação  bivariada  entre 
Xj  e  satisfação  de  cliente  é  positiva,  indicando  que,  quando 
considerada  separadamente,  X-,  tem  uma  relação  positiva 
com  satisfação  de  cliente,  exatamente  como  as  outras  va¬ 
riáveis.  Discutiremos  na  próxima  seção  o  impacto  de  mul- 
ticolinearidade  sobre  a  inversão  de  sinais  de  coeficientes 
estimados. 


Avaliação  da  importância  de  variável 

Além  de  fornecer  uma  base  para  prever  satisfação  de 
cliente,  os  coeficientes  de  regressão  também  apresentam 
um  meio  de  avaliar  a  importância  relativa  das  variáveis 
individuais  na  previsão  geral  de  satisfação  de  cliente. 
Quando  todas  as  variáveis  são  expressas  em  uma  escala 
padronizada,  então  os  coeficientes  de  regressão  represen¬ 
tam  importância  relativa.  Não  obstante,  em  outros  casos, 
o  peso  beta  é  a  medida  preferida  de  importância  relativa. 


Nessa  situação,  todas  as  variáveis  são  expressas  na  mes¬ 
ma  escala,  mas  usaremos  os  coeficientes  beta  para  com¬ 
parações  entre  variáveis  independentes.  Na  Tabela  4-14, 
os  coeficientes  beta  são  listados  na  coluna  chamada  “Co¬ 
eficientes  de  regressão:  Beta”.  O  pesquisador  pode  fazer 
comparações  diretas  entre  as  variáveis  para  se  certificar 
de  sua  importância  relativa  na  variável  estatística  de  re¬ 
gressão.  Para  nosso  exemplo,  Ajj  (Imagem  da  equipe  de 
venda)  era  a  mais  importante,  seguida  por  X^  (Qualidade 
do  produto),  Xg  (Solução  de  reclamação),  Xj  (Comércio 
eletrônico)  e,  finalmente,  X^^  (Linha  do  produto).  Com 
um  firme  declínio  na  magnitude  dos  coeficientes  beta  ao 
longo  das  variáveis,  é  difícil  classificar  as  variáveis  como 
elevadas,  baixas  ou  qualquer  outro  caso.  No  entanto,  a 
observação  da  magnitude  relativa  indica  que,  por  exem¬ 
plo,  X^2  (Imagem  da  equipe  de  venda)  exibe  um  efeito 
mais  marcante  (três  vezes  mais)  do  que  X^^  (Linha  do 
produto).  Assim,  diante  do  fato  de  que  a  imagem  da 
equipe  de  venda  pode  ser  aumentada  unicamente  a  partir 
de  outras  percepções,  ela  representa  a  forma  mais  direta, 
ceteris  paribus*,  de  aumentar  a  satisfação  do  cliente. 


Medição  do  grau  e  impacto  de  multicolinearidade 

Em  qualquer  interpretação  da  variável  estatística  de  re¬ 
gressão,  o  pesquisador  deve  estar  ciente  do  impacto  da 

*  N.  de  R.  T.:  Esta  expressão  em  latim  significa  “mantidas  inalteradas 
as  outras  características”. 
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multicolinearidade.  Como  discutido  anteriormente,  va¬ 
riáveis  altamente  colineares  podem  distorcer  substancial¬ 
mente  os  resultados  ou  torná-los  muito  instáveis  e,  assim, 
não-generalizáveis.  Duas  medidas  estão  disponíveis  para 
testar  o  impacto  da  colinearidade:  (1)  cálculo  dos  valores 
da  tolerância  e  VIF,  e  (2)  uso  dos  índices  de  condição  e 
decomposição  da  variância  do  coeficiente  de  regressão 
(ver  suplemento  deste  capítulo  disponível  na  Web  em 
www.bookman.com.br  para  mais  detalhes  sobre  este 
processo).  O  valor  de  tolerância  é  1  menos  a  proporção 
da  variância  da  variável  explicada  pelas  outras  variáveis 
independentes.  Assim,  uma  alta  tolerância  indica  pouca 
colinearidade,  e  valores  de  tolerância  próximos  de  zero 
indicam  que  a  variável  é  quase  totalmente  explicada  pelas 
outras  variáveis  (alta  multicolinearidade).  O  fator  de  in¬ 
flação  de  variância  é  o  recíproco  da  tolerância;  logo,  pro¬ 
curamos  valores  VIF  pequenos  como  indicativos  de  baixa 
intercorrelação  entre  as  variáveis. 


Diagnóstico  de  multicolinearidade.  Em  nosso  exem¬ 
plo,  os  valores  de  tolerância  para  as  variáveis  na  equa¬ 
ção  variam  de  0,728  (dQ)  a  0,347  (V^),  indicando  uma 
vasta  gama  de  efeitos  de  multicolinearidade  (ver  Tabela 
4-14).  Analogamente,  os  valores  VIF  variam  de  1,373  a 
2,701.  Ainda  que  nenhum  desses  valores  indique  níveis 
de  multicolinearidade  que  devam  distorcer  seriamente  a 
variável  estatística  de  regressão,  devemos  ser  cuidado¬ 
sos  mesmo  com  tais  níveis,  para  entender  seus  efeitos, 
especialmente  sobre  o  processo  de  estimação  stepwise.  A 
seção  a  seguir  detalha  alguns  desses  efeitos  tanto  sobre  a 
estimação  quanto  sobre  o  processo  de  interpretação. 


Uma  segunda  abordagem  para  identificar  a  multicoli¬ 
nearidade  e  seus  efeitos  é  por  meio  da  decomposição  da 
variância  do  coeficiente.  Os  pesquisadores  são  encoraja¬ 
dos  a  explorar  essa  técnica  e  as  informações  adicionais 
que  ela  oferece  na  interpretação  da  equação  de  regres¬ 
são.  Detalhes  desse  método  são  discutidos  no  suplemen¬ 
to  deste  capítulo  dsisponível  na  Web  em  www.bookman. 
com.br. 

Impactos  devido  à  multicolinearidade.  Apesar  de  a  mul¬ 
ticolinearidade  não  ser  elevada  a  ponto  de  o  pesquisador 
ter  que  tomar  uma  ação  corretiva  antes  que  resultados  vá¬ 
lidos  sejam  obtidos,  multicolinearidade  ainda  tem  impac¬ 
to  sobre  o  processo  de  estimação,  particularmente  sobre 
a  composição  da  variável  estatística  e  os  coeficientes  de 
regressão  estimados. 


Depois  de  Xg  (a  primeira  variável  acrescentada  à  variável 
estatística  no  processo  stepwise),  a  segunda  com  maior 
correlação  com  a  variável  dependente  é  Vjg  (Velocidade 
de  entrega),  seguida  por  dfjj  (Linha  do  produto)  e 
(Encomenda  e  cobrança).  No  entanto,  devido  à  colinea¬ 


ridade  com  Xg,  a  segunda  variável  a  entrar  foi  X^,  que  é 
apenas  a  sexta  maior  correlação  bivariada  com 

Os  impactos  de  multicolinearidade  são  vistos  repeti¬ 
damente  através  do  processo  de  estimação,  de  modo  que 
o  conjunto  final  de  cinco  variáveis  adicionadas  ao  mode¬ 
lo  de  regressão  (X^,  X-,,  Xg,  Vjj  e  Vjj)  representa  a  pri¬ 
meira,  a  sexta,  a  quinta,  a  oitava  e  a  terceira  correlação 
com  a  variável  dependente,  respectivamente.  Variáveis 
com  a  segunda  correlação  mais  alta  (Vjg  com  0,577)  e  a 
quarta  maior  (Vjg  com  0,522)  jamais  entram  no  modelo 
de  regressão.  A  exclusão  delas  significa  que  as  mesmas 
não  são  importantes?  Falta  impacto  a  elas?  Se  um  pes¬ 
quisador  se  guiar  apenas  pelo  modelo  de  regressão  esti¬ 
mado,  a  multicolinearidade  causará  sérios  problemas  de 
interpretação.  O  que  aconteceu  é  que  Vjg  e  Vjg  são  alta¬ 
mente  correlacionadas  com  Xg,  a  tal  ponto  que  elas  têm 
pouco  poder  explanatório  independentemente  daque¬ 
le  compartilhado  com  Xg.  No  entanto,  por  conta  delas 
mesmas,  ou  se  Xg  não  fosse  permitida  no  modelo,  elas 
seriam  importantes  preditores  de  satisfação  de  cliente.  A 
extensão  de  multicolinearidade  entre  essas  três  variáveis 
é  evidenciada  no  Capítulo  3,  onde  essas  três  variáveis  fo¬ 
ram  percebidas  como  um  dos  quatro  fatores  que  surgem 
das  percepções  de  HBAT. 

Além  de  afetar  a  composição  da  variável  estatística, 
multicolinearidade  tem  um  impacto  distinto  sobre  os  si¬ 
nais  dos  coeficientes  estimados.  Nesta  situação  ela  se  re¬ 
laciona  com  a  colinearidade  entre  (Imagem  de  equipe 
de  venda)  e  Xg  (Comércio  eletrônico).  Como  observado 
em  nossa  discussão  anterior  sobre  multicolinearidade, 
um  possível  efeito  é  a  inversão  de  sinal  para  um  coefi¬ 
ciente  de  regressão  estimado  a  partir  da  direção  esperada 
representada  na  correlação  bivariada.  Aqui,  a  alta  corre¬ 
lação  positiva  entre  X^^  e  Xg  (correlação  =  0,792)  faz  com 
que  o  sinal  do  coeficiente  de  regressão  de  Xg  mude  de  po¬ 
sitivo  (na  correlação  bivariada)  para  um  sinal  negativo. 
Se  o  pesquisador  não  investigasse  a  extensão  da  multico¬ 
linearidade  e  seu  impacto,  poderia  ser  tirada  a  conclusão 
inadequada  de  que  aumentos  em  atividades  de  comércio 
eletrônico  diminuem  a  satisfação  do  cliente. 

Logo,  o  pesquisador  deve  entender  as  relações  bási¬ 
cas  sustentadas  pela  teoria  conceituai  inerente  à  especi¬ 
ficação  do  modelo  original  e  fazer  a  interpretação  com 
base  nessa  teoria,  e  não  apenas  sobre  a  variável  estatís¬ 
tica  estimada. 


O  pesquisador  jamais  deve  permitir  que  um  procedi¬ 
mento  de  estimação  defina  a  interpretação  dos  resultados; 
deve,  porém,  compreender  os  aspectos  de  interpretação 
que  acompanham  cada  procedimento  de  estimação.  Por 
exemplo,  se  todas  as  13  variáveis  independentes  entram 
na  variável  estatística  de  regressão,  o  pesquisador  ainda 
deve  lidar  com  os  efeitos  de  colinearidade  sobre  a  inter¬ 
pretação  dos  coeficientes,  mas  de  uma  maneira  diferente 
do  que  ocorre  em  stepwise. 


214  Análise  Multivariada  de  Dados 


Estágio  6:  Validação  dos  resultados 

A  tarefa  final  para  o  pesquisador  envolve  o  processo  de 
validação  do  modelo  de  regressão.  A  preocupação  funda¬ 
mental  desse  processo  é  garantir  que  os  resultados  sejam 
generalizáveis  à  população  e  não  específicos  à  amostra  usa¬ 
da  na  estimação.  A  abordagem  mais  direta  de  validação  é 
obter  uma  outra  amostra  da  população  e  avaliar  a  corres¬ 
pondência  dos  resultados  das  duas  amostras.  Na  ausência 
de  uma  amostra  adicional,  o  pesquisador  pode  avaliar  a 
validade  dos  resultados  de  diversas  maneiras,  incluindo  o 
exame  do  valor  ajustado  ou  a  estimação  do  modelo  de 
regressão  sobre  duas  ou  mais  subamostras  dos  dados. 

O  exame  do  valor  ajustado  revela  pouca  perda  no  po¬ 
der  preditivo  quando  comparado  com  o  valor  (0,780 
versus  0,79i,  ver  Tabela  4-14),  o  que  indica  uma  falta  de 
superajuste  que  apareceria  com  uma  diferença  maior  en¬ 
tre  os  dois  valores.  Além  disso,  com  cinco  variáveis  no 
modelo,  ele  mantém  uma  proporção  adequada  de  obser¬ 
vações  por  variáveis  na  variável  estatística. 

Uma  segunda  abordagem  é  dividir  a  amostra  em  duas 
subamostras,  estimar  o  modelo  de  regressão  para  cada 
subamostra  e  comparar  os  resultados.  A  Tabela  4-17 
contém  os  modelos  estimados  stepwise  para  duas  suba¬ 


mostras  de  50  observações  cada.  A  comparação  do  ajuste 
geral  do  modelo  demonstra  um  elevado  nível  de  simila¬ 
ridade  dos  resultados  em  termos  de  PÍ^  ajustado  e  do 
erro  padrão  da  estimativa.  Mas  ao  se  comparar  os  coefi¬ 
cientes  individuais,  algumas  diferenças  surgem.  Na  amos¬ 
tra  1,  Ag  não  entrou  nos  resultados  stepwise,  mas  entrou 
na  amostra  2  e  na  amostra  geral.  Em  seu  lugar  entrou  Xj^, 
altamente  colinear  com  Xg  Além  disso,  Ajj  tem  um  peso 
beta  sensivelmente  maior  na  amostra  1  do  que  nos  resul¬ 
tados  gerais.  Na  segunda  amostra,  quatro  das  variáveis 
entraram  como  no  caso  dos  resultados  gerais,  mas  Ajj, 
a  variável  mais  fraca  nos  resultados  gerais,  não  entrou 
no  modelo.  A  omissão  de  Ajj  em  uma  das  subamostras 
confirma  que  este  era  um  preditor  atípico,  como  indicado 
pelos  baixos  valores  beta  e  í  no  modelo  geral. 


Avaliação  de  modelos  de  regressão  alternativos 

O  modelo  de  regressão  stepwise  examinado  na  discussão 
anterior  forneceu  uma  sólida  avaliação  do  problema  de 
pesquisa  conforme  formulado.  No  entanto,  o  pesquisa¬ 
dor  está  sempre  bem  servido  na  avaliação  de  modelos  de 
regressão  alternativos  na  busca  de  poder  explicativo  adi¬ 
cional  e  de  confirmação  de  resultados  anteriores.  Nesta 


TABELA  4-17  Validação  com  amostra  particionada  da  estimação  stepwise 


Ajuste  geral  do  modelo 


Amostra  1 

Amostra  2 

R  múltiplo 

0,910 

0,888 

Coeficiente  de  determinação  (Ff) 

0,828 

0,788 

Ff  ajustado 

0,808 

0,769 

Erro  padrão  da  estimativa 

0,564 

0,529 

Análise  de  variância 


Amostra  1  Amostra  2 

Soma  de  Quadrado  Soma  de  Quadrado 


quadrados 

df  médio 

F 

Sig. 

quadrados  df 

médio 

F 

Sig. 

Regressão 

67,211 

5  13,442 

42,223 

0,000 

46,782 

:  4 

11,695 

41 ,747 

0,000 

Resíduo 

14,008 

44  0,318 

12,607 

45 

0,280 

Total 

81,219 

49 

59,389 

1  49 

Variáveis  incluídas  no  modelo  de  regressão  stepwise 

AMOSTRA  1 

AMOSTRA  2 

Significãncia 

Significãncia 

Coeficientes  de  regressão 

estatística 

Coeficientes  de  regressão 

estatística 

Variáveis  no  modeio 

B 

Erro  padrão 

Beta 

t 

Sig. 

B  Erro  padrão 

Beta 

t  Sig. 

(Constante) 

- 1,413 

0,736 

-1,920 

0,061  - 

0,689 

0,686 

-  1 ,005  0,320 

Xg  Imagem  da  equipe  de  venda  1,069 

0,151 

0,916 

7,084 

0,000 

0,594 

0,105 

0,568 

5,679  0,000 

Xg  Qualidade  do  produto 

0,343 

0,066 

0,381 

5,232 

0,000 

0,447 

0,062 

0,518 

7,170  0,000 

Comércio  eletrônico 

-  0,728 

0,218 

-0,416 

-  3,336 

0,002  - 

0,349 

0,165 

-0,212 

-2,115  0,040 

X,,  Linha  do  produto 

0,295 

0,078 

0,306 

3,780 

0,000 

X,g  Encomenda  e  cobrança 

0,285 

0,115 

0,194 

2,473 

0,017 

Xg  Solução  de  reclamação 

0,421 

0,070 

0,445 

5,996  0,000 
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seção,  examinamos  dois  modelos  de  regressão  adicionais: 
um  modelo  que  inclui  as  treze  variáveis  independentes  em 
uma  abordagem  confirmatória,  e  um  segundo  modelo  que 
acrescenta  uma  variável  não-métrica  (^"3,  Tamanho  da  fir¬ 
ma)  pelo  uso  de  uma  variável  dicotômica. 

Modelo  confirmatório  de  regressão 

Uma  alternativa  básica  ao  método  de  estimação  de  regressão 
stepwise  é  a  abordagem  confirmatória,  na  qual  o  pesquisador 
especifica  a  variável  independente  a  ser  incluída  na  equação 
de  regressão.  Desse  modo,  o  pesquisador  detém  controle 
completo  sobre  a  variável  estatística  de  regressão  em  termos 
de  previsão  e  explicação.  Esse  tratamento  é  especialmente 
adequado  em  situações  de  replicação  de  esforços  anteriores 
de  pesquisa  ou  para  fins  de  validação. 


Nessa  situação,  a  perspectiva  confirmatória  envolve  a 
inclusão  das  13  medidas  de  percepção  como  variáveis 
independentes.  Essas  mesmas  variáveis  são  considera¬ 
das  no  processo  de  estimação  stepwise,  mas  nesse  caso 
todas  entram  diretamente  na  equação  de  regressão  de 
uma  só  vez.  Aqui  o  pesquisador  pode  julgar  os  impactos 
potenciais  da  multicolinearidade  na  seleção  de  variáveis 
independentes  e  o  efeito  sobre  o  ajuste  geral  do  modelo 
a  partir  da  inclusão  das  sete*  variáveis. 


A  principal  comparação  entre  os  procedimentos  stepwise 
e  confirmatório  envolve  o  exame  do  ajuste  geral  do  modelo, 
bem  como  a  interpretação  conseguida  a  partir  de  cada  con¬ 
junto  de  resultados. 

Impacto  sobre  ajuste  geral  do  modelo.  Os  resultados  na 
Tabela  4-18  são  semelhantes  aos  resultados  finais  alcança¬ 
dos  pela  estimação  stepwise  (ver  Tabela  4-14),  com  duas 
exceções  que  devem  ser  destacadas: 


1.  Ainda  que  mais  variáveis  independentes  sejam  in¬ 
cluídas,  o  ajuste  geral  do  modelo  diminui.  Ao  con¬ 
trário  do  coeficiente  de  determinação  que  aumenta 
(de  0,889  para  0,897)  por  causa  das  variáveis  inde¬ 
pendentes  extras,  o  ajustado  diminui  levemente 
(de  0,780  para  0,774),  o  que  indica  a  inclusão  de  vá¬ 
rias  variáveis  independentes  que  são  não-significan- 
tes  na  equação  de  regressão.  Apesar  de  contribuírem 
para  o  valor  geral,  elas  diminuem  o  R^  ajustado. 
Isso  ilustra  o  papel  do  R^  ajustado  na  comparação  de 
variáveis  estatísticas  de  regressão  com  diferentes  nú¬ 
meros  de  variáveis  independentes. 

2.  Uma  outra  indicação  do  ajuste  geral  mais  pobre  do 
modelo  confirmatório  é  o  aumento  no  erro  padrão  da 
estimativa  (SEE)  de  0,559  para  0,566,  o  que  demons¬ 
tra  que  o  R^  geral  não  deve  ser  o  único  critério  para 
a  precisão  preditiva,  pois  pode  ser  influenciado  por 
muitos  fatores,  entre  os  quais  o  número  de  variáveis 
independentes. 


N.  de  R.  T.:  A  frase  correta  seria  “a  partir  da  inclusão  das  13  va¬ 
riáveis”. 


Impacto  sobre  interpretação  da  variável  estatística.  A 

outra  diferença  está  na  variável  estatística  de  regressão, 
onde  a  multicolinearidade  afeta  o  número  e  a  força  das 
variáveis  significantes. 


1.  Primeiro,  apenas  três  variáveis  (X^,  Xj  e  A^j)  são 
estatisticamente  significantes,  ao  passo  que  o  mo¬ 
delo  stepwise  contém  duas  variáveis  a  mais  (Xg  e 
Ajj).  No  modelo  stepwise,  X^^  era  a  variável  menos 
significante,  com  um  nível  de  significância  de  0,005. 
Quando  a  abordagem  confirmatória  é  empregada,  a 
multicolinearidade  com  outras  variáveis  (como  in¬ 
dicado  por  seu  valor  de  tolerância  de  0,026)  a  reduz 
a  não-significante.  O  mesmo  acontece  com  Xg,  que 
foi  a  primeira  variável  a  entrar  na  solução  stepwise, 
mas  que  agora  tem  um  coeficiente  não-significante 
no  modelo  confirmatório.  Novamente,  multicoline¬ 
aridade  teve  um  impacto  perceptível,  refletido  em 
seu  valor  de  tolerância  de  0,207. 

2.  O  impacto  de  multicolinearidade  sobre  outras  va¬ 
riáveis  não  presentes  no  modelo  stepwise  também  é 
substancial.  Na  abordagem  confirmatória,  três  variá¬ 
veis  (Ajj,  Ai7  e  Ajg)  têm  valores  de  tolerância  abaixo 
de  0,05  (com  valores  VIF  correspondentes  de  33,3, 
37,9  e  44,0)**,  o  que  significa  que  95%  ou  mais  de  sua 
variância  é  explicada  pelas  outras  percepções  HBAT. 
Em  tais  situações,  é  praticamente  impossível  para  es¬ 
sas  variáveis  serem  preditoras  significantes.  Seis  ou¬ 
tras  têm  valores  de  tolerância  abaixo  de  0,50,  indican¬ 
do  que  as  variáveis  do  modelo  de  regressão  explicam 
mais  da  metade  da  variância  das  mesmas. 


Assim,  enquanto  a  multicolinearidade  foi  responsável 
pela  criação  de  quatro  fatores  bem  desenvolvidos  no  Capí¬ 
tulo  3,  aqui  a  inclusão  de  todas  as  variáveis  cria  problemas 
na  estimação  e  na  interpretação. 

A  abordagem  confirmatória  fornece  ao  pesquisador 
controle  sobre  a  variável  estatística  de  regressão,  mas  ao 
custo  possível  de  uma  equação  de  regressão  com  previsão 
e  explicação  mais  pobres  se  o  pesquisador  não  examinar 
atentamente  os  resultados.  As  abordagens  confirmatória  e 
seqüencial  têm  vantagens  e  desvantagens  que  devem  ser 
consideradas  em  seu  uso,  mas  o  pesquisador  prudente  em¬ 
prega  ambas,  a  fim  de  lidar  com  as  vantagens  de  cada  uma. 

Inclusão  de  uma  variável  independente  não-métrica 

A  discussão  anterior  se  concentrou  no  método  de  estima¬ 
ção  confirmatória  como  uma  alternativa  para  talvez  au¬ 
mentar  a  previsão  e  a  explicação,  mas  o  pesquisador  tam¬ 
bém  deve  considerar  o  possível  melhoramento  a  partir  da 
adição  de  variáveis  independentes  não-métricas.  Como 
discutido  em  uma  seção  anterior  e  no  Capítulo  2,  as  variá¬ 
veis  não-métricas  não  podem  ser  diretamente  incluídas  na 

**  N.  de  R.  T.:  A  ordem  correta  dos  números  é  37,9,  33,3  e  44,0. 
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TABELA  4-18  Resultados  de  regressão  múltipla  usando  uma  abordagem  de  estimação  confirmatória  com  todas  as  13  variáveis 
independentes 

Especificação  confirmatória  com  13  variáveis 


R  múltiplo  0,897 

Coeficiente  de  determinação  {Ft)  0,804 

Ff  ajustado  0,774 

Erro  padrão  da  estimativa  0,566 


Análise  de  variância 


Análise  de  variância 


Soma  de 
quadrados 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

113,044 

13 

8,696 

27,111 

0,000 

Resíduo 

27,584 

86 

0,321 

Total 

140,628 

99 

Variáveis  presentes  no  modelo  de  regressão 


Significãncia  Estatísticas  de 

Coeficientes  de  regressão  estatística  Correiações  coiinearidade 


Variáveis  no  modelo 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parciais 

Semi- 

parciais 

Tolerância 

VI F 

(Constante) 

-1,336 

1,120 

-1,192 

0,236 

Xe  Qualidade  do  produto 

0,377 

0,053 

0,442 

7,161 

0,000 

0,486 

0,611 

0,342 

0,598 

1,672 

Xj  Comércio  eletrônico 

-0,456 

0,137 

-0,268 

-3,341 

0,001 

0,283 

-0,339 

-0,160 

0,354 

2,823 

Xg  Suporte  técnico 

0,035 

0,065 

0,045 

0,542 

0,589 

0,113 

0,058 

0,026 

0,328 

3,047 

Xg  Solução  de  reclamação 

0,154 

0,104 

0,156 

1,489 

0,140 

0,603 

0,159 

0,071 

0,207 

4,838 

X,o  Anúncio 

-0,034 

0,063 

-0,033 

-0,548 

0,585 

0,305 

-0,059 

-0,026 

0,646 

1,547 

X,,  Linha  do  produto 

0,362 

0,267 

0,400 

1,359 

0,178 

0,551 

0,145 

0,065 

0,026 

37,978 

X,2  Imagem  da  equipe  de  venda 

0,827 

0,101 

0,744 

8,155 

0,000 

0,500 

0,660 

0,389 

0,274 

3,654 

X,3  Preço  competitivo 

-0,047 

0,048 

0,062 

-0,985 

0,328 

-0,208 

-0,106 

0,047 

0,584 

1,712 

X„  Garantia  e  reclamações 

-0,107 

0,126 

0,074 

-0,852 

0,397 

0,178 

-0,092 

0,041 

0,306 

3,268 

X,5  Novos  produtos 

-0,003 

0,040 

-0,004 

-0,074 

0,941 

0,071 

-0,008 

-0,004 

0,930 

1,075 

X,e  Encomenda  e  cobrança 

0,143 

0,105 

0,111 

1,369 

0,175 

0,522 

0,146 

0,065 

0,344 

2,909 

X„  Flexibilidade  de  preço 

0,238 

0,272 

0,241 

0,873 

0,385 

0,056 

0,094 

0,042 

0,030 

33,332 

X,B  Velocidade  de  entrega 

-0,249 

0,514 

-0,154 

-0,485 

0,629 

0,577 

-0,052 

-0,023 

0,023 

44,004 

equação  de  regressão,  mas  devem  ser  representadas  por 
uma  série  de  novas  variáveis  criadas,  chamadas  de  dico¬ 
tômicas,  as  quais  representam  as  categorias  separadas  da 
variável  não-métrica. 


Neste  exemplo,  a  variável  de  tamanho  da  empresa  (Xj), 
que  tem  as  duas  categorias  (firmas  pequenas  e  gran¬ 
des),  será  acrescentada  ao  processo  de  estimação  ste- 
pwise.  A  variável  já  está  codificada  na  forma  apropria¬ 
da,  sendo  que  as  grandes  empresas  (500  empregados 
ou  mais)  são  codificadas  como  1  e  as  pequenas,  como 
0.  A  variável  pode  ser  diretamente  incluída  na  equação 
de  regressão  para  representar  a  diferença  na  satisfação 
de  clientes  entre  grandes  e  pequenas  empresas,  dadas 
as  outras  variáveis  na  equação  de  regressão.  Especifi¬ 
camente,  como  as  grandes  empresas  têm  o  valor  1,  as 
pequenas  atuam  como  a  categoria  de  referência. 

O  coeficiente  de  regressão  é  interpretado  como  o 
valor  para  grandes  empresas  comparado  com  as  pe¬ 


quenas.  Um  coeficiente  positivo  indica  que  as  grandes 
têm  uma  maior  satisfação  de  clientes  do  que  as  peque¬ 
nas,  enquanto  um  valor  negativo  indica  que  as  peque¬ 
nas  têm  maior  satisfação  de  clientes.  A  magnitude  do 
coeficiente  representa  a  diferença  em  satisfação  de 
clientes  entre  as  médias  dos  dois  grupos,  controlando 
todas  as  demais  variáveis  no  modelo. 

A  Tabela  4-19  contém  os  resultados  da  adição  de 
em  um  modelo  stepwise,  onde  ela  foi  adicionada  às  cin¬ 
co  variáveis  que  formavam  o  modelo  stepwise  anterior 
desta  seção  (ver  Tabela  4-14).  O  exame  das  estatísticas 
gerais  de  ajuste  indica  uma  melhora  mínima,  em  que 
todas  as  medidas  ajustado  e  SEE)  aumentam 

em  relação  ao  modelo  stepwise  (ver  Tabela  4-14).  Isso 
é  apoiado  pela  significãncia  estatística  do  coeficiente 
de  regressão  para  (significãncia  de  0,030).  O  valor 
positivo  do  coeficiente  (0,271)  indica  que  as  empresas 
grandes,  dadas  as  suas  características  nas  outras  cinco 

{Continua) 
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TABELA  4-19  Resultados  de  regressão  múltipla  adicionando  X3  (Tamanho  de  firma)  como  variável  independente  usando-se  uma  variável 
dicotômica 

Regressão  stepwise  com  variáveis  transformadas 


fí  múltiplo  0,895 

Coeficiente  de  determinação  (fi^)  0,801 

Ff  ajustado  0,788 

Erro  padrão  da  estimativa  0,548 


Análise  de  variância 


Análise  de  variância 


Soma  de 
quadrados 

df 

Quadrado  médio 

F 

Sig. 

Regressão 

112,669 

6 

18,778 

62,464 

0,000 

Resíduo 

27,958 

93 

0,301 

Total 

140,628 

99 

Variáveis  presentes  no  modelo  de  regressão 


Significância  Estatísticas  de 

Coeficientes  de  regressão  estatística  Correiações  coiinearidade 


Variáveis  no  modelo 

B 

Erro 

padrão 

Beta 

t 

Sig. 

Ordem 

zero 

Parciais 

Semi- 

parciais 

Tolerância 

VIF 

(Constante) 

-1 ,250 

0,492 

-  2,542 

0,013 

Xg  Solução  de  reclamação 

0,300 

0,060 

0,304 

4,994 

0,000 

0,603 

0,460 

0,231 

0,576 

1,736 

Xg  Qualidade  do  produto 

0,365 

0,046 

0,427 

7,881 

0,000 

0,486 

0,633 

0,364 

0,727 

1,375 

X,2  Imagem  da  equipe  de  venda 

0,701 

0,093 

0,631 

7,507 

0,000 

0,500 

0,614 

0,347 

0,303 

3,304 

Xy  Comércio  eletrônico 

-0,333 

0,135 

-0,196 

-  2,473 

0,015 

0,283 

-0,248 

-0,114 

0,341 

2,935 

X,,  Linha  do  produto 

0,203 

0,061 

0,224 

3,323 

0,001 

0,551 

0,326 

0,154 

0,469 

2,130 

X3  Tamanho  da  firma 

0,271 

0,123 

0,114 

2,207 

0,030 

0,229 

0,223 

0,102 

0,798 

1,253 

(Continuação) 

variáveis  independentes  na  equação,  ainda  têm  uma 
satisfação  de  clientes  que  é  em  torno  de  um  quarto  de 
ponto  maior  (0,271)  na  questão  de  10  pontos.  O  uso  de 
A3  aumentou  a  previsão  só  um  pouco.  Sob  um  ponto  de 
vista  explanatório,  porém,  sabemos  que  grandes  em¬ 
presas  contam  com  maior  satisfação  de  clientes. 


Este  exemplo  ilustra  a  maneira  na  qual  o  pesquisador 
pode  acrescentar  variáveis  não-métricas  às  variáveis  mé¬ 
tricas  na  variável  estatística  de  regressão  e  melhorar  tanto 
a  previsão  quanto  a  explicação. 

Uma  visão  gerencial  dos  resultados 

Os  resultados  da  regressão,  incluindo  a  avaliação  comple¬ 
mentar  do  modelo  confirmatório  e  a  adição  da  variável 
não-métrica,  auxiliam  na  solução  da  questão  básica  de 
pesquisa:  o  que  afeta  a  satisfação  do  cliente?  Ao  formular 
uma  resposta,  o  pesquisador  deve  considerar  dois  aspec¬ 
tos:  previsão  e  explicação. 


Em  termos  de  previsão,  os  modelos  de  regressão  sempre 
atingem  níveis  elevados  de  precisão  preditiva.  A  quantia  de 
variância  explicada  gira  em  torno  de  80%,  e  a  taxa  de  erro 
esperado  para  qualquer  previsão  no  intervalo  de  confiança 


de  95%  é  de  aproximadamente  1,1  pontos.  Nesse  tipo  de 
contexto  de  pesquisa,  tais  níveis,  aumentados  pelos  resulta¬ 
dos  que  suportam  a  validade  do  modelo,  fornecem  os  mais 
altos  níveis  de  garantia  quanto  à  qualidade  e  precisão  dos 
modelos  de  regressão  como  a  base  para  desenvolver  estra¬ 
tégias  de  negócios. 

Em  termos  de  explicação,  todos  os  modelos  estima¬ 
dos  chegaram  essencialmente  aos  mesmos  resultados:  três 
influências  fortes  Imagem  da  equipe  de  venda;  X^, 
Qualidade  do  produto;  e  Xg,  Solução  de  reclamação).  Au¬ 
mentos  em  qualquer  uma  dessas  variáveis  resultarão  em 
aumentos  na  satisfação  do  cliente.  Por  exemplo,  um  au¬ 
mento  de  um  ponto  na  percepção  do  cliente  da  Imagem  da 
equipe  de  venda  (Ajj)  resultará  em  um  aumento  médio  de 
pelo  menos  sete  décimos  (0,701)  de  um  ponto  na  escala  de 
10  pontos  de  satisfação  de  cliente.  Resultados  semelhantes 
são  percebidos  para  as  outras  duas  variáveis.  Além  disso, 
pelo  menos  uma  característica  da  empresa,  tamanho,  de¬ 
monstrou  um  efeito  significante  sobre  satisfação  do  cliente. 
Empresas  maiores  têm  níveis  de  satisfação  em  torno  de  um 
quarto  de  ponto  (0,271)  maiores  do  que  empresas  meno¬ 
res.  Esses  resultados  dão  ao  gerenciamento  uma  estrutura 
para  desenvolver  estratégias  para  melhorar  a  satisfação  do 
cliente.  Ações  dirigidas  para  aumentar  as  percepções  sobre 
a  HBAT  podem  ser  justificadas  à  luz  dos  aumentos  corres¬ 
pondentes  de  satisfação  de  cliente. 

{Continua) 
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{Conlimmção) 

O  impacto  de  duas  outras  variáveis  (Xj,  Comércio  ele¬ 
trônico;  Xjj,  Linha  do  produto)  sobre  a  satisfação  do  clien¬ 
te  é  menos  certo.  Mesmo  que  essas  duas  variáveis  fossem 
incluídas  na  solução  stepwise,  sua  variância  explicada  com¬ 
binada  seria  de  apenas  0,038  fora  de  um  geral  do  mode¬ 
lo  de  0,791.  Ambas  as  variáveis  eram  não-significantes  no 
modelo  confirmatório.  Além  disso,  Z,  tinha  o  sinal  inver¬ 
tido  no  modelo  stepwise,  o  que,  apesar  de  se  dever  à  multi- 
colinearidade,  ainda  representa  um  resultado  contrário  ao 
desenvolvimento  de  uma  estratégia  gerencial.  Como  resul¬ 
tado,  o  pesquisador  deve  considerar  a  redução  da  influên¬ 
cia  alocada  a  essas  variáveis  e  talvez  até  mesmo  omiti-las 
da  consideração  como  influências  na  satisfação  do  cliente. 

Ao  desenvolver  conclusões  ou  planos  estratégicos  a 
partir  desses  resultados,  o  pesquisador  deve  observar  tam¬ 
bém  que  as  três  maiores  influências  (Zjj,  e  X^)  são  com¬ 
ponentes  fundamentais  das  dimensões  perceptuais  identi¬ 
ficadas  na  análise  fatorial  do  Capítulo  3.  Essas  dimensões, 
que  representam  amplas  medidas  de  percepções  da  HB  AT, 
devem  assim  ser  consideradas  em  qualquer  conclusão.  Es¬ 
tabelecer  que  apenas  essas  três  variáveis  específicas  são 
influências  sobre  a  satisfação  do  cliente  seria  uma  séria  in¬ 
compreensão  dos  padrões  mais  complexos  de  colinearida- 
de  entre  variáveis.  Assim,  essas  variáveis  são  melhor  vistas 
como  representativas  das  dimensões  perceptuais,  com  as 
outras  variáveis  em  cada  dimensão  também  sendo  conside¬ 
radas  nas  conclusões  extraídas  desses  resultados. 

A  gerência  agora  tem  uma  análise  objetiva  que  con¬ 
firma  não  somente  as  influências  específicas  de  variáveis- 
chave,  mas  também  as  dimensões  perceptuais  que  devem 
ser  consideradas  em  qualquer  forma  de  planejamento  de 
negócios  que  envolva  estratégias  que  visem  um  impacto 
sobre  a  satisfação  do  cliente. 


Resumo 

Este  capítulo  apresenta  uma  visão  geral  dos  conceitos 
fundamentais  inerentes  à  análise  de  regressão  múltipla.  A 
análise  de  regressão  múltipla  pode  descrever  as  relações 
entre  duas  ou  mais  variáveis  com  escalas  intervalares  e  é 
muito  mais  poderosa  do  que  a  regressão  simples  com  uma 
única  variável  independente.  Este  capítulo  ajuda  você  a 
fazer  o  seguinte: 

Determinar  quando  a  análise  de  regressão  é  a  ferramen¬ 
ta  estatística  apropriada  para  analisar  um  problema.  A 

análise  de  regressão  múltipla  pode  ser  usada  para  anali¬ 
sar  a  relação  entre  uma  variável  dependente  (critério)  e 
diversas  variáveis  independentes  (preditores).  O  objetivo 
da  análise  de  regressão  múltipla  é  usar  as  diversas  variá¬ 
veis  independentes  cujos  valores  são  conhecidos  para  pre¬ 
ver  a  dependente.  Regressão  múltipla  é  uma  técnica  de 
dependência.  Para  usá-la  você  deve  ser  capaz  de  dividir 
as  variáveis  em  dependente  e  independentes,  sendo  que 
todas  devem  ser  métricas.  Sob  certas  circunstâncias,  é 
possível  incluir  dados  não-métricos  tanto  como  variáveis 


independentes  (transformando  dados  ordinais  ou  nomi¬ 
nais  com  uma  codificação  dicotômica)  como  a  dependente 
(pelo  uso  de  uma  medida  binária  na  técnica  especializada 
de  regressão  logística).  Assim,  para  se  aplicar  análise  de 
regressão  múltipla:  (1)  os  dados  devem  ser  métricos  ou 
apropriadamente  transformados,  e,  (2)  antes  de  obter  a 
equação  de  regressão,  o  pesquisador  deve  decidir  qual  va¬ 
riável  será  a  dependente  e  quais  serão  as  independentes. 

Compreender  como  a  regressão  nos  ajuda  a  fazer  previ¬ 
sões  usando  o  conceito  de  mínimos  quadrados.  O  obje¬ 
tivo  da  análise  de  regressão  é  prever  uma  única  variável 
dependente  a  partir  do  conhecimento  de  uma  ou  mais 
variáveis  independentes.  Antes  de  estimar  a  equação  de 
regressão,  devemos  calcular  a  base  de  referência  com  a 
qual  compararemos  a  habilidade  preditiva  de  nossos  mo¬ 
delos  de  regressão.  A  base  deve  representar  nossa  melhor 
previsão  sem  o  emprego  de  variáveis  independentes.  Em 
regressão,  o  preditor  base  é  a  média  simples  da  variável 
dependente.  Como  a  média  não  prevê  perfeitamente  cada 
valor  da  variável  dependente,  devemos  ter  uma  maneira 
de  avaliar  precisão  preditiva  que  possa  ser  utilizada  com 
a  previsão  base  e  com  os  modelos  de  regressão  que  cria¬ 
mos.  A  maneira  usual  de  avaliar  a  precisão  de  qualquer 
previsão  é  examinar  os  erros  na  previsão  da  variável  de¬ 
pendente.  Ainda  que  possamos  esperar  obter  uma  medida 
útil  de  precisão  preditiva  simplesmente  somando  os  erros, 
essa  abordagem  não  é  possível  simplesmente  porque  os 
erros  em  relação  à  média  sempre  somam  zero.  Para  su¬ 
perar  este  problema,  elevamos  ao  quadrado  cada  erro  e 
somamos  os  resultados.  Este  total,  chamado  de  soma  dos 
erros  quadrados  (SSg),  fornece  uma  medida  de  precisão 
preditiva  que  irá  variar  de  acordo  com  a  quantia  de  erros 
de  previsão.  A  meta  é  obter  a  menor  soma  possível  de  er¬ 
ros  quadrados  como  nossa  medida  de  precisão  preditiva. 
Logo,  o  conceito  de  mínimos  quadrados  nos  permite  atin¬ 
gir  a  melhor  precisão  possível. 

Usar  variáveis  dicotômicas  com  uma  compreensão  de  sua 
interpretação.  Uma  situação  comum  encarada  pelos 
pesquisadores  é  o  desejo  de  utilizar  variáveis  independen¬ 
tes  não-métricas.  Muitas  técnicas  multivariadas  assumem 
medidas  métricas  para  variáveis  independentes  e  depen¬ 
dentes.  Quando  a  variável  dependente  é  medida  como  di¬ 
cotômica  (0, 1),  ou  a  análise  discriminante,  ou  uma  forma 
especializada  de  regressão  (regressão  logística),  ambas 
discutidas  no  Capítulo  5,  é  adequada.  Quando  as  variáveis 
independentes  são  não-métricas  e  têm  duas  ou  mais  ca¬ 
tegorias,  podemos  criar  variáveis  dicotômicas  que  atuam 
como  variáveis  independentes  de  substituição.  Cada  va¬ 
riável  dicotômica  representa  uma  categoria  de  uma  variá¬ 
vel  independente  não-métrica,  e  qualquer  variável  não- 
métrica  com  k  categorias  pode  ser  representada  como 
k-1  variáveis  dicotômicas.  Assim,  variáveis  não-métricas 
podem  ser  convertidas  para  um  formato  métrico  para  uso 
na  maioria  das  técnicas  multivariadas. 
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Estar  ciente  das  suposições  inerentes  à  análise  de  regres¬ 
são  e  de  como  avaliá-las.  Melhoramentos  na  previsão 
da  variável  dependente  são  viáveis  acrescentando-se  va¬ 
riáveis  independentes  e  mesmo  transformando-as  para 
representar  relações  não-lineares.  Para  isso,  devemos  fa¬ 
zer  várias  suposições  sobre  as  relações  entre  a  variável  de¬ 
pendente  e  as  independentes  que  afetam  o  procedimento 
estatístico  (mínimos  quadrados)  usado  para  regressão 
múltipla.  A  questão  básica  é  saber,  no  curso  do  cálculo 
dos  coeficientes  de  regressão  e  previsão  da  variável  de¬ 
pendente,  se  as  suposições  da  análise  de  regressão  foram 
atendidas.  Devemos  saber  se  os  erros  de  previsão  são  re¬ 
sultado  da  ausência  de  uma  relação  entre  as  variáveis  ou 
se  são  provocados  por  algumas  características  dos  dados 
que  não  estão  acomodadas  pelo  modelo  de  regressão. 
As  suposições  a  serem  examinadas  incluem  linearidade 
do  fenômeno  medido,  variância  constante  dos  termos  de 
erro,  independência  dos  termos  de  erro,  e  normalidade 
da  distribuição  dos  mesmos.  As  suposições  inerentes  à 
análise  de  regressão  múltipla  se  aplicam  tanto  às  variá¬ 
veis  individuais  (dependente  e  independentes)  quanto  à 
relação  como  um  todo.  Uma  vez  que  a  variável  estatística 
tenha  sido  obtida,  ela  atua  coletivamente  na  previsão  da 
variável  dependente,  necessitando-se  de  uma  avaliação 
das  suposições  não  apenas  para  as  variáveis  individuais, 
mas  também  para  a  variável  estatística.  A  principal  medi¬ 
da  de  erro  de  previsão  para  a  variável  estatística  é  o  resí¬ 
duo  -  a  diferença  entre  os  valores  observados  e  previstos 
para  a  variável  dependente.  Fazer  o  gráfico  dos  resíduos 
versus  variáveis  independentes  ou  previstas  é  um  método 
básico  para  identificar  violações  de  suposição  para  a  re¬ 
lação  geral. 

Selecionar  uma  técnica  de  estimação  e  explicar  a  dife¬ 
rença  entre  stepwise  e  regressão  simultânea.  Em  re¬ 
gressão  múltipla,  um  pesquisador  pode  escolher  diver¬ 
sas  variáveis  independentes  possíveis  para  inclusão  na 
equação  de  regressão.  As  vezes,  o  conjunto  de  variáveis 
independentes  é  exatamente  especificado  e  o  modelo  de 
regressão  é  essencialmente  utilizado  como  uma  técnica 
confirmatória.  Essa  abordagem,  chamada  de  regressão 
simultânea,  inclui  todas  as  variáveis  ao  mesmo  tempo. 
Em  outros  casos,  o  pesquisador  pode  usar  a  técnica  esti¬ 
mativa  do  “pegue  e  escolha”  dentro  do  conjunto  de  va¬ 
riáveis  independentes  com  métodos  de  busca  seqüencial 
ou  processos  combinatórios.  O  método  de  busca  seqüen¬ 
cial  mais  popular  é  a  estimação  stepwise,  que  permite  ao 
pesquisador  examinar  a  contribuição  de  cada  variável 
independente  ao  modelo  de  regressão.  A  abordagem 
combinatória  é  um  processo  de  busca  generalizada  en¬ 
tre  todas  as  possíveis  combinações  de  variáveis  indepen¬ 
dentes.  O  procedimento  mais  conhecido  é  a  regressão 
de  todos-os-possíveis-subconjuntos,  que  é  exatamente  o 
que  o  nome  sugere.  Todas  as  possíveis  combinações  das 
variáveis  independentes  são  examinadas,  e  o  conjunto 
de  variáveis  melhor  ajustado  é  identificado.  Cada  técnica 


de  estimação  é  planejada  para  auxiliar  o  pesquisador  na 
busca  do  melhor  modelo  de  regressão  usando  diferentes 
abordagens. 

Interpretar  os  resultados  de  regressão.  A  variável  esta¬ 
tística  de  regressão  deve  ser  interpretada  avaliando-se  os 
coeficientes  de  regressão  estimados  quanto  à  sua  explica¬ 
ção  da  variável  dependente.  O  pesquisador  deve  avaliar 
não  somente  o  modelo  de  regressão  que  foi  estimado,  mas 
também  as  potenciais  variáveis  independentes  que  foram 
omitidas  no  caso  de  uma  busca  seqüencial  ou  uma  técnica 
combinatória  ter  sido  empregada.  Nessas  abordagens,  mul- 
ticolinearidade  pode  afetar  substancialmente  as  variáveis 
incluídas  na  variável  estatística  de  regressão.  Logo,  além 
de  avaliar  os  coeficientes  estimados,  o  pesquisador  tam¬ 
bém  deve  olhar  o  impacto  potencial  de  variáveis  omitidas 
para  garantir  que  a  significância  gerencial  seja  examinada 
juntamente  com  a  significância  estatística.  Os  coeficientes 
de  regressão  estimados,  ou  coeficientes  beta,  represen¬ 
tam  o  tipo  de  relação  (positiva  ou  negativa)  e  a  força  da 
relação  entre  variáveis  independentes  e  dependente  na 
variável  estatística  de  regressão.  O  sinal  do  coeficiente  de¬ 
nota  se  a  relação  é  positiva  ou  negativa,  enquanto  o  valor 
do  mesmo  mostra  a  variação  no  valor  dependente  cada 
vez  que  a  variável  independente  varia  em  uma  unidade. 
Previsão  é  um  elemento  integral  na  análise  de  regressão, 
tanto  no  processo  de  estimação  quanto  em  situações  suge¬ 
ridas  pelo  próprio  nome.  Regressão  envolve  o  uso  de  uma 
variável  estatística  para  estimar  um  só  valor  para  a  variá¬ 
vel  dependente.  Este  processo  é  usado  não  somente  para 
calcular  os  valores  previstos  no  procedimento  de  estima¬ 
ção,  mas  também  com  amostras  adicionais  para  validação 
ou  para  fins  de  previsão.  Freqüentemente  o  pesquisador 
está  interessado  não  apenas  em  previsão,  mas  também  em 
explicação.  Variáveis  independentes  com  coeficientes  de 
regressão  maiores  têm  uma  contribuição  maior  para  o  va¬ 
lor  previsto.  Consegue-se  uma  visão  sobre  a  relação  entre 
variáveis  independentes  e  dependente  ao  se  examinarem 
as  contribuições  relativas  de  cada  variável  independente. 
Logo,  para  fins  de  explicação,  os  coeficientes  de  regressão 
se  tornam  indicadores  do  impacto  relativo  e  da  importân¬ 
cia  das  variáveis  independentes  em  suas  relações  com  a 
dependente. 

Aplicar  os  procedimentos  diagnósticos  necessários  para 
avaliar  observações  inflnentes.  Observações  influentes 
incluem  todas  aquelas  que  têm  efeito  desproporcional  so¬ 
bre  os  resultados  de  regressão.  Os  três  tipos  básicos  são 
os  seguintes: 

1.  Observações  atípicas.  Observações  que  têm  grandes  valores 
residuais  e  podem  ser  identificadas  somente  em  relação  a 
um  modelo  específico  de  regressão. 

2.  Pontos  de  alavancagem.  Observações  que  são  distintas  das 
demais  com  base  nos  valores  das  variáveis  independentes. 

3.  Observações  influentes.  Todas  aquelas  que  têm  um  efeito 
desproporcional  sobre  os  resultados  de  regressão. 
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Observações  influentes,  atípicas  e  pontos  de  alavanca¬ 
gem  são  baseadas  em  uma  entre  quatro  condições: 

1.  Um  erro  de  observações  ou  de  entrada  de  dados:  Remedie 
corrigindo  os  dados  ou  eliminando  o  caso. 

2.  Uma  observação  válida  mas  excepcional  que  é  explicável  por 
uma  situação  extraordinária:  Remedie  eliminando  o  caso,  a 
menos  que  variáveis  refletindo  a  situação  extraordinária  se¬ 
jam  incluídas  na  equação  de  regressão. 

3.  Uma  observação  excepcional  aparentemente  sem  explicação: 
Apresenta  um  problema  especial,  pois  o  pesquisador  não 
tem  motivo  para  eliminar  o  caso,  mas  sua  inclusão  não  pode 
ser  justificada,  o  que  sugere  análises  com  e  sem  as  observa¬ 
ções  para  fins  de  uma  avaliação  completa. 

4.  Uma  observação  comum  em  suas  características  individuais 
mas  excepcional  em  sua  combinação  de  características:  In¬ 
dica  modificações  na  base  conceituai  do  modelo  e  deve  ser 
mantida. 

O  pesquisador  deve  eliminar  observações  verdadei¬ 
ramente  excepcionais  mas  evitar  descartar  aquelas  que, 
apesar  de  diferentes,  são  representativas  da  população. 

Este  capítulo  fornece  uma  apresentação  fundamental 
sobre  como  funciona  a  regressão  e  o  que  ela  pode  alcan¬ 
çar.  A  familiaridade  com  os  conceitos  apresentados  dá 
uma  fundamentação  para  a  análise  de  regressão  que  o 
pesquisador  deve  utilizar,  e  ajuda  a  entender  melhor  os 
tópicos  mais  complexos  e  técnicos  de  outros  livros  sobre 
esse  assunto. 

Questões 

1.  Como  você  explica  a  importância  relativa  das  variáveis  in¬ 
dependentes  usadas  em  uma  equação  de  regressão? 

2.  Por  que  é  importante  examinar  a  suposição  de  linearidade 
quando  se  usa  regressão? 

3.  Como  a  não-linearidade  pode  ser  corrigida  ou  explicada  na 
equação  de  regressão? 

4.  Você  consegue  encontrar  uma  equação  de  regressão  que 
seja  aceitável  como  estatisticamente  significante,  mas  que 
não  ofereça  valor  interpretativo  aceitável  para  fins  de  admi¬ 
nistração? 

5.  Qual  é  a  diferença  de  interpretação  entre  os  coeficientes  de 
regressão  associados  com  variáveis  independentes  métricas 
e  aqueles  associados  com  variáveis  codificadas  como  dicotô¬ 
micas  (0, 1)? 

6.  Quais  são  as  diferenças  entre  variáveis  independentes  inte¬ 
rativas  e  correlacionadas?  Algumas  dessas  diferenças  afe¬ 
tam  sua  interpretação  da  equação  de  regressão? 

7.  Qs  casos  influentes  devem  sempre  ser  omitidos?  Dê  exem¬ 
plos  de  ocasiões  em  que  eles  devem  ou  não  devem  ser  omi¬ 
tidos. 


Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  ilustrando  problemas  e 

aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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CAPITULO 


Análise  Discriminante  Múltipla 
e  Regressão  Logística 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Estabelecer  as  circunstâncias  sob  as  quais  a  análise  discriminante  linear  ou  a  regressão 
logística  deve  ser  usada  no  lugar  de  uma  regressão  múltipla. 

■  Identificar  as  questões  mais  importantes  relativas  aos  tipos  de  variáveis  usadas  e  ao  tamanho 
de  amostra  exigido  na  aplicação  de  análise  discriminante. 

■  Compreender  as  suposições  inerentes  á  análise  discriminante  para  avaliar  a  adequação  de 
seu  uso  em  um  problema  em  particular. 

■  Descrever  as  duas  abordagens  computacionais  para  a  análise  discriminante  e  o  método  para 
avaliar  o  ajuste  geral  do  modelo. 

■  Explicar  o  que  é  uma  matriz  de  classificação  e  como  desenvolver  uma,  e  descrever  as 
maneiras  de  avaliar  a  precisão  preditiva  da  função  discriminante. 

■  Dizer  como  identificar  variáveis  independentes  com  poder  discriminatório. 

■  Justificar  0  uso  de  uma  abordagem  de  partição  de  amostras  para  validação. 

■  Compreender  as  vantagens  e  desvantagens  da  regressão  logística  comparada  com  a  análise 
discriminante  e  a  regressão  múltipla. 

■  Interpretar  os  resultados  de  uma  análise  de  regressão  logística,  comparando-os  com  a 
regressão  múltipla  e  a  análise  discriminante. 


Apresentação  do  capítulo 

A  regressão  múltipla  é  sem  dúvida  a  técnica  de  dependência  multivariada  mais  amplamente  empre¬ 
gada.  A  base  para  a  popularidade  da  regressão  tem  sido  sua  habilidade  de  prever  e  explicar  variáveis 
métricas.  Mas  o  que  acontece  quando  variáveis  não-métricas  tornam  a  regressão  múltipla  Inadequada? 
Este  capítulo  introduz  duas  técnicas  -  análise  discriminante  e  regressão  logística  -  que  tratam  da  situa¬ 
ção  de  uma  variável  dependente  não-métrica.  Neste  tipo  de  situação,  o  pesquisador  está  interessado 
na  previsão  e  na  explicação  das  relações  que  afetam  a  categoria  na  qual  um  objeto  está  localizado, 
como  a  questão  do  por  quê  uma  pessoa  é  um  cliente  ou  não,  ou  se  uma  empresa  terá  sucesso  ou  fra¬ 
cassará.  Os  dois  maiores  objetivos  deste  capítulo  são: 

1.  Introduzir  a  natureza,  a  filosofia  e  as  condições  da  análise  discriminante  múltipla  e  da  regressão  logís¬ 
tica 

2.  Demonstrar  a  aplicação  e  interpretação  dessas  técnicas  com  um  exemplo  ilustrativo 

O  Capítulo  1  estabeleceu  que  o  propósito  básico  da  análise  discriminante  é  estimar  a  relação  entre 
uma  variável  dependente  não-métrica  (categórica)  e  um  conjunto  de  variáveis  independentes  métricas, 
nesta  forma  geral: 

T,  =X, +X,  +  X3  +  "-  +  X„ 

(não-métrica)  (métricas) 
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A  análise  discriminante  múltipla  e  a  regressão  logística  encontram  amplas  aplicações  em  situações 
nas  quais  o  objetivo  principal  é  identificar  o  grupo  ao  qual  um  objeto  (p.ex.,  uma  pessoa,  uma  firma 
ou  um  produto)  pertence.  Apiicações  potenciais  incluem  prever  o  sucesso  ou  fracasso  de  um  novo 
produto,  decidir  se  um  estudante  deve  ser  aceito  em  uma  faculdade,  classificar  estudantes  quanto  a 
interesses  vocacionais,  determinar  a  categoria  de  risco  de  crédito  de  uma  pessoa,  ou  prever  se  uma 
empresa  terá  sucesso.  Em  cada  caso,  os  objetos  recaem  em  grupos,  e  o  objetivo  é  prever  ou  expiicar 
as  bases  para  a  pertinência  de  cada  objeto  a  um  grupo  através  de  um  conjunto  de  variáveis  indepen¬ 
dentes  selecionadas  pelo  pesquisador 


Termos-chave 

Antes  de  começar  o  capítuio,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque,  além  das  referências  cruza¬ 
das  nos  termos-chave,  estão  em  itálico.  Exemplos  ilustrativos 
estão  em  quadros. 

Amostra  de  análise  Grupo  de  casos  usado  para  estimar  a(s) 
função(ões)  discriminante(s)  ou  o  modelo  de  regressão  logís¬ 
tica.  Quando  se  constroem  matrizes  de  classificação,  a  amos¬ 
tra  original  é  dividida  aieatoriamente  em  dois  grupos,  um  para 
estimação  do  modelo  (a  amostra  de  análise)  e  o  outro  para 
validação  (a  amostra  de  teste). 

Abordagem  de  extremos  polares  Método  para  construir  uma 
variável  dependente  categórica  a  partir  de  uma  variável  métri¬ 
ca.  Primeiro,  a  variávei  métrica  é  dividida  em  três  categorias. 
Em  seguida,  as  categorias  extremas  são  usadas  na  análise 
discriminante  ou  na  regressão  logística,  e  a  categoria  do  meio 
não  é  incluída  na  anáiise. 

Amostra  de  teste  Grupo  de  objetos  não  usados  para  computar 
a(s)  função(ões)  discriminante(s)  ou  o  modelo  de  regressão 
logística.  Esse  grupo  é  então  usado  para  validar  a  função 
discriminante  ou  o  modelo  de  regressão  logística  em  uma 
amostra  separada  de  respondentes.  É  também  chamada  de 
amostra  de  validação. 

Amostra  de  validação  Ver  amostra  de  teste. 

Análise  logit  Ver  regressão  logística. 

Cargas  discriminantes  Medida  da  correiação  linear  simples 
entre  cada  variável  independente  e  o  escore  Z  discriminante 
para  cada  função  discriminante;  também  chamadas  de  corre¬ 
lações  estruturais.  As  cargas  discriminantes  são  calculadas 
sendo  incluída  uma  variável  independente  na  função  discri¬ 
minante  ou  não. 

Centróide  Valor  médio  para  os  escores  Z  discriminantes  de  to¬ 
dos  os  objetos,  em  uma  dada  categoria  ou  grupo.  Por  exem- 
pio,  uma  anáiise  discriminante  de  dois  grupos  tem  dois  cen- 
tróides,  um  para  os  objetos  em  cada  grupo. 

Coeficiente  discriminante  Ver  peso  discriminante. 

Coeficiente  logístico  exponenciado  Anti-logaritmo  do  coefi¬ 
ciente  logístico,  usado  para  fins  de  interpretação  na  regres¬ 
são  logística.  O  coeficiente  exponenciado  menos  1,0  é  igual 
à  mudança  percentual  nas  desigualdades.  Por  exemplo,  um 
coeficiente  exponenciado  de  0,20  representa  uma  mudança 
negativa  de  80%  na  desigualdade  (0,20  -  1 ,0  =  -  0,80)  para 
cada  unidade  de  variação  na  variável  independente  (o  mes¬ 
mo  se  a  desigualdade  fosse  multiplicada  por  0,20).  Assim,  um 


valor  de  1 ,0  se  iguala  a  nenhuma  mudança  na  desigualdade, 
e  valores  acima  de  1 ,0  representam  aumentos  na  desigualda¬ 
de  prevista. 

Coeficiente  logístico  Coeficiente  no  modelo  de  regressão  lo¬ 
gística  que  atua  como  o  fator  de  ponderação  para  as  variá¬ 
veis  independentes  em  relação  a  seu  poder  discriminatório. 
Semelhante  a  um  peso  de  regressão  ou  um  coeficiente  dis¬ 
criminante. 

Correlações  estruturais  Ver  cargas  discriminantes. 

Critério  das  chances  proporcionais  Outro  critério  para  avaliar 
a  razão  de  sucesso,  no  qual  a  probabilidade  média  de  clas¬ 
sificação  é  calculada  considerando-se  todos  os  tamanhos  de 
grupos. 

Critério  de  chance  máxima  Medida  de  precisão  preditiva  na 
matriz  de  classificação  que  é  calculada  como  o  percentual  de 
respondentes  no  maior  grupo.  A  idéia  é  que  a  melhor  escolha 
desinformada  é  classificar  cada  observação  no  maior  grupo. 

Curva  logística  Uma  curva  em  S  formada  pela  transformação 
logit  que  representa  a  probabilidade  de  um  evento.  A  forma 
em  S  é  não-linear  porque  a  probabilidade  de  um  evento  deve 
se  aproximar  de  0  e  1,  porém  jamais  sair  destes  limites.  As¬ 
sim,  apesar  de  haver  uma  componente  linear  no  meio  do  in¬ 
tervalo,  á  medida  que  as  probabilidades  se  aproximam  dos 
limites  inferior  e  superior  de  probabilidade  (0  e  1 ),  elas  devem 
se  amenizar  e  ficar  assintóticas  nesses  limites. 

Escore  de  corte  ótimo  Valor  de  escore  Z  discriminante  que  me¬ 
lhor  separa  os  grupos  em  cada  função  discriminante  para  fins 
de  classificação. 

Escore  de  corte  Critério  segundo  o  qual  cada  escore  Z  discri¬ 
minante  individual  é  comparado  para  determinar  a  pertinência 
prevista  em  um  grupo.  Quando  a  análise  envolve  dois  grupos, 
a  previsão  de  grupo  é  determinada  computando-se  um  úni¬ 
co  escore  de  corte.  Elementos  com  escores  Z  discriminantes 
abaixo  dessa  marca  são  designados  a  um  grupo,  enquanto 
aqueles  com  escores  acima  são  classificados  no  outro.  Para 
três  ou  mais  grupos,  funções  discriminantes  múltiplas  são 
usadas,  com  um  escore  de  corte  diferente  para  cada  função. 

Escore  Z  Ver  escore  Z  discriminante. 

Escore  Z  discriminante  Escore  definido  pela  função  discri¬ 
minante  para  cada  objeto  na  análise  e  geralmente  dado  em 
termos  padronizados.  Também  conhecido  como  escore  Z,  é 
calculado  para  cada  objeto  em  cada  função  discriminante  e 
usado  em  conjunção  com  o  escore  de  corte  para  determinar 
pertinência  prevista  ao  grupo.  É  diferente  da  terminologia  es¬ 
core  z  usada  para  variáveis  padronizadas. 

Estatística  Q  de  Press  Medida  do  poder  classificatório  da 
função  discriminante  quando  comparada  com  os  resultados 
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esperados  de  um  modelo  de  chances.  O  valor  calculado  é 
comparado  com  um  valor  crítico  baseado  na  distribuição  qui- 
quadrado.  Se  o  vaior  calcuiado  exceder  o  vaior  crítico,  os  re¬ 
sultados  da  classificação  serão  significantemente  melhores 
do  que  se  esperaria  do  acaso. 

Estatística  Wald  Teste  usado  em  regressão  logística  para  a  sig- 
nificãncia  do  coeficiente  logístico.  Sua  interpretação  é  seme¬ 
lhante  aos  valores  Fou  f  usados  para  o  teste  de  significância 
de  coeficientes  de  regressão. 

Estimação  simuitânea  Estimação  da(s)  função(ões)  discrimi- 
nante(s)  ou  do  modelo  de  regressão  logística  em  um  único 
passo,  onde  pesos  para  todas  as  variáveis  independentes 
são  calculados  simultaneamente;  contrasta  com  a  estimação 
stepwise,  na  qual  as  variáveis  independentes  entram  seqüen- 
cialmente  de  acordo  com  o  poder  discriminante. 

Estimação  stepwise  Processo  de  estimação  de  função(ões) 
discriminante(s)  ou  do  modelo  de  regressão  logística  no  qual 
variáveis  independentes  entram  seqüencialmente  de  acordo 
com  0  poder  discriminatório  que  elas  acrescentam  à  previsão 
de  pertinência  no  grupo. 

Expansão  dos  vetores  Vetor  escalonado  no  qual  o  vetor  origi¬ 
nal  é  modificado  para  represenfar  a  razão  F correspondente. 
Usado  para  representar  graficamente  as  cargas  da  função 
discriminante  de  uma  maneira  combinada  com  os  centróides 
de  grupo. 

Função  de  classificação  Método  de  classificação  no  qual  uma 
função  linear  é  definida  para  cada  grupo.  A  classificação  é 
realizada  calculando-se  um  escore  para  cada  observação  na 
função  de  classificação  de  cada  grupo  e  então  designando- 
se  a  observação  ao  grupo  com  o  maior  escore.  É  diferente  do 
cálculo  do  escore  Z discriminante,  que  é  calculado  para  cada 
função  discriminante. 

Função  discriminante  linear  de  Fisher  Ver  função  de  classifi¬ 
cação. 

Função  discriminante  Uma  variável  estatística  das  variáveis 
independentes  selecionadas  por  seu  poder  discriminatório 
usado  na  previsão  de  pertinência  ao  grupo.  O  valor  previsto 
da  função  discriminante  é  o  escore  Z  discriminante,  o  qual  é 
calculado  para  cada  objeto  (pessoa,  empresa  ou  produto)  na 
análise.  Ele  toma  a  forma  da  equação  linear 

Z,,=  a+W,X,,+  W,X,,+  -'-  +  W^^, 

onde 

ZJ),  =  escore  Z  discriminante  da  função  discriminante) para 
0  objeto  k 
a  =  intercepto 

l/l).  =  peso  discriminante  para  a  variável  independente  / 

X,),  =  variável  independente  /  para  o  objeto  k 

índice  potência  Medida  composta  do  poder  discriminatório  de 
uma  variável  independente  quando  mais  de  uma  função  dis¬ 
criminante  é  estimada.  Baseada  em  cargas  discriminantes,  é 
uma  medida  relativa  usada  para  comparar  a  discriminação 
geral  dada  por  conta  de  cada  variável  independente  em  to¬ 
das  as  funções  discriminantes  significantes. 

M  de  Box  Teste  estatístico  para  a  igualdade  das  matrizes  de  co- 
variãncia  das  variáveis  independentes  nos  grupos  da  variável 
dependente.  Se  a  significância  estatística  não  exceder  o  nível 


crítico  (i.e.,  não-significância),  então  a  igualdade  das  matrizes 
de  covariância  encontra  sustentação.  Se  o  teste  mostra  signi- 
ficãncia  estatística,  os  grupos  são  considerados  diferentes  e 
a  suposição  é  violada. 

Mapa  territorial  Representação  gráfica  dos  escores  de  corte 
em  um  gráfico  de  duas  dimensões.  Quando  é  combinado  com 
os  gráficos  de  casos  individuais,  a  dispersão  de  cada  grupo 
pode  ser  vista  e  as  classificações  ruins  de  casos  individuais 
podem  ser  diretamente  identificadas  a  partir  do  mapa. 

Matriz  de  classificação  Meio  de  avaliar  a  habilidade  preditiva 
da(s)  função(ões)  discriminante(s)  ou  da  regressão  logística 
(também  chamada  de  matriz  confusão,  designação  ou  de 
previsão).  Criada  pela  tabulação  cruzada  dos  membros  do 
grupo  real  com  os  do  grupo  previsto,  essa  matriz  consiste  em 
números  na  diagonal,  que  representam  classificações  corre¬ 
tas,  e  números  fora  da  diagonal,  que  representam  classifica¬ 
ções  incorretas. 

Percentual  corretamente  classificado  Ver  razão  de  sucesso. 

Peso  discriminante  Peso  cujo  tamanho  se  relaciona  ao  poder 
discriminatório  daquela  variável  independente  ao  longo  dos 
grupos  da  variável  dependente.  Variáveis  independentes  com 
grande  poder  discriminatório  geralmente  têm  pesos  grandes, 
e  as  que  apresentam  pouco  poder  discriminatório  geralmente 
têm  pesos  pequenos.  No  entanto,  a  multicolinearidade  entre 
as  variáveis  independentes  provoca  exceções  a  essa  regra.  É 
também  chamado  de  coeficiente  discriminante. 

Pseudo  Um  valor  de  ajuste  geral  do  modelo  que  pode  ser 
calculado  para  regressão  logística-,  comparável  com  a  medi¬ 
da  Ff  usada  em  regressão  múltipla. 

Razão  de  desigualdade  A  comparação  da  probabilidade  de 
um  evento  acontecer  com  a  probabilidade  de  o  evento  não 
acontecer,  a  qual  é  usada  como  uma  medida  da  variável  de¬ 
pendente  em  regressão  logística. 

Razão  de  sucesso  Percentual  de  objetos  (indivíduos,  respon- 
dentes,  empresas  etc.)  corretamente  classificados  pela  fun¬ 
ção  discriminante.  É  calculada  como  o  número  de  objetos  na 
diagonal  da  matriz  de  classificação  dividido  pelo  número  total 
de  objetos.  Também  conhecida  como  percentual  corretamen¬ 
te  classificado. 

Regressão  logística  Eorma  especial  de  regressão  na  qual  a  va¬ 
riável  dependente  é  não-métrica,  dicotômica  (binária).  Apesar 
de  algumas  diferenças,  a  maneira  geral  de  interpretação  é 
semelhante  á  da  regressão  linear. 

Tolerância  Proporção  da  variação  nas  variáveis  independentes 
não  explicada  pelas  variáveis  que  já  estão  no  modelo  (função). 
Pode  ser  usada  como  proteção  contra  a  multicolinearidade. 
Calculada  como  1  -  Rf,  onde  Rf‘  é  a  quantia  de  variância  da 
variável  independente  /  explicada  por  todas  as  outras  variáveis 
independentes.  Uma  tolerância  de  0  significa  que  a  variável  in¬ 
dependente  sob  consideração  é  uma  combinação  linear  per¬ 
feita  de  variáveis  independentes  já  no  modelo.  Uma  tolerância 
de  1  significa  que  uma  variável  independente  é  totalmente  in¬ 
dependente  de  outras  variáveis  que  já  estão  no  modelo. 

Transformação  logit  Transformação  dos  valores  da  variável 
dependente  binária  discreta  da  regressão  logística  em  uma 
curva  em  S  {curva  logística)  que  representa  a  probabilidade 
de  um  evento.  Essa  probabilidade  é  então  usada  para  formar 
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a  razão  de  desigualdade,  a  qual  atua  como  a  variável  depen¬ 
dente  na  regressão  logística. 

Validação  cruzada  Procedimento  de  divisão  da  amostra  em 
duas  partes:  a  amostra  de  análise,  usada  na  estimação  da(s) 
função(ões)  discriminante(s)  ou  do  modelo  de  regressão  lo¬ 
gística,  e  a  amostra  de  teste,  usada  para  validar  os  resultados. 
A  validação  cruzada  evita  o  super-ajuste  da  função  discrimi¬ 
nante  ou  da  regressão  logística,  permitindo  sua  validação  em 
uma  amostra  totalmente  separada. 

Validação  por  partição  de  amostras  Ver  validação  cruzada. 

Valor  de  verossimilhança  Medida  usada  em  regressão  logís¬ 
tica  para  representar  a  falta  de  ajuste  preditivo.  Ainda  que 
esses  métodos  não  usem  o  procedimento  dos  mínimos  qua¬ 
drados  na  estimação  do  modelo,  como  se  faz  em  regressão 
múltipla,  0  valor  de  verossimilhança  é  parecido  oom  a  soma 
de  erros  quadrados  na  análise  de  regressão. 

Variável  categórica  Ver  variável  não-métrica. 

Variável  estatística  Combinação  linear  que  representa  a  soma 
ponderada  de  duas  ou  mais  variáveis  independentes  que  for¬ 
mam  a  função  discriminante.  Também  chamada  de  combina¬ 
ção  linear  ou  composta  linear. 

Variável  métrica  Variável  com  uma  unidade  constante  de  medi¬ 
da.  Se  uma  variável  métrica  tem  intervalo  de  1  a  9,  a  diferença 
entre  1  e  2  é  a  mesma  que  aquela  entre  8  e  9.  Uma  discussão 
mais  completa  de  suas  oaracterístioas  e  diferenças  em  rela¬ 
ção  a  uma  variável  não-métrica  ou  categórica  é  enoontrada 
no  Capítulo  1. 

Variável  não-métrica  Variável  com  valores  que  servem  me¬ 
ramente  como  um  rótulo  ou  meio  de  identifioação,  também 
conheoida  como  variável  categórioa,  nominal,  binária,  quali¬ 
tativa  ou  taxonômica.  O  número  de  um  uniforme  de  futebol  é 
um  exemplo.  Uma  discussão  mais  completa  sobre  suas  ca¬ 
racterísticas  e  diferenças  em  relação  a  uma  variável  métrica  é 
encontrada  no  Capítulo  1 . 

Vetor  Representação  da  direção  e  magnitude  do  papel  de  uma 
variável  como  retratada  em  uma  interpretação  gráfioa  de  re¬ 
sultados  da  análise  disoriminante. 


O  QUE  SÃO  ANÁLISE  DISCRIMINANTE 
E  REGRESSÃO  LOGÍSTICA? 

Ao  tentarmos  escolher  uma  técnica  analítica  apropriada, 
às  vezes  encontramos  um  problema  que  envolve  uma  va¬ 
riável  dependente  categórica  e  várias  variáveis  indepen¬ 
dentes  métricas.  Por  exemplo,  podemos  querer  distinguir 
riscos  de  crédito  bons  de  ruins.  Se  tivéssemos  uma  medida 
métrica  de  risco  de  crédito,  poderíamos  usar  a  regressão 
múltipla.  Em  muitos  casos  não  temos  a  medida  métrica 
necessária  para  regressão  múltipla.  Ao  invés  disso,  somos 
capazes  somente  de  verificar  se  alguém  está  em  um  grupo 
particular  (p.ex.,  risco  de  crédito  bom  ou  ruim). 

Análise  discriminante  e  regressão  logística  são  as  téc¬ 
nicas  estatísticas  apropriadas  quando  a  variável  depen¬ 
dente  é  categórica  (nominal  ou  não-métrica)  e  as  variáveis 
independentes  são  métricas.  Em  muitos  casos,  a  variável 


dependente  consiste  em  dois  grupos  ou  classificações,  por 
exemplo,  masculino  versus  feminino  ou  alto  versus  bai¬ 
xo.  Em  outros  casos,  mais  de  dois  grupos  são  envolvidos, 
como  as  classificações  em  baixo,  médio  e  alto.  A  análi¬ 
se  discriminante  é  capaz  de  lidar  com  dois  ou  múltiplos 
(três  ou  mais)  grupos.  Quando  duas  classificações  estão 
envolvidas,  a  técnica  é  chamada  de  análise  discriminan¬ 
te  de  dois  grupos.  Quando  três  ou  mais  classificações  são 
identificadas,  a  técnica  é  chamada  de  análise  discriminante 
múltipla  {MD A).  A  regressão  logística,  também  conheci¬ 
da  como  análise  logit,  é  limitada,  em  sua  forma  básica,  a 
dois  grupos,  apesar  de  formulações  alternativas  poderem 
lidar  com  mais  de  dois  grupos. 

Análise  discriminante 

A  análise  discriminante  envolve  determinar  uma  variável 
estatística.  Elma  variável  estatística  discriminante  é  a  com¬ 
binação  linear  das  duas  (ou  mais)  variáveis  independentes 
que  melhor  discriminarão  entre  os  objetos  (pessoas,  em¬ 
presas  etc.)  nos  grupos  definidos  a priori.  A  discriminação 
é  conseguida  estabelecendo-se  os  pesos  da  variável  esta¬ 
tística  para  cada  variável  independente  para  maximizar  as 
diferenças  entre  os  grupos  (i.e.,  a  variância  entre  grupos 
relativa  à  variância  interna  no  grupo).  A  variável  estatís¬ 
tica  para  uma  análise  discriminante,  também  conhecida 
como  a  função  discriminante,  é  determinada  a  partir  de 
uma  equação  que  se  parece  bastante  com  aquela  vista  em 
regressão  múltipla.  Ela  assume  a  seguinte  forma: 

+  •  •  •  +  w„x„, 

onde 

=  escore  Z  discriminante  da  função  discriminante 
j  para  o  objeto  k 
a  =  intercepto 

TE;  =  peso  discriminante  para  a  variável  indepen¬ 
dente  i 

X-,^  =  variável  independente  i  para  o  objeto  k 

Como  acontece  com  a  variável  estatística  em  regres¬ 
são  ou  qualquer  outra  técnica  multivariada,  percebemos 
o  escore  discriminante  para  cada  objeto  na  análise  (pes¬ 
soa,  firma  etc.)  como  sendo  uma  soma  dos  valores  obtidos 
pela  multiplicação  de  cada  variável  independente  por  seu 
peso  discriminante.  Q  que  torna  a  análise  discriminante 
única  é  que  mais  de  uma  função  discriminante  pode  estar 
presente,  resultando  na  possibilidade  de  que  cada  obje¬ 
to  possa  ter  mais  de  um  escore  discriminante.  Discutire¬ 
mos  o  que  determina  o  número  de  funções  discriminantes 
depois,  mas  aqui  vemos  que  a  análise  discriminante  tem 
semelhanças  e  diferenças  quando  comparada  com  outras 
técnicas  multivariadas. 

A  análise  discriminante  é  a  técnica  estatística  apro¬ 
priada  para  testar  a  hipótese  de  que  as  médias  de  grupo 
de  um  conjunto  de  variáveis  independentes  para  dois  ou 
mais  grupos  são  iguais.  Calculando  a  média  dos  escores 
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discriminantes  para  todos  os  indivíduos  em  um  grupo 
particular,  conseguimos  a  média  do  grupo.  Essa  média  de 
grupo  é  chamada  de  centróide.  Quando  a  análise  envolve 
dois  grupos,  há  dois  centróides;  com  três  grupos,  há  três 
centróides,  e  assim  por  diante.  Os  centróides  indicam  o 
local  mais  típico  de  qualquer  indivíduo  de  um  grupo  par¬ 
ticular,  e  uma  comparação  dos  centróides  de  grupos  mos¬ 
tra  o  quão  afastados  estão  os  grupos  em  termos  da  função 
discriminante. 

O  teste  para  a  significância  estatística  da  função  discri¬ 
minante  é  uma  medida  generalizada  da  distância  entre  os 
centróides  de  grupos.  Ela  é  computada  comparando-se  as 
distribuições  dos  escores  discriminantes  para  os  grupos. 
Se  a  sobreposição  nas  distribuições  é  pequena,  a  função 
discriminante  separa  bem  os  grupos.  Se  a  sobreposição  é 
grande,  a  função  é  um  discriminador  pobre  entre  os  gru¬ 
pos.  Duas  distribuições  de  escores  discriminantes  mos¬ 
tradas  na  Figura  5-1  ilustram  melhor  esse  conceito.  O 
diagrama  do  alto  representa  as  distribuições  de  escores 
discriminantes  para  uma  função  que  separa  bem  os  gru¬ 
pos,  mostrando  sobreposição  mínima  (a  área  sombreada) 
entre  os  grupos.  O  diagrama  abaixo  exibe  as  distribuições 
de  escores  discriminantes  em  uma  função  discriminan¬ 
te  que  é  relativamente  pobre  entre  os  grupos  A  e  B.  As 
áreas  sombreadas  de  sobreposição  representam  os  casos 
nos  quais  podem  ocorrer  classificação  ruim  de  objetos  do 
grupo  A  no  grupo  B  e  vice-versa. 

A  análise  discriminante  múltipla  é  única  em  uma  ca¬ 
racterística  entre  as  relações  de  dependência.  Se  a  variável 
dependente  consiste  de  mais  do  que  dois  grupos,  a  análise 
discriminante  calcula  mais  de  uma  função  discriminante. 
Na  verdade,  calcula  NG  - 1  funções,  onde  NG  é  o  número 
de  grupos.  Cada  função  discriminante  calcula  um  escore 


discriminante  Z.  No  caso  de  uma  variável  dependente 
de  três  grupos,  cada  objeto  (respondente,  empresa  etc.) 
terá  um  escore  separado  para  funções  discriminantes  um 
e  dois,  permitindo  que  os  objetos  sejam  representados 
graficamente  em  duas  dimensões,  com  cada  dimensão  re¬ 
presentando  uma  função  discriminante.  Logo,  a  análise 
discriminante  não  está  limitada  a  uma  única  variável  esta¬ 
tística,  como  ocorre  na  regressão  múltipla,  mas  cria  múlti¬ 
plas  variáveis  estatísticas  que  representam  dimensões  de 
discriminação  entre  os  grupos. 

Regressão  logística 

A  regressão  logística  é  uma  forma  especializada  de  regres¬ 
são  que  é  formulada  para  prever  e  explicar  uma  variável 
categórica  binária  (dois  grupos),  e  não  uma  medida  depen¬ 
dente  métrica.  A  forma  da  variável  estatística  de  regressão 
logística  é  semelhante  à  da  variável  estatística  da  regres¬ 
são  múltipla.  A  variável  estatística  representa  uma  relação 
multivariada  com  coeficientes  como  os  da  regressão  indi¬ 
cando  o  impacto  relativo  de  cada  variável  preditora. 

As  diferenças  entre  regressão  logística  e  análise  discri¬ 
minante  ficarão  mais  claras  em  nossa  discussão  posterior, 
neste  capítulo,  sobre  as  características  únicas  da  regressão 
logística.  Mas  também  existem  muitas  semelhanças  entre 
os  dois  métodos.  Quando  as  suposições  básicas  de  ambos 
são  atendidas,  eles  oferecem  resultados  preditivos  e  classi- 
ficatórios  comparáveis  e  empregam  medidas  diagnósticas 
semelhantes.  A  regressão  logística,  porém,  tem  a  vanta¬ 
gem  de  ser  menos  afetada  do  que  a  análise  discriminante 
quando  as  suposições  básicas,  particularmente  a  normali¬ 
dade  das  variáveis,  não  são  satisfeitas.  Ela  também  pode 
acomodar  variáveis  não-métricas  por  meio  da  codificação 
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Função  discriminante 


FIGURA  5-1 


Representação  univariada  de  escores  Zdiscriminantes. 
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em  variáveis  dicotômicas,  assim  como  a  regressão.  No  en¬ 
tanto,  a  regressão  logística  é  limitada  a  prever  apenas  uma 
medida  dependente  de  dois  grupos.  Logo,  em  casos  nos 
quais  três  ou  mais  grupos  formam  a  medida  dependente,  a 
análise  discriminante  é  mais  adequada. 


ANALOGIA  COM  REGRESSÃO 
E  MANO  VA 

A  aplicação  e  interpretação  de  análise  discriminante  são 
quase  as  mesmas  da  análise  de  regressão.  Ou  seja,  a  fun¬ 
ção  discriminante  é  uma  combinação  linear  (variável  es¬ 
tatística)  de  medidas  métricas  para  duas  ou  mais  variáveis 
independentes  e  é  usada  para  descrever  ou  prever  uma 
única  variável  dependente.  A  diferença  chave  é  que  a  aná¬ 
lise  discriminante  é  adequada  a  problemas  de  pesquisa 
nos  quais  a  variável  dependente  é  categórica  (nominal  ou 
não-métrica),  ao  passo  que  a  regressão  é  usada  quando  a 
variável  dependente  é  métrica.  Como  discutido  anterior¬ 
mente,  a  regressão  logística  é  uma  variante  da  regressão, 
tendo  assim  muitas  semelhanças,  exceto  pelo  tipo  de  va¬ 
riável  dependente. 

A  análise  discriminante  também  é  comparável  à  aná¬ 
lise  multivariada  de  variância  (MANOVA)  “reversa”,  a 
qual  discutimos  no  Capítulo  6.  Na  análise  discriminante, 
a  variável  dependente  é  categórica  e  as  independentes 
são  métricas.  O  oposto  é  verdadeiro  em  MANOVA,  que 
envolve  variáveis  dependentes  métricas  e  variável(eis) 
independente  (s)  categórica(s).  As  duas  técnicas  usam  as 
mesmas  medidas  estatísticas  de  ajuste  geral  do  modelo, 
como  será  visto  a  seguir  neste  e  no  próximo  capítulo. 


EXEMPLO  HIPOTÉTICO  DE 
ANÁLISE  DISCRIMINANTE 

A  análise  discriminante  é  aplicável  a  qualquer  questão  de 
pesquisa  com  o  objetivo  de  entender  a  pertinência  a  gru¬ 
pos,  seja  de  indivíduos  (p.  ex.,  clientes  versus  não-clien- 
tes),  empresas  (p.  ex.,  lucrativas  versus  não-lucrativas), 
produtos  (p.  ex.,  de  sucesso  versus  sem  sucesso)  ou  qual¬ 
quer  outro  objeto  que  possa  ser  avaliado  em  uma  série 
de  variáveis  independentes.  Para  ilustrar  as  premissas  bá¬ 
sicas  da  análise  discriminante,  examinamos  dois  cenários 
de  pesquisa,  um  envolvendo  dois  grupos  (compradores 
versus  não-compradores)  e  o  outro,  três  grupos  (níveis  de 
comportamento  de  troca).  A  regressão  logística  opera  de 
uma  maneira  comparável  à  da  análise  discriminante  para 
dois  grupos.  Logo,  não  ilustramos  especificamente  a  re¬ 
gressão  logística  aqui,  adiando  nossa  discussão  até  uma 
consideração  separada  sobre  a  regressão  logística  poste¬ 
riormente  neste  capítulo. 


Uma  análise  discriminante  de  dois  grnpos: 
compradores  versns  não-compradores 


Suponha  que  a  KitchenAid  queira  determinar  se  um 
de  seus  novos  produtos  -  um  processador  de  alimentos 
novo  e  aperfeiçoado  -  será  comercialmente  bem-suce¬ 
dido.  Ao  levar  a  cabo  a  investigação,  a  KitchenAid  está 
interessada  em  identificar  (se  possível)  os  consumidores 
que  comprariam  o  novo  produto  e  os  que  não  compra¬ 
riam.  Em  terminologia  estatística,  a  KitchenAid  gostaria 
de  minimizar  o  número  de  erros  que  cometeria  ao  pre¬ 
ver  quais  consumidores  comprariam  o  novo  processador 
de  alimentos  e  quais  não.  Para  auxiliar  na  identificação 
de  compradores  potenciais,  a  KitchenAid  planejou  es¬ 
calas  de  avaliação  em  três  características  -  durabilidade, 
desempenho  e  estilo  -  para  serem  usadas  por  consumi¬ 
dores  para  avaliar  o  novo  produto.  Em  vez  de  confiar  em 
cada  escala  como  uma  medida  separada,  a  KitchenAid 
espera  que  uma  combinação  ponderada  das  três  preveja 
melhor  se  um  consumidor  tem  predisposição  para  com¬ 
prar  o  novo  produto. 


A  meta  principal  da  análise  discriminante  é  obter  uma 
combinação  ponderada  das  três  escalas  a  serem  usadas 
na  previsão  da  possibilidade  de  um  consumidor  comprar 
o  produto.  Além  de  determinar  se  os  consumidores  que 
têm  tendência  para  comprar  o  novo  produto  podem  ser 
diferenciados  daqueles  que  não  têm,  a  KitchenAid  tam¬ 
bém  gostaria  de  saber  quais  características  de  seu  novo 
produto  são  úteis  na  diferenciação  entre  compradores  e 
não-compradores.  Ou  seja,  avaliações  de  quais  das  três 
características  do  novo  produto  melhor  separam  compra¬ 
dores  de  não-compradores? 


Por  exemplo,  se  a  resposta  “eu  compraria”  estiver  sem¬ 
pre  associada  com  uma  medida  de  alta  durabilidade,  e  a 
resposta  “eu  não  compraria”  estiver  sempre  associada 
com  uma  medida  de  baixa  durabilidade,  a  KitchenAid 
concluirá  que  a  característica  de  durabilidade  distingue 
compradores  de  não-compradores.  Em  contrapartida, 
se  a  KitchenAid  descobrisse  que  tantas  pessoas  com 
alta  avaliação  para  estilo  dissessem  que  comprariam  o 
processador  quanto  aquelas  que  não  comprariam,  en¬ 
tão  estilo  seria  uma  característica  que  discrimina  muito 
mal  entre  compradores  e  não-compradores. 


Identificação  de  variáveis  discriminantes 

Para  identificar  variáveis  que  possam  ser  úteis  na  discrimina¬ 
ção  entre  grupos  (ou  seja,  compradores  versus  não-compra¬ 
dores),  coloca-se  ênfase  em  diferenças  de  grupos  em  vez  de 
medidas  de  correlação  usadas  em  regressão  múltipla. 
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A  Tabela  5-1  lista  as  avaliações  dessas  três  característi¬ 
cas  do  novo  processador  (com  um  preço  especificado) 
por  um  painel  de  10  compradores  em  potencial.  Ao  ava¬ 
liar  o  processador  de  alimentos,  cada  membro  do  painel 
estaria  implicitamente  comparando-o  com  produtos  já 
disponíveis  no  mercado.  Depois  que  o  produto  foi  ava¬ 
liado,  os  avaliadores  foram  solicitados  a  estabelecer  suas 
intenções  de  compra  (“compraria”  ou  “não  compraria”). 
Cinco  disseram  que  comprariam  o  novo  processador  de 
alimentos,  e  cinco  disseram  que  não  comprariam. 

A  Tabela  5-1  identifica  diversas  variáveis  potencial¬ 
mente  discriminantes.  Primeiro,  uma  diferença  subs¬ 
tancial  separa  as  avaliações  médias  de  (durabilida¬ 
de)  para  os  grupos  “compraria”  e  “não  compraria”  (7,4 
versus  3,2).  Como  tal,  a  durabilidade  parece  discriminar 
bem  entre  os  grupos  e  ser  uma  importante  característica 
para  compradores  em  potencial.  No  entanto,  a  caracte¬ 
rística  de  estilo  (X^)  tem  uma  diferença  menor,  de  0,2, 
entre  avaliações  médias  (4,0  -  3,8  =  0,2)  para  os  grupos 
“compraria”  e  “não  compraria”.  Portanto,  esperaríamos 
que  essa  característica  fosse  menos  discriminante  em  ter¬ 
mos  de  uma  decisão  de  compra.  Contudo,  antes  que  pos¬ 
samos  fazer  tais  declarações  de  forma  conclusiva,  deve¬ 
mos  examinar  a  distribuição  de  escores  para  cada  grupo. 
Desvios-padrão  grandes  dentro  de  um  ou  dos  dois  grupos 
podem  fazer  a  diferença  entre  médias  não-significantes  e 
inconsequente  na  discriminação  entre  os  grupos. 

Como  temos  apenas  10  respondentes  em  dois  grupos 
e  três  variáveis  independentes,  também  podemos  olhar 


os  dados  graficamente  para  determinar  o  que  a  análi¬ 
se  discriminante  está  tentando  conseguir.  A  Figura  5-2 
mostra  os  dez  respondentes  em  cada  uma  das  três  variá¬ 
veis.  O  grupo  “compraria”  é  representado  por  círculos  e 
o  grupo  “não  compraria”,  por  quadrados.  Os  números 
de  identificação  dos  respondentes  estão  dentro  das  for¬ 
mas. 

•  Aj  (Durabilidade)  tem  uma  diferença  substancial  em 
escores  médios,  permitindo  uma  discriminação  quase 
perfeita  entre  os  grupos  usando  apenas  essa  variável. 

Se  estabelecêssemos  o  valor  de  5,5  como  nosso  ponto 
de  corte  para  discriminar  entre  os  dois  grupos,  então 
classificaríamos  incorretamente  apenas  o  respondente  5, 
um  dos  membros  do  grupo  “compraria”.  Esta  variável 
ilustra  o  poder  discriminatório  ao  se  ter  uma  grande 
diferença  nas  médias  para  os  dois  grupos  e  uma  falta  de 
superposição  entre  as  distribuições  dos  dois  grupos. 

•  Aj  (Desempenho)  fornece  uma  distinção  menos  clara 
entre  os  dois  grupos.  No  entanto,  essa  variável  dá  ele¬ 
vada  discriminação  para  o  respondente  5,  o  qual  seria 
classificado  incorretamente  se  usássemos  apenas  Aj. 
Além  disso,  os  respondentes  que  seriam  mal  classifica¬ 
dos  usando  Aj  estão  bem  separados  em  Aj.  Logo,  Aj  e 
Aj  podem  efetivamente  ser  usadas  em  combinação  para 
prever  a  pertinência  a  grupo. 

•  Aj  (Estilo)  mostra  pouca  distinção  entre  os  grupos.  As¬ 
sim,  formando-se  uma  variável  estatística  com  apenas 
Aj  e  Aj  e  omitindo-se  Aj,  pode-se  formar  uma  função 
discriminante  que  maximize  a  separação  dos  grupos  no 
escore  discriminante. 


TABELA  5-1  Resultados  do  levantamento  da  KItchenAld  para  avaliação  de  um  novo  produto 


Avaliação  do  novo  produto* 

Grupos  baseados  em 
intenção  de  compra 

X,  X, 

Durabilidade  Desempenho 

Estilo 

Grupo  1 :  Compraria 

Indivíduo  1 

8 

9 

6 

Indivíduo  2 

6 

7 

5 

Indivíduo  3 

10 

6 

3 

Indivíduo  4 

9 

4 

4 

Indivíduo  5 

4 

8 

2 

Média  do  grupo 

7,4 

6,8 

4,0 

Grupo  2:  Não  compraria 

Indivíduo  6 

5 

4 

7 

Indivíduo  7 

3 

7 

2 

Indivíduo  8 

4 

5 

5 

Indivíduo  9 

2 

4 

3 

Indivíduo  10 

2 

2 

2 

Média  do  grupo 

3.2 

4,4 

3,8 

Diferença  entre  médias  de  grupos 

4,2 

2,4 

0,2 

•Avaliações  são  feitas  em  uma  escala  de  1 0  pontos  (de  1  =  muito  pobre  a  1 0  =  excelente). 
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FIGURA  5-2 
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Representação  gráfica  de  10  compradores  potenciais  sobre  três  variáveis  discriminantes  possíveis. 


Cálculo  de  uma  função  discriminante 

Com  as  três  variáveis  discriminantes  potenciais  identifica¬ 
das,  a  atenção  se  desvia  para  a  investigação  da  possibilida¬ 
de  de  se  usar  as  variáveis  discriminantes  em  combinação 
para  melhorar  o  poder  discriminatório  de  qualquer  variá¬ 
vel  individual.  Para  este  fim,  uma  variável  estatística  pode 
ser  formada  com  duas  ou  mais  variáveis  discriminantes 
para  atuarem  juntas  na  discriminação  entre  grupos. 


A  Tabela  5-2  contém  os  resultados  para  três  diferentes 
formulações  de  funções  discriminantes,  cada  uma  repre¬ 
sentando  diferentes  combinações  das  três  variáveis  in¬ 
dependentes. 

•  A  primeira  função  discriminante  contém  apenas  Xj, 
igualando  o  valor  de  Xj  ao  escore  discriminante  Z  (tam¬ 
bém  implicando  um  peso  de  1,0  para  Xj  e  pesos  nulos 
para  as  demais  variáveis).  Como  discutido  anteriormen¬ 
te,  o  uso  de  apenas  Xj,  o  melhor  discriminador,  resulta 
na  classificação  errônea  do  indivíduo  5,  conforme  se 
mostra  na  Tabela  5-2,  onde  quatro  entre  cinco  indiví¬ 
duos  do  grupo  1  (todos  exceto  o  5)  e  cinco  entre  cinco 
indivíduos  do  grupo  2  estão  corretamente  classificados 
(i.e.,  estão  na  diagonal  da  matriz  de  classificação).  O 
percentual  corretamente  classificado  é,  portanto,  90% 

(9  entre  10  sujeitos). 

•  Como  Xj  fornece  discriminação  para  o  sujeito  5,  pode¬ 
mos  formar  uma  segunda  função  discriminante  combi¬ 
nando  igualmente  Xj  e  Xj  (ou  seja,  implicando  pesos  de 
1,0  para  Xj  e  Xj,  e  0,0  para  Xj)  para  utilizar  os  poderes 
discriminatórios  únicos  de  cada  variável.  Usando-se  um 
escore  de  corte  de  11  com  essa  nova  função  discriminan¬ 


te  (ver  Tabela  5-2),  atinge-se  uma  perfeita  classificação 
dos  dois  grupos  (100%  corretamente  classificados). 

Logo,  Xj  e  Xj  em  combinação  são  capazes  de  fazer 
melhores  previsões  de  pertinência  a  grupos  do  que  qual¬ 
quer  variável  separadamente. 

•  A  terceira  função  discriminante  na  Tabela  5-2  repre¬ 
senta  a  verdadeira  função  discriminante  estimada  (Z  = 
^,53  +  0,476Xj  +  0,359X2).  Usando  um  escore  de  corte 
de  0,  essa  terceira  função  também  atinge  uma  taxa  de 
classificações  corretas  de  100%,  com  a  máxima  separa¬ 
ção  possível  entre  os  grupos. 

Como  visto  neste  exemplo  simples,  a  análise  discri¬ 
minante  identifica  as  variáveis  com  as  maiores  diferen¬ 
ças  entre  os  grupos  e  deriva  um  coeficiente  discriminante 
que  pondera  cada  variável  para  refletir  tais  diferenças.  O 
resultado  é  uma  função  discriminante  que  melhor  distin¬ 
gue  entre  os  grupos  com  base  em  uma  combinação  das 
variáveis  independentes. 

Uma  representação  geométrica  da 
função  discriminante  de  dois  grupos 

Uma  ilustração  gráfica  de  uma  outra  análise  de  dois 
grupos  ajudará  a  explicar  melhor  a  natureza  da  análise 
discriminante  [7].  A  Figura  5-3  demonstra  o  que  acon¬ 
tece  quando  uma  função  discriminante  de  dois  grupos 
é  computada.  Suponha  que  temos  dois  grupos,  A  e  B,  e 
duas  medidas,  e  V2,  para  cada  membro  dos  dois  gru¬ 
pos.  Podemos  representar  graficamente  em  um  diagrama 
de  dispersão  a  associação  da  variável  com  a  variável 
V2  para  cada  membro  dos  dois  grupos.  Na  Figura  5-3,  os 
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TABELA  5-2  Criação  de  funções  discriminantes  para  prever  compradores  versus  não- 
compradores 


Escores  Z  discriminantes  calcuiados 


Grupo 

Função  1 
Z=X, 

Função  2 

Z=X, +X2  Z  = 

Função  3 

-4,53  -1-  0,476X,  +  0,359X2 

Grupo  1:  Compraria 

Indivíduo  1 

8 

17 

2,51 

Indivíduo  2 

6 

13 

0,84 

Indivíduo  3 

10 

16 

2,38 

Indivíduo  4 

9 

13 

1,19 

Indivíduo  5 

4 

12 

0,25 

Grupo  2:  Não  compraria 

Indivíduo  6 

5 

9 

-0,71 

Indivíduo  7 

3 

10 

-0,59 

Indivíduo  8 

4 

9 

-0,83 

Indivíduo  9 

2 

6 

-2,14 

Indivíduo  10 

2 

4 

-2,86 

Escore  de  corte 

5,5 

11 

0,0 

Precisão  de  classificação 


Grupo  previsto  Grupo  previsto  Grupo  previsto 


Grupo  real 

1 

2 

1 :  Compraria 

4 

1 

2:  Não-compraria 

0 

5 

1 

2 

5 

0 

0 

5 

1 

2 

5 

0 

0 

5 

pontos  pequenos*  representam  as  medidas  das  variáveis 
para  os  membros  do  grupo  B,  e  os  pontos  grandes*  cor¬ 
respondem  ao  grupo  A.  As  elipses  desenhadas  em  tor¬ 
no  dos  pontos  pequenos  e  grandes  envolveriam  alguma 
proporção  pré-especiflcada  dos  pontos,  geralmente  95% 
ou  mais  em  cada  grupo.  Se  desenharmos  uma  reta  pelos 
dois  pontos  nos  quais  as  elipses  se  interceptam  e  então 
projetarmos  a  reta  sobre  um  novo  eixo  Z,  podemos  dizer 
que  a  sobreposição  entre  as  distribuições  univariadas  A' 
e  B'  (representada  pela  área  sombreada)  é  menor  do  que 
se  fosse  obtida  por  qualquer  outra  reta  através  das  elipses 
formadas  pelos  diagramas  de  dispersão  [7]. 

O  importante  a  ser  notado  a  respeito  da  Figura  5-3  é 
que  o  eixo  Z  expressa  os  perhs  de  duas  variáveis  dos  gru¬ 
pos  A  e  B  como  números  únicos  (escores  discriminantes). 
Encontrando  uma  combinação  linear  das  variáveis  origi¬ 
nais  Fj  e  V2,  podemos  projetar  os  resultados  como  uma 
função  discriminante.  Por  exemplo,  se  os  pontos  pequenos 
e  grandes  são  projetados  sobre  o  novo  eixo  Z  como  esco¬ 
res  Z  discriminantes,  o  resultado  condensa  a  informação 
sobre  diferenças  de  grupos  (mostrada  no  gráhco  F1F2) 
um  conjunto  de  pontos  (escores  Z)  sobre  um  único  eixo, 
mostrado  pelas  distribuições  A'  e  B'. 

Para  resumir,  para  um  dado  problema  de  análise  dis¬ 
criminante,  uma  combinação  linear  das  variáveis  indepen¬ 
dentes  é  determinada,  resultando  em  uma  série  de  escores 
discriminantes  para  cada  objeto  em  cada  grupo.  Os  esco¬ 

*  N.  de  R.  T.:  Na  verdade,  os  pontos  nos  grupos  A  e  B  não  diferem 
em  tamanho  e,  sim,  no  formato.  No  A  a  forma  é  quadrada  e  no  B  é 
circular. 


res  discriminantes  são  computados  de  acordo  com  a  regra 
estatística  de  maximizar  a  variância  entre  os  grupos  e  mini¬ 
mizar  a  variância  dentro  deles.  Se  a  variância  entre  os  gru¬ 
pos  é  grande  em  relação  à  variância  dentro  dos  grupos,  di¬ 
zemos  que  a  função  discriminante  separa  bem  os  grupos. 

Um  exemplo  de  análise  discriminante 
de  três  grnpos:  intenções  de  troca 

O  exemplo  de  dois  grupos  já  examinado  demonstra  o  obje¬ 
tivo  e  o  benefício  de  se  combinarem  variáveis  independen¬ 
tes  em  uma  variável  estatística  para  fins  de  discriminação 
entre  grupos.  A  análise  discriminante  também  tem  um  ou¬ 
tro  meio  de  discriminação  -  a  estimação  e  o  uso  de  múlti¬ 
plas  variáveis  estatísticas  -  em  casos  onde  há  três  ou  mais 
grupos.  Essas  funções  discriminantes  agora  se  tornam  di¬ 
mensões  de  discriminação,  sendo  cada  dimensão  separada 
e  diferente  da  outra.  Assim,  além  de  melhorar  a  explicação 
de  pertinência  ao  grupo,  essas  funções  discriminantes  adi¬ 
cionais  dão  informação  quanto  às  várias  combinações  de 
variáveis  independentes  que  discriminam  entre  grupos. 


Para  ilustrar  uma  aplicação  de  análise  discriminante 
a  três  grupos,  examinamos  a  pesquisa  conduzida  pela 
HBAT  referente  à  possibilidade  de  os  clientes  de  um 
concorrente  trocarem  de  fornecedores.  Um  pré-teste  em 
pequena  escala  envolveu  entrevistas  de  15  clientes  de  um 
concorrente  importante.  Durante  as  entrevistas,  os  clien¬ 
tes  foram  indagados  sobre  a  probabilidade  de  trocarem 

(Continua) 


230  Análise  Multivariada  de  Dados 


/ 

/ 

I 


{Conlimmção) 

de  fornecedores  em  uma  escala  de  três  categorias.  As 
três  respostas  possíveis  eram  “definitivamente  trocaria”, 
“indeciso”  e  “definitivamente  não  trocaria”.  Clientes  fo¬ 
ram  designados  a  grupos  1,  2  ou  3,  respectivamente,  de 
acordo  com  suas  respostas.  Os  clientes  também  avalia¬ 
ram  o  concorrente  em  duas  características:  competitivi¬ 
dade  de  preço  (Aj)  e  nível  de  serviço  (Aj).  A  questão  da 
pesquisa  agora  é  determinar  se  as  avaliações  dos  clientes 
a  respeito  do  concorrente  podem  prever  sua  probabilida¬ 
de  de  trocar  de  fornecedor.  Como  a  variável  dependente 
de  troca  de  fornecedor  foi  medida  como  uma  variável  ca¬ 
tegórica  (não-métrica)  e  as  medidas  de  preço  e  serviço 
são  métricas,  a  análise  discriminante  é  adequada. 


Identificação  de  variáveis  discriminantes 

Com  três  categorias  da  variável  dependente,  a  análise 
discriminante  pode  estimar  duas  funções  discriminantes, 
cada  uma  representando  uma  dimensão  diferente  de  dis¬ 
criminação. 


A  Tabela  5-3  contém  os  resultados  da  pesquisa  para  os 
15  clientes,  cinco  em  cada  categoria  da  variável  depen¬ 
dente.  Como  fizemos  no  exemplo  de  dois  grupos,  pode¬ 
mos  olhar  para  os  escores  médios  de  cada  grupo  para 
ver  se  uma  das  variáveis  discrimina  bem  entre  todos  os 
grupos.  Para  Xj,  competitividade  de  preço,  percebemos 
uma  grande  diferença  de  médias  entre  o  grupo  1  e  os 
grupos  2  ou  3  (2,0  versus  4,6  ou  3,8).  X^  pode  discrimi¬ 
nar  bem  entre  o  grupo  1  e  os  grupos  2  ou  3,  mas  é  muito 
menos  eficiente  para  discriminar  entre  os  grupos  2  e  3. 
Para  Xj,  nível  de  serviço,  percebemos  que  a  diferença 
entre  os  grupos  1  e  2  é  muito  pequena  (2,0  versus  2,2), 
ao  passo  que  há  uma  grande  diferença  entre  o  grupo  3  e 
os  grupos  1  ou  2  (6,2  versus  2,0  ou  2,2).  Logo,  Xj  distin¬ 
gue  o  grupo  1  dos  grupos  2  e  3,  e  Xj  diferencia  o  grupo 
3  dos  grupos  1  e  2.  Como  resultado,  vemos  que  Xj  e 
Xj  fornecem  diferentes  “dimensões”  de  discriminação 
entre  os  grupos. 
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TABELA  5-3  Resultados  da  pesquisa  HBAT  sobre  intenções  de  troca  por  clientes  potenciais 


Avaliação  do  fornecedor  atual* 

Grupos  baseados  em 
intenção  de  troca 

Competitividade  de  preço 

X, 

Nível  do  serviço 

Grupo  1 :  Definitivamente  trocaria 

Indivíduo  1 

2 

2 

Indivíduo  2 

1 

2 

Indivíduo  3 

3 

2 

Indivíduo  4 

2 

1 

Indivíduo  5 

2 

3 

Média  do  grupo 

2,0 

2,0 

Grupo  2:  Indeciso 

Indivíduo  6 

4 

2 

Indivíduo  7 

4 

3 

Indivíduo  8 

5 

1 

Indivíduo  9 

5 

2 

Indivíduo  10 

5 

3 

Média  do  grupo 

4,6 

2,2 

Grupo  3:  Definitivamente  não  trocaria 

Indivíduo  11 

2 

6 

Indivíduo  12 

3 

6 

Indivíduo  13 

4 

6 

Indivíduo  14 

5 

6 

Indivíduo  15 

5 

7 

Média  do  grupo 

3,8 

6,2 

'Avaliações  são  feitas  em  uma  escala  de  10  pontos  (de  1  =  muito  pobre  a  10  =  exceiente). 


Cálculo  de  duas  funções  discriminantes 

Com  as  potenciais  variáveis  discriminantes  identificadas, 
o  próximo  passo  é  combiná-las  em  funções  discriminantes 
que  utilizarão  seu  poder  combinado  de  diferenciação  para 
separar  grupos. 


Para  ilustrar  graficamente  essas  dimensões,  a  Figura  5-4 
retrata  os  três  grupos  em  cada  variável  independente  se¬ 
paradamente.  Vendo  os  membros  dos  grupos  em  qual¬ 
quer  variável,  podemos  perceber  que  nenhuma  variável 
discrimina  bem  entre  todos  os  grupos.  Mas  se  construí¬ 
mos  duas  funções  discriminantes  simples,  usando  apenas 
pesos  simples  de  1,0  e  0,0,  os  resultados  se  tornam  mui¬ 
to  mais  claros.  A  função  discriminante  1  dá  para  um 
peso  de  1,0,  e  para  Aj  um  peso  de  0,0.  Do  mesmo  modo, 
a  função  discriminante  2  dá  para  X2  um  peso  de  1,0  e 
para  X^  um  peso  de  0,0.  As  funções  podem  ser  enuncia¬ 
das  matematicamente  como 

Função  discriminante  1  =  l,0(Aj)  -r  0,0(A2) 

Função  discriminante  2  =  0,0(Aj)  -r  1,0(A2) 

Essas  equações  mostram  em  termos  simples  como  o 
procedimento  de  análise  discriminante  estima  os  pesos 
para  maximizar  a  discriminação. 


Com  as  duas  funções,  agora  podemos  calcular  dois  es¬ 
cores  discriminantes  para  cada  respondente.  Além  disso, 
as  duas  funções  discriminantes  fornecem  as  dimensões  de 
discriminação. 


A  Figura  5-4  também  contém  um  gráfico  de  cada  respon¬ 
dente  em  uma  representação  bidimensional.  A  separa¬ 
ção  entre  grupos  agora  fica  bastante  clara,  e  cada  grupo 
pode  ser  facilmente  diferenciado.  Podemos  estabelecer 
valores  em  cada  dimensão  que  definirão  regiões  conten¬ 
do  cada  grupo  (p.ex.,  todos  os  membros  do  grupo  1  es¬ 
tão  na  região  menos  que  3,5  na  dimensão  1  e  menos  que 
4,5  na  dimensão  2).  Cada  um  dos  outros  grupos  pode  ser 
analogamente  definido  em  termos  das  amplitudes  dos 
escores  de  suas  funções  discriminantes. 

Em  termos  de  dimensões  de  discriminação,  a  primei¬ 
ra  função  discriminante,  competitividade  de  preço,  dife¬ 
rencia  clientes  indecisos  (mostrados  com  um  quadrado) 
de  clientes  que  decidiram  trocar  (círculos).  Mas  compe¬ 
titividade  de  preço  não  diferencia  aqueles  que  decidiram 
não  trocar  (losangos).  Em  vez  disso,  a  percepção  de  ní¬ 
vel  de  serviço,  que  define  a  segunda  função  discriminan- 
íe,  prevê  se  um  cliente  decidirá  não  trocar  versus  se  um 
cliente  está  indeciso  ou  determinado  a  trocar  de  forne- 

(Continua) 


232  Análise  Multivariada  de  Dados 


{Conlimmção) 

cedores.  O  pesquisador  pode  apresentar  à  gerência  os 
impactos  separados  de  competitividade  de  preço  e  nível 
de  serviço  para  a  tomada  de  decisões. 


A  estimação  de  mais  de  uma  função  discriminante, 
quando  possível,  fornece  ao  pesquisador  uma  discrimina¬ 
ção  melhorada  e  perspectivas  adicionais  sobre  as  caracte¬ 
rísticas  e  as  combinações  que  melhor  discriminam  entre  os 
grupos.  As  seções  a  seguir  detalham  os  passos  necessários 


(a)  variáveis  individuais 
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(b)  Representação 
bidimensional  de 
funções  discriminantes 
Função 

discriminante  1  =  1 ,0X,  +  OX^ 
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FIGURA  5-4  Representação  gráfica  de  variáveis  discriminantes  potenciais  para  uma  análise  discriminante  de  três  grupos. 
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para  se  executar  uma  análise  discriminante,  avaliar  seu  ní¬ 
vel  de  ajuste  preditivo  e  então  interpretar  a  influência  de 
variáveis  independentes  ao  se  fazer  uma  previsão. 


O  PROCESSO  DE  DECISÃO  PARA 
ANÁLISE  DISCRIMINANTE 

A  aplicação  de  análise  discriminante  pode  ser  vista  da 
perspectiva  da  construção  de  modelo  de  seis  estágios  in¬ 
troduzida  no  Capítulo  1  e  retratada  na  Figura  5-5  (está¬ 
gios  1-3)  e  na  Figura  5-6  (estágios  4-6).  Assim  como  em 
todas  as  aplicações  multivariadas,  estabelecer  os  objetivos 
é  o  primeiro  passo  na  análise.  Em  seguida,  o  pesquisa¬ 
dor  deve  abordar  questões  específicas  de  planejamento  e 
se  certificar  de  que  as  suposições  inerentes  estão  sendo 
atendidas.  A  análise  continua  com  a  dedução  da  função 
discriminante  e  a  determinação  de  se  uma  função  esta¬ 
tisticamente  signiflcante  pode  ser  obtida  para  separar  os 
dois  (ou  mais)  grupos.  Os  resultados  discriminantes  são 
então  avaliados  quanto  à  precisão  preditiva  pelo  desen¬ 
volvimento  de  uma  matriz  de  classificação.  Em  seguida,  a 
interpretação  da  função  discriminante  determina  qual  das 
variáveis  independentes  mais  contribui  para  discriminar 
entre  os  grupos.  Finalmente,  a  função  discriminante  deve 
ser  validada  com  uma  amostra  de  teste.  Cada  um  desses 
estágios  é  discutido  nas  seções  a  seguir.  Discutimos  a  re¬ 
gressão  logística  em  uma  seção  à  parte  depois  de  exami¬ 


narmos  o  processo  de  decisão  para  a  análise  discriminan¬ 
te.  Desse  modo,  as  semelhanças  e  diferenças  entre  essas 
duas  técnicas  podem  ser  destacadas. 


ESTÁGIO  1:  OBJETIVOS  DA 
ANÁLISE  DISCRIMINANTE 

Uma  revisão  dos  objetivos  de  aplicar  a  análise  discrimi¬ 
nante  deve  esclarecer  melhor  sua  natureza.  A  análise  dis¬ 
criminante  pode  abordar  qualquer  um  dos  seguintes  obje¬ 
tivos  de  pesquisa: 

1.  Determinar  se  existem  diferenças  estatisticamente  signifi- 
cantes  entre  os  perfis  de  escore  médio  em  um  conjunto  de 
variáveis  para  dois  (ou  mais)  grupos  definidos  a  priori. 

2.  Determinar  quais  das  variáveis  independentes  explicam  o 
máximo  de  diferenças  nos  perfis  de  escore  médio  dos  dois 
ou  mais  grupos. 

3.  Estabelecer  o  número  e  a  composição  das  dimensões  de  dis¬ 
criminação  entre  grupos  formados  a  partir  do  conjunto  de 
variáveis  independentes. 

4.  Estabelecer  procedimentos  para  classificar  objetos  (indiví¬ 
duos,  firmas,  produtos  e  assim  por  diante)  em  grupos,  com 
base  em  seus  escores  em  um  conjunto  de  variáveis  indepen¬ 
dentes. 

Como  observado  nesses  objetivos,  a  análise  discrimi¬ 
nante  é  útil  quando  o  pesquisador  está  interessado  em 
compreender  diferenças  de  grupos  ou  em  classificar  obje- 


Estágio  1 


Estágio  2 


Estágio  3 


FIGURA  5-5  Estágios  1  -3  no  diagrama  de  decisão  da  análise  discriminante. 
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tos  corretamente  em  grupos  ou  classes.  Portanto,  a  análi¬ 
se  discriminante  pode  ser  considerada  um  tipo  de  análise 
de  perfil  ou  uma  técnica  preditiva  analítica.  Em  qualquer 
caso,  a  técnica  é  mais  apropriada  onde  existe  uma  só  va¬ 
riável  dependente  categórica  e  diversas  variáveis  indepen¬ 
dentes  métricas. 

•  Como  uma  análise  de  perfil,  a  análise  discriminante  fornece 
uma  avaliação  objetiva  de  diferenças  entre  grupos  em  um 
conjunto  de  variáveis  independentes.  Nesta  situação,  a  aná¬ 
lise  discriminante  é  bastante  semelhante  à  análise  multiva¬ 
riada  de  variância  (ver  Capítulo  6  para  uma  discussão  mais 
detalhada  de  análise  multivariada  de  variância).  Para  enten¬ 
der  as  diferenças  de  grupos,  a  análise  discriminante  permite 
discernir  o  papel  de  variáveis  individuais,  bem  como  definir 
combinações  dessas  variáveis  que  representam  dimensões 
de  discriminação  entre  grupos.  Essas  dimensões  são  os  efei¬ 
tos  coletivos  de  diversas  variáveis  que  trabalham  conjunta¬ 
mente  para  distinguir  entre  os  grupos.  O  uso  de  métodos  de 
estimação  seqüenciais  também  permite  identificar  subcon¬ 
juntos  de  variáveis  com  o  maior  poder  discriminatório. 

•  Para  fins  de  classificação,  a  análise  discriminante  fornece 
uma  base  para  classificar  não  somente  a  amostra  usada  para 
estimar  a  função  discriminante,  mas  também  quaisquer  ou¬ 
tras  observações  que  possam  ter  valores  para  todas  as  va¬ 
riáveis  independentes.  Desse  modo,  a  análise  discriminante 
pode  ser  usada  para  classificar  outras  observações  nos  gru¬ 
pos  definidos. 


ESTÁGIO  2:  PROJETO  DE  PESQUISA 
PARA  ANÁLISE  DISCRIMINANTE 

A  aplicação  bem-sucedida  da  análise  discriminante  requer 
a  consideração  de  várias  questões.  Tais  questões  incluem 
a  seleção  da  variável  dependente  e  das  variáveis  indepen¬ 
dentes,  o  tamanho  necessário  da  amostra  para  a  estima¬ 
ção  das  funções  discriminantes,  e  a  divisão  da  amostra 
para  fins  de  validação. 

Seleção  de  variáveis  dependente 
e  independentes 

Para  aplicar  a  análise  discriminante,  o  pesquisador  deve 
primeiramente  especificar  quais  variáveis  devem  ser  inde¬ 
pendentes  e  qual  deve  ser  a  medida  dependente.  Lembre- 
se  que  a  variável  dependente  é  categórica  e  as  indepen¬ 
dentes  são  métricas. 

A  variável  dependente 

O  pesquisador  deve  se  concentrar  na  variável  dependente 
primeiro.  O  número  de  grupos  (categorias)  da  variável  de¬ 
pendente  pode  ser  dois  ou  mais,  mas  esses  grupos  devem 
ser  mutuamente  excludentes  e  cobrir  todos  os  casos.  Ou 
seja,  cada  observação  pode  ser  colocada  em  apenas  um 
grupo.  Em  alguns  casos,  a  variável  dependente  pode  en¬ 
volver  dois  grupos  (dicotômicas),  como  bom  versus  ruim. 
Em  outros  casos,  a  variável  dependente  envolve  vários 


grupos  (multicotômica),  como  as  ocupações  de  médico, 
advogado  ou  professor. 

Quantas  categorias  na  variável  dependente?  Teorica¬ 
mente,  a  análise  discriminante  pode  lidar  com  um  número 
ilimitado  de  categorias  na  variável  dependente.  Na  práti¬ 
ca,  porém,  o  pesquisador  deve  selecionar  uma  variável  de¬ 
pendente  e  o  número  de  categorias  com  base  em  diversas 
considerações. 

1.  Além  de  serem  mutuamente  excludentes  e  exaustivas,  as 
categorias  da  variável  dependente  devem  ser  distintas  e 
únicas  no  conjunto  escolhido  de  variáveis  independentes.  A 
análise  discriminante  considera  que  cada  grupo  deveria  ter 
um  perfil  único  nas  variáveis  independentes  usadas,  e  assim 
desenvolve  as  funções  discriminantes  para  separar  ao  má¬ 
ximo  os  grupos  com  base  nessas  variáveis.  Não  obstante,  a 
análise  discriminante  não  tem  um  meio  para  acomodar  ou 
combinar  categorias  que  não  sejam  distintas  nas  variáveis 
independentes.  Se  dois  ou  mais  grupos  têm  perfis  semelhan¬ 
tes,  a  análise  discriminante  não  será  capaz  de  estabelecer 
univocamente  o  perfil  de  cada  grupo,  resultando  em  uma 
explicação  e  classificação  mais  pobres  dos  grupos  como  um 
todo.  Dessa  forma,  o  pesquisador  deve  escolher  as  variáveis 
dependentes  e  suas  categorias  para  refletir  diferenças  nas 
variáveis  independentes.  Um  exemplo  ajudará  a  ilustrar 
este  ponto. 


Imagine  que  o  pesquisador  deseja  identificar  diferen¬ 
ças  entre  categorias  ocupacionais  baseado  em  algumas 
características  demográficas  (p.ex.,  renda,  formação, 
características  familiares).  Se  ocupações  fossem  repre¬ 
sentadas  por  um  pequeno  número  de  categorias  (p.ex., 
pessoal  de  segurança  e  limpeza,  técnicos,  pessoal  de  es¬ 
critório  e  profissionais  de  nível  superior),  então  espera¬ 
ríamos  que  houvesse  diferenças  únicas  entre  os  grupos 
e  que  a  análise  discriminante  seria  mais  adequada  para 
desenvolver  funções  discriminantes  que  explicariam  as 
distinções  de  grupos  e  classificariam  com  sucesso  os  indi¬ 
víduos  em  suas  categorias  corretas. 

Se,  porém,  o  número  de  categorias  ocupacionais  fos¬ 
se  aumentado,  a  análise  discriminante  poderia  ter  uma 
dificuldade  maior  para  identificar  diferenças.  Por  exem¬ 
plo,  considere  que  a  categoria  de  profissionais  de  nível 
superior  fosse  expandida  para  as  categorias  de  médicos, 
advogados,  gerentes  gerais,  professores  universitários  e 
assim  por  diante.  A  despeito  de  esta  expansão  fornecer 
uma  classificação  ocupacional  mais  refinada,  seria  muito 
mais  difícil  fazer  distinções  entre  essas  categorias  com 
base  em  variáveis  demográficas.  Os  resultados  teriam 
um  desempenho  mais  pobre  na  análise  discriminante, 
tanto  em  termos  de  explicação  quanto  de  classificação. 


2.  O  pesquisador  deve  também  buscar  um  número  menor,  e 
não  maior,  de  categorias  na  medida  dependente.  Pode  pare¬ 
cer  mais  lógico  expandir  o  número  de  categorias  em  busca 
de  mais  agrupamentos  únicos,  mas  a  expansão  do  número 
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de  categorias  apresenta  mais  complexidades  nas  tarefas  de 
classificação  e  estabelecimento  de  perfil  na  análise  discrimi¬ 
nante.  Se  a  análise  discriminante  pode  estimar  NG  -  1  (nú¬ 
mero  de  grupos  menos  um)  funções  discriminantes,  então  o 
aumento  do  número  de  grupos  expande  o  número  de  pos¬ 
síveis  funções  discriminantes,  aumentando  a  complexidade 
da  identificação  das  dimensões  inerentes  de  discriminação 
refletidas  por  conta  de  cada  função  discriminante,  bem 
como  representando  o  efeito  geral  de  cada  variável  inde¬ 
pendente. 

Como  esses  dois  pontos  sugerem,  o  pesquisador  sem¬ 
pre  deve  equilibrar  a  vontade  de  expandir  as  categorias 
em  favor  da  unicidade  (exclusividade)  com  a  crescente 
efetividade  de  um  número  menor  de  categorias.  O  pesqui¬ 
sador  deve  testar  e  selecionar  uma  variável  dependente 
com  categorias  que  tenham  as  maiores  diferenças  entre 
todos  os  grupos,  ao  mesmo  tempo  que  mantenham  supor¬ 
te  conceituai  e  relevância  administrativa. 

Conversão  de  variáveis  métricas  Os  exemplos  anteriores 
de  variáveis  categóricas  eram  verdadeiras  dicotomias  (ou 
multicotomias).  Há  algumas  situações,  contudo,  em  que 
a  análise  discriminante  é  apropriada  mesmo  se  a  variável 
dependente  não  é  verdadeiramente  categórica  (não-mé¬ 
trica).  Podemos  ter  uma  variável  dependente  de  medida 
ordinal  ou  intervalar,  a  qual  queremos  usar  como  uma 
variável  dependente  categórica.  Em  tais  casos,  teríamos 
de  criar  uma  variável  categórica,  e  duas  abordagens  estão 
entre  as  mais  usuais: 

•  O  método  mais  comum  é  estabelecer  categorias  usando  uma 
escala  métrica.  Por  exemplo,  se  tivéssemos  uma  variável  que 
medisse  o  número  médio  de  refrigerantes  consumidos  por 
dia  e  os  indivíduos  respondessem  em  uma  escala  de  zero  a 
oito  ou  mais  por  dia,  poderíamos  criar  uma  tricotomia  (três 
grupos)  artificial  simplesmente  designando  aqueles  indiví¬ 
duos  que  consumissem  nenhum,  um  ou  dois  refrigerantes 
por  dia  como  usuários  modestos,  aqueles  que  consumissem 
três,  quatro  ou  cinco  por  dia  como  usuários  médios,  e  os  que 
consumissem  seis,  sete,  oito  ou  mais  como  usuários  pesados. 
Tal  procedimento  criaria  uma  variável  categórica  de  três 
grupos  na  qual  o  objetivo  seria  discriminar  entre  usuários 
de  refrigerantes  que  fossem  modestos,  médios  e  pesados. 
Qualquer  número  de  grupos  categóricos  artificiais  pode  ser 
desenvolvido.  Mais  freqüentemente,  a  abordagem  envolve¬ 
ria  a  criação  de  duas,  três  ou  quatro  categorias.  Um  número 
maior  de  categorias  poderia  ser  estabelecido  se  houvesse 
necessidade. 

•  Quando  três  ou  mais  categorias  são  criadas,  surge  a  possi¬ 
bilidade  de  se  examinarem  apenas  os  grupos  extremos  em 
uma  análise  discriminante  de  dois  grupos.  A  abordagem  de 
extremos  polares  envolve  a  comparação  somente  dos  dois 
grupos  extremos  e  a  exclusão  do  grupo  do  meio  da  análise 
discriminante.  Por  exemplo,  o  pesquisador  poderia  examinar 
os  usuários  modestos  e  pesados  de  refrigerantes  e  excluir  os 
usuários  médios.  Esse  tratamento  pode  ser  usado  toda  vez 
que  o  pesquisador  desejar  olhar  apenas  os  grupos  extremos. 
Contudo,  ele  também  pode  querer  tentar  essa  abordagem 
quando  os  resultados  de  uma  análise  de  regressão  não  são 


tão  bons  quanto  o  previsto.  Tal  procedimento  pode  ser  útil 
porque  é  possível  que  diferenças  de  grupos  possam  aparecer 
até  quando  os  resultados  de  regressão  são  pobres.  Qu  seja, 
a  abordagem  de  extremos  polares  com  a  análise  discrimi¬ 
nante  pode  revelar  diferenças  que  não  são  tão  evidentes  em 
uma  análise  de  regressão  do  conjunto  completo  de  dados 
[7].  Tal  manipulação  dos  dados  naturalmente  necessitaria 
de  cuidado  na  interpretação  das  descobertas. 

As  variáveis  independentes 

Depois  de  ter  tomado  uma  decisão  sobre  a  variável  de¬ 
pendente,  o  pesquisador  deve  decidir  quais  variáveis 
independentes  serão  incluídas  na  análise.  As  variáveis 
independentes  geralmente  são  selecionadas  de  duas  ma¬ 
neiras.  A  primeira  abordagem  envolve  a  identificação  de 
variáveis  a  partir  de  pesquisa  prévia  ou  do  modelo  teórico 
que  é  a  base  inerente  da  questão  de  pesquisa.  A  segun¬ 
da  abordagem  é  a  intuição  -  utilizar  o  conhecimento  do 
pesquisador  e  selecionar  intuitivamente  variáveis  para  as 
quais  não  existe  pesquisa  prévia  ou  teoria,  mas  que  logi¬ 
camente  poderiam  ser  relacionadas  à  previsão  dos  grupos 
para  a  variável  dependente. 

Em  ambos  os  casos,  as  variáveis  independentes  mais 
apropriadas  são  aquelas  que  diferem  da  variável  depen¬ 
dente  em  pelo  menos  dois  dos  grupos.  Lembre  que  o  pro¬ 
pósito  de  qualquer  variável  independente  é  apresentar  um 
perfil  único  de  pelo  menos  um  grupo  quando  comparado 
a  outros.  Variáveis  que  não  diferem  ao  longo  dos  grupos 
são  de  pouca  utilidade  em  análise  discriminante. 

Tamanho  da  amostra 

A  análise  discriminante,  como  as  outras  técnicas  multi- 
variadas,  é  afetada  pelo  tamanho  da  amostra  sob  análise. 
Como  discutido  no  Capítulo  1,  amostras  muito  pequenas 
têm  grandes  erros  amostrais,  de  modo  que  a  identifica¬ 
ção  de  todas,  exceto  as  grandes  diferenças,  é  improvável. 
Além  disso,  amostras  muito  grandes  tornarão  todas  as 
diferenças  estatisticamente  significantes,  ainda  que  essas 
mesmas  diferenças  possam  ter  pouca  ou  nenhuma  rele¬ 
vância  administrativa.  Entre  esses  extremos,  o  pesquisa¬ 
dor  deve  considerar  o  impacto  do  tamanho  das  amostras 
sobre  a  análise  discriminante,  tanto  no  nível  geral  quanto 
em  uma  base  de  grupo-por-grupo. 

Tamanho  geral  da  amostra 

A  primeira  consideração  envolve  o  tamanho  geral  da 
amostra.  A  análise  discriminante  é  bastante  sensível  à 
proporção  do  tamanho  da  amostra  em  relação  ao  número 
de  variáveis  preditoras.  Como  resultado,  muitos  estudos 
sugerem  uma  proporção  de  20  observações  para  cada  va¬ 
riável  preditora.  Apesar  de  essa  proporção  poder  ser  di¬ 
fícil  de  manter  na  prática,  o  pesquisador  deve  notar  que 
os  resultados  se  tornam  instáveis  quando  o  tamanho  da 
amostra  diminui  em  relação  ao  número  de  variáveis  inde¬ 
pendentes.  O  tamanho  mínimo  recomendado  é  de  cinco 
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observações  por  variável  independente.  Note  que  essa 
proporção  se  aplica  a  todas  as  variáveis  consideradas  na 
análise,  mesmo  que  todas  as  variáveis  consideradas  não 
entrem  na  função  discriminante  (como  na  estimação  ste- 
pwisé). 

Tamanho  da  amostra  por  categoria 

Além  do  tamanho  da  amostra  geral,  o  pesquisador  tam¬ 
bém  deve  considerar  o  tamanho  da  amostra  de  cada 
categoria.  No  mínimo,  o  menor  grupo  de  uma  catego¬ 
ria  deve  exceder  o  número  de  variáveis  independentes. 
Como  uma  orientação  prática,  cada  categoria  deve  ter 
no  mínimo  20  observações.  Mas  mesmo  que  todas  as 
categorias  excedam  20  observações,  o  pesquisador  tam¬ 
bém  deve  considerar  os  tamanhos  relativos  das  mesmas. 
Se  os  grupos  variam  muito  em  tamanho,  isso  pode  cau¬ 
sar  impacto  na  estimação  da  função  discriminante  e  na 
classihcação  de  observações.  No  estágio  de  classihcação, 
grupos  maiores  têm  uma  chance  desproporcionalmente 
maior  de  classihcação.  Se  os  tamanhos  de  grupos  variam 
muito,  o  pesquisador  pode  querer  extrair  uma  amostra 
aleatoriamente  a  partir  do(s)  grupo(s)  maior(es),  redu¬ 
zindo  assim  seu(s)  tamanho(s)  a  um  nível  comparável 
ao(s)  grupo(s)  menor(es).  Sempre  se  lembre,  porém,  de 
manter  um  tamanho  adequado  de  amostra  geral  e  para 
cada  grupo. 

Divisão  da  amostra 

Uma  observação  hnal  sobre  o  impacto  do  tamanho  da 
amostra  na  análise  discriminante.  Como  será  posterior¬ 
mente  discutido  no  estágio  6,  a  maneira  preferida  de  va¬ 
lidar  uma  análise  discriminante  é  dividir  a  amostra  em 
duas  sub-amostras,  uma  usada  para  estimação  da  função 
discriminante  e  outra  para  hns  de  validação.  Em  termos 
de  considerações  sobre  tamanho  amostrai,  é  essencial 
que  cada  sub-amostra  tenha  tamanho  adequado  para  su¬ 
portar  as  conclusões  dos  resultados.  Dessa  forma,  todas 
as  considerações  discutidas  na  seção  anterior  se  aplicam 
não  somente  à  amostra  total,  mas  agora  a  cada  uma  das 
duas  sub-amostras  (especialmente  aquela  usada  para  esti¬ 
mação).  Nenhuma  regra  rígida  e  rápida  foi  desenvolvida, 
mas  parece  lógico  que  o  pesquisador  queira  pelo  menos 
100  na  amostra  total  para  justihcar  a  divisão  da  mesma  em 
dois  grupos. 

Criação  das  sub-amostras 

Vários  procedimentos  têm  sido  sugeridos  para  dividir  a 
amostra  em  sub-amostras.  O  procedimento  usual  é  divi¬ 
dir  a  amostra  total  de  respondentes  aleatoriamente  em 
dois  grupos.  Um  deles,  a  amostra  de  análise,  é  usado  para 
desenvolver  a  função  discriminante.  O  segundo  grupo,  a 
amostra  de  teste,  é  usado  para  testar  a  função  discrimi¬ 
nante.  Esse  método  de  validação  da  função  é  chamado  de 
abordagem  de  partição  da  amostra  ou  validação  cruzada 
[1,5,9,18]. 


Nenhuma  orientação  dehnitiva  foi  estabelecida  para 
determinar  os  tamanhos  relativos  das  sub-amostras  de 
análise  e  de  teste  (ou  validação).  O  procedimento  mais 
popular  é  dividir  a  amostra  total  de  forma  que  metade 
dos  respondentes  seja  colocada  na  amostra  de  análise  e  a 
outra  metade  na  amostra  de  teste.  No  entanto,  nenhuma 
regra  rígida  e  rápida  foi  estabelecida,  e  alguns  pesquisa¬ 
dores  preferem  uma  partição  60-40  ou  mesmo  75-25  entre 
os  grupos  de  análise  e  de  teste,  dependendo  do  tamanho 
da  amostra  geral. 

Quando  se  selecionam  as  amostras  de  análise  e  teste, 
geralmente  segue-se  um  procedimento  de  amostragem 
proporcionalmente  estratihcada.  Assuma  primeiro  que 
o  pesquisador  deseja  uma  divisão  50-50.  Se  os  grupos 
categóricos  para  a  análise  discriminante  são  igualmen¬ 
te  representados  na  amostra  total,  as  amostras  de  esti¬ 
mação  e  de  teste  devem  ser  de  tamanhos  aproximada¬ 
mente  iguais.  Se  os  grupos  originais  são  diferentes,  os 
tamanhos  das  amostras  de  estimação  e  de  teste  devem 
ser  proporcionais  em  relação  à  distribuição  da  amostra 
total.  Por  exemplo,  se  uma  amostra  consiste  em  50  ho¬ 
mens  e  50  mulheres,  as  amostras  de  estimação  e  de  tes¬ 
te  teriam  25  homens  e  25  mulheres  cada.  Se  a  amostra 
tiver  70  mulheres  e  30  homens,  então  as  amostras  de 
estimação  e  de  teste  consistirão  em  35  mulheres  e  15 
homens  cada. 

E  sea  amostra  geral  for  muito  pequena? 

Se  a  amostra  é  muito  pequena  para  justihcar  uma  divisão 
em  grupos  de  análise  e  de  teste,  o  pesquisador  tem  duas 
opções.  Primeiro,  desenvolver  a  função  na  amostra  inteira 
e  então  usar  a  função  para  classihcar  o  mesmo  grupo  usa¬ 
do  para  desenvolver  a  função.  Esse  procedimento  resulta 
em  um  viés  ascendente  na  precisão  preditiva  da  função, 
mas  certamente  é  melhor  do  que  não  testar  a  função  de 
forma  alguma.  Segundo,  diversas  técnicas  discutidas  no 
estágio  6  podem  desempenhar  um  tipo  de  procedimento 
de  teste  no  qual  a  função  discriminante  é  repetidamen¬ 
te  estimada  sobre  a  amostra,  cada  vez  reservando  uma 
observação  diferente  para  previsão.  Nesta  abordagem, 
amostras  muito  menores  podem  ser  usadas,  pois  a  amos¬ 
tra  geral  não  precisa  ser  dividida  em  sub-amostras. 


ESTÁGIO  3:  SUPOSIÇÕES  DA 
ANÁLISE  DISCRIMINANTE 

Como  ocorre  em  todas  as  técnicas  multivariadas,  a  aná¬ 
lise  discriminante  é  baseada  em  uma  série  de  suposições. 
Tais  suposições  se  relacionam  a  processos  estatísticos  en¬ 
volvidos  nos  procedimentos  de  estimação  e  classihcação 
e  a  questões  que  afetam  a  interpretação  dos  resultados. 
A  seção  a  seguir  discute  cada  tipo  de  suposição  e  os  im¬ 
pactos  sobre  a  aplicação  apropriada  da  análise  discrimi¬ 
nante. 
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Impactos  sobre  estimação  e  classificação 

As  suposições-chave  para  determinar  a  função  discrimi¬ 
nante  são  a  de  normalidade  multivariada  das  variáveis 
independentes,  e  a  de  estruturas  (matrizes)  de  dispersão 
e  covariância  desconhecidas  (mas  iguais)  para  os  grupos 
como  definidos  pela  variável  dependente  [8,10].  Existem 
evidências  da  sensibilidade  da  análise  discriminante  a  vio¬ 
lações  dessas  suposições.  Os  testes  para  normalidade  dis¬ 
cutidos  no  Capítulo  2  estão  disponíveis  ao  pesquisador, 
juntamente  com  o  teste  M  de  Box  para  avaliar  a  simila¬ 
ridade  das  matrizes  de  dispersão  das  variáveis  indepen¬ 
dentes  entre  os  grupos.  Se  as  suposições  são  violadas,  o 
pesquisador  deve  considerar  métodos  alternativos  (p.ex., 
regressão  logística,  descrita  na  próxima  seção)  e  com¬ 
preender  os  impactos  sobre  os  resultados  que  podem  ser 
esperados. 

Impacto  sobre  estimação 

Dados  que  não  atendem  a  suposição  de  normalidade  mul¬ 
tivariada  podem  causar  problemas  na  estimação  da  função 
discriminante.  Ações  corretivas  podem  ser  viáveis  através 
de  transformações  dos  dados  para  reduzir  as  disparidades 
entre  as  matrizes  de  covariância.  No  entanto,  em  muitos 
casos  essas  ações  corretivas  são  ineficientes.  Em  tais  casos, 
os  modelos  devem  ser  diretamente  validados.  Se  a  medida 
dependente  é  binária,  a  regressão  logística  deve  ser  utili¬ 
zada  sempre  que  possível. 

Impacto  sobre  classificação 

Matrizes  de  covariância  desiguais  também  afetam  negati¬ 
vamente  o  processo  de  classificação.  Se  os  tamanhos  das 
amostras  são  pequenos  e  as  matrizes  de  covariância  são 
diferentes,  então  a  significância  estatística  do  processo  de 
estimação  é  afetada  adversamente.  O  caso  mais  comum 
é  o  de  covariâncias  desiguais  entre  grupos  de  tamanho 
adequado,  em  que  as  observações  são  super-classificadas 
nos  grupos  com  matrizes  de  covariância  maiores.  Esse 
efeito  pode  ser  minimizado  aumentando-se  o  tamanho 
da  amostra  e  também  usando-se  as  matrizes  de  covariân¬ 
cia  específicas  dos  grupos  para  fins  de  classificação,  mas 
essa  abordagem  exige  a  validação  cruzada  dos  resultados 
discriminantes.  Finalmente,  técnicas  de  classificação  qua¬ 
dráticas  estão  disponíveis  em  muitos  dos  programas  esta¬ 
tísticos  caso  existam  grandes  diferenças  entre  as  matrizes 
de  covariância  dos  grupos  e  as  ações  corretivas  não  mini¬ 
mizem  o  efeito  [6,12,14]. 

Impactos  sobre  interpretação 

Uma  outra  característica  dos  dados  que  afeta  os  resultados 
é  a  multicolinearidade  entre  as  variáveis  independentes. 
A  multicolinearidade,  medida  em  termos  de  tolerância, 
denota  que  duas  ou  mais  variáveis  independentes  estão 
altamente  correlacionadas,  de  modo  que  uma  variável 
pode  ser  altamente  explicada  ou  prevista  pela(s)  outra(s) 


variável(eis),  acrescentando  pouco  ao  poder  explicativo 
do  conjunto  como  um  todo.  Essa  consideração  se  torna 
especialmente  crítica  quando  procedimentos  stepwise  são 
empregados.  O  pesquisador,  ao  interpretar  a  função  discri¬ 
minante,  deve  estar  ciente  da  multicolinearidade  e  de  seu 
impacto  na  determinação  de  quais  variáveis  entram  na  so¬ 
lução  stepwise.  Para  uma  discussão  mais  detalhada  da  mul¬ 
ticolinearidade  e  seu  impacto  nas  soluções  stepwise,  ver  o 
Capítulo  4.  Os  procedimentos  para  detectar  a  presença  da 
multicolinearidade  são  também  abordados  no  Capítulo  4. 

Como  em  qualquer  técnica  multivariada  que  emprega 
uma  variável  estatística,  uma  suposição  implícita  é  a  de 
que  todas  as  relações  são  lineares.  As  relações  não-line¬ 
ares  não  são  refletidas  na  função  discriminante,  a  menos 
que  transformações  específicas  de  variáveis  sejam  executa¬ 
das  para  representarem  efeitos  não-lineares.  Finalmente, 
observações  atípicas  podem  ter  um  impacto  substancial  na 
precisão  de  classificação  de  quaisquer  resultados  da  aná- 

-  REGRAS  PRÁTICAS  5-1  - 

Planejamento  de  análise  discriminante 

•  A  variável  dependente  deve  ser  não-métrica, 
representando  grupos  de  objetos  que  devem  diferir  nas 
variáveis  independentes 

•  Escolha  uma  variável  dependente  que: 

•  Melhor  represente  diferenças  de  grupos  de  interesse 

•  Defina  grupos  que  são  substancialmente  distintos 

•  Minimize  o  número  de  categorias  ao  mesmo  tempo 
que  atenda  aos  objetivos  da  pesquisa 

•  Ao  converter  variáveis  métricas  para  uma  escala 
não-métrica  para  uso  como  a  variável  dependente, 
considere  o  uso  de  grupos  extremos  para  maximizar  as 
diferenças  de  grupos 

•  Variáveis  independentes  devem  identificar  diferenças 
entre  pelo  menos  dois  grupos  para  uso  em  análise 
discriminante 

•  A  amostra  deve  ser  grande  o  bastante  para: 

•  Ter  pelo  menos  uma  observação  a  mais  por  grupo 
do  que  o  número  de  variáveis  independentes,  mas 
procurar  por  pelo  menos  20  casos  por  grupo 

•  Ter  20  casos  por  variável  independente,  com  um 
nível  mínimo  recomendado  de  5  observações  por 
variável 

•  Ter  uma  amostra  grande  o  bastante  para  dividi-la 
em  amostras  de  teste  e  de  estimação,  cada  uma 
atendendo  às  exigências  acima 

•  A  suposição  mais  importante  é  a  igualdade  das  matrizes 
de  covariância,  o  que  afeta  tanto  estimação  quanto 
classificação 

•  Multicolinearidade  entre  as  variáveis  independentes 
pode  reduzir  sensivelmente  o  impacto  estimado  de 
variáveis  independentes  na  função  discriminante 
derivada,  particularmente  no  caso  de  emprego  de  um 
processo  de  estimação  stepwise 
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lise  discriminante.  O  pesquisador  é  encorajado  a  exami¬ 
nar  todos  os  resultados  quanto  à  presença  de  observações 
atípicas  e  a  eliminar  observações  atípicas  verdadeiras,  se 
necessário.  Para  uma  discussão  sobre  algumas  das  técnicas 
que  avaliam  as  violações  das  suposições  estatísticas  básicas 
ou  a  detecção  de  observações  atípicas,  ver  Capítulo  2. 


ESTÁGIO  4:  ESTIMAÇÃO  DO 
MODELO  DISCRIMINANTE  E 
AVALIAÇÃO  DO  AJUSTE  GERAL 

Para  determinar  a  função  discriminante,  o  pesquisador 
deve  decidir  o  método  de  estimação  e  então  determinar  o 


número  de  funções  a  serem  retidas  (ver  Figura  5-6).  Com 
as  funções  estimadas,  o  ajuste  geral  do  modelo  pode  ser 
avaliado  de  diversas  maneiras.  Primeiro,  escores  Z  discri¬ 
minantes,  também  conhecidos  como  os  escores  Z,  podem 
ser  calculados  para  cada  objeto.  A  comparação  das  mé¬ 
dias  dos  grupos  (centróides)  nos  escores  Z  fornece  uma 
medida  de  discriminação  entre  grupos.  A  precisão  predi- 
tiva  pode  ser  medida  como  o  número  de  observações  clas¬ 
sificadas  nos  grupos  corretos,  com  vários  critérios  dispo¬ 
níveis  para  avaliar  se  o  processo  de  classificação  alcança 
significância  prática  ou  estatística.  Finalmente,  diagnósti¬ 
cos  por  casos  podem  identificar  a  precisão  de  classificação 
de  cada  caso  e  seu  impacto  relativo  sobre  a  estimação  ge¬ 
ral  do  modelo. 


FIGURA  5-6  Estágios  4-6  no  diagrama  de  decisão  da  análise  discriminante. 
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Seleção  de  um  método  de  estimação 

A  primeira  tarefa  na  obtenção  da  função  discriminante  é 
selecionar  o  método  de  estimação.  Ao  fazer  tal  escolha, 
o  pesquisador  deve  balancear  a  necessidade  de  controle 
sobre  o  processo  de  estimação  com  o  desejo  pela  parci¬ 
mônia  nas  funções  discriminantes.  Os  dois  métodos  dis¬ 
poníveis  são  o  simultâneo  (direto)  e  o  stepwise,  cada  um 
discutido  adiante. 

Estimação  simultânea 

A  estimação  simultânea  envolve  a  computação  da  fun¬ 
ção  discriminante,  de  modo  que  todas  as  variáveis  inde¬ 
pendentes  são  consideradas  juntas.  Assim,  a  função  dis¬ 
criminante  é  computada  com  base  no  conjunto  inteiro 
de  variáveis  independentes,  sem  consideração  do  poder 
discriminatório  de  cada  uma  delas.  O  método  simultâ¬ 
neo  é  apropriado  quando,  por  conta  de  razões  teóricas,  o 
pesquisador  quer  incluir  todas  as  variáveis  independen¬ 
tes  na  análise  e  não  está  interessado  em  ver  resultados 
intermediários  baseados  apenas  nas  variáveis  mais  dis¬ 
criminantes. 

Estimação  stepwise 

A  estimação  stepwise  é  uma  alternativa  à  abordagem  si¬ 
multânea.  Envolve  a  inclusão  das  variáveis  independentes 
na  função  discriminante,  uma  por  vez,  com  base  em  seu 
poder  discriminatório.  A  abordagem  stepwise  segue  um 
processo  seqüencial  de  adicionar  ou  descartar  variáveis  da 
seguinte  maneira: 

1.  Escolher  a  melhor  variável  discriminatória. 

2.  Comparar  a  variável  inicial  com  cada  uma  das  outras  variá¬ 
veis  independentes,  uma  de  cada  vez,  e  selecionar  a  variável 
mais  adequada  para  melhorar  o  poder  discriminatório  da 
função  em  combinação  com  a  primeira  variável. 

3.  Selecionar  as  demais  variáveis  de  maneira  semelhante.  Note 
que  conforme  variáveis  adicionais  são  incluídas,  algumas 
previamente  escolhidas  podem  ser  removidas  se  a  infor¬ 
mação  que  elas  contêm  sobre  diferenças  de  grupos  estiver 
disponível  em  alguma  combinação  das  outras  variáveis  in¬ 
cluídas  em  estágios  posteriores. 

4.  Considerar  o  processo  concluído  quando  todas  as  variáveis 
independentes  forem  incluídas  na  função  ou  as  variáveis  ex¬ 
cluídas  forem  julgadas  como  não  contribuindo  significante- 
mente  para  uma  discriminação  futura. 

O  método  stepwise  é  útil  quando  o  pesquisador  quer 
considerar  um  número  relativamente  grande  de  variáveis 
independentes  para  inclusão  na  função.  Selecionando-se 
seqüencialmente  a  próxima  melhor  variável  discriminante 
em  cada  passo,  as  variáveis  que  não  são  úteis  na  discrimi¬ 
nação  entre  os  grupos  são  eliminadas  e  um  conjunto  re¬ 
duzido  de  variáveis  é  identificado.  O  conjunto  reduzido 
geralmente  é  quase  tão  bom  quanto  -  e  às  vezes  melhor 
que  -  o  conjunto  completo  de  variáveis. 

O  pesquisador  deve  notar  que  a  estimação  stepwise  se 
torna  menos  estável  e  generalizável  à  medida  que  a  pro¬ 
porção  entre  tamanho  da  amostra  e  variável  independente 


diminui  abaixo  do  nível  recomendado  de  20  observações 
por  variável  independente.  É  particularmente  importan¬ 
te,  nesses  casos,  validar  os  resultados  de  tantas  maneiras 
quanto  possível. 

Significâncía  estatística 

Após  a  estimação  da  função  discriminante,  o  pesquisador 
deve  avaliar  o  nível  de  significâncía  para  o  poder  discrimi¬ 
natório  coletivo  das  funções  discriminantes,  bem  como  a 
significâncía  de  cada  função  discriminante  em  separado.  A 
avaliação  da  significâncía  geral  fornece  ao  pesquisador  a 
informação  necessária  para  decidir  se  deve  proceder  com 
a  interpretação  da  análise  ou  se  uma  reespecificação  se  faz 
necessária.  Se  o  modelo  geral  for  significante,  a  avaliação 
das  funções  individuais  identifica  aquelas  que  devem  ser 
mantidas  e  interpretadas. 

Significância  geral 

Ao  se  avaliar  a  significância  estatística  do  modelo  geral, 
diferentes  critérios  são  aplicáveis  para  procedimentos  de 
estimação  simultânea  versus  stepwise.  Em  ambas  as  situa¬ 
ções,  os  testes  estatísticos  se  relacionam  com  a  habilidade 
das  funções  discriminantes  de  obterem  escores  Z  discri¬ 
minantes  que  sejam  significantemente  diferentes  entre 
grupos. 

Estimação  simultânea.  Quando  uma  abordagem  si¬ 
multânea  é  usada,  as  medidas  de  lambda  de  Wilks,  o 
traço  de  Hotelling  e  o  critério  de  Pillai  avaliam  a  sig¬ 
nificância  estatística  do  poder  discriminatório  da(s) 
função(ões)  discriminante (s).  A  maior  raiz  característica 
de  Roy  avalia  apenas  a  primeira  função  discriminante. 
Para  uma  discussão  mais  detalhada  sobre  as  vantagens  e 
desvantagens  de  cada  critério,  veja  a  discussão  de  testes 
de  significância  em  análise  multivariada  de  variância  no 
Capítulo  6. 

Estimação  stepwise.  Se  um  método  stepwise  é  empre¬ 
gado  para  estimar  a  função  discriminante,  as  medidas 
de  Mahalanobis  e  E  de  Rao  são  mais  adequadas. 
Ambas  são  medidas  de  distância  generalizada.  O  pro¬ 
cedimento  de  Mahalanobis  é  baseado  em  distância 
euclideana  quadrada  generalizada  que  se  adapta  a  va¬ 
riâncias  desiguais.  A  maior  vantagem  deste  procedi¬ 
mento  é  que  ele  é  computado  no  espaço  original  das 
variáveis  preditoras,  em  vez  de  ser  computado  como 
uma  versão  extraída  de  outras  medidas.  O  procedimen¬ 
to  de  Mahalanobis  se  torna  particularmente  crítico 
quando  o  número  de  variáveis  preditoras  aumenta  por¬ 
que  ele  não  resulta  em  redução  de  dimensionalidade. 
Eima  perda  em  dimensionalidade  causaria  uma  perda 
de  informação,  porque  ela  diminui  a  variabilidade  das 
variáveis  independentes.  Em  geral,  de  Mahalanobis 
é  o  procedimento  preferido  quando  o  pesquisador  está 
interessado  no  uso  máximo  de  informação  disponível 
em  um  processo  stepwise. 
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Significância  de  funções  discriminantes  individuais 

Se  o  número  de  grupos  é  três  ou  mais,  então  o  pesquisa¬ 
dor  deve  decidir  não  apenas  se  a  discriminação  entre  gru¬ 
pos  é  estatisticamente  significante,  mas  também  se  cada 
função  discriminante  estimada  é  estatisticamente  signifi¬ 
cante.  Como  discutido  anteriormente,  a  análise  discrimi¬ 
nante  estima  uma  função  discriminante  a  menos  do  que 
o  número  de  grupos.  Se  três  grupos  são  analisados,  então 
duas  funções  discriminantes  serão  estimadas;  para  quatro 
grupos,  três  funções  serão  estimadas,  e  assim  por  diante. 
Todos  os  programas  de  computador  fornecem  ao  pesqui¬ 
sador  a  informação  necessária  para  verificar  o  número  de 
funções  necessárias  para  obter  significância  estatística, 
sem  incluir  funções  discriminantes  que  não  aumentam  o 
poder  discriminatório  significantemente. 

O  critério  de  significância  convencional  de  0,05  ou 
acima  é  freqüentemente  usado,  sendo  que  alguns  pesqui¬ 
sadores  estendem  o  nível  requerido  (p.ex.,  0,10  ou  mais) 
com  base  na  ponderação  de  custo  versus  o  valor  da  infor¬ 
mação.  Se  os  maiores  níveis  de  risco  para  incluir  resulta¬ 
dos  não-significantes  (p.ex.,  níveis  de  significância  >  0,05) 
são  aceitáveis,  pode-se  reter  funções  discriminantes  que 
são  significantes  no  nível  0,2  ou  até  mesmo  0,3. 

Se  uma  ou  mais  funções  são  consideradas  estatistica¬ 
mente  não-significantes,  o  modelo  discriminante  deve  ser 
reestimado  com  o  número  de  funções  a  serem  determi¬ 
nadas  limitado  ao  número  de  funções  significantes.  Desse 
modo,  a  avaliação  de  precisão  preditiva  e  a  interpretação 
das  funções  discriminantes  serão  baseadas  apenas  em  fun¬ 
ções  significantes. 

Avaliação  do  ajuste  geral  do  modelo 

Logo  que  as  funções  discriminantes  significantes  tenham 
sido  identificadas,  a  atenção  se  desvia  para  a  verificação 
do  ajuste  geral  das  funções  discriminantes  mantidas.  Essa 
avaliação  envolve  três  tarefas: 

-  REGRAS  PRÁTICAS  5-2  - 

Estimação  e  ajuste  do  modelo 

•  Apesar  de  a  estimação  stepwise  poder  parecer  ótima  ao 
selecionar  o  mais  parcimonioso  conjunto  de  variáveis 
maximamente  discriminantes,  cuidado  com  o  impacto 
de  multicolinearidade  sobre  a  avaliação  do  poder 
discriminatório  de  cada  variável. 

•  O  ajuste  geral  do  modelo  avalia  a  significância 
estatística  entre  grupos  sobre  os  escores  Z 
discriminantes,  mas  não  avalia  precisão  preditiva. 

•  Tendo  mais  de  dois  grupos,  não  confine  sua  análise 
a  apenas  as  funções  discriminantes  estatisticamente 
significantes,  mas  considere  a  possibilidade  de  funções 
não-significantes  (com  níveis  de  até  0,3)  adicionarem 
poder  explanatório. 


1.  Calcular  escores  Z  discriminantes  para  cada  observação 

2.  Calcular  diferenças  de  grupos  nos  escores  Z  discriminantes 

3.  Avaliar  a  precisão  de  previsão  de  pertinência  a  grupos. 

Devemos  observar  que  o  emprego  da  função  discri¬ 
minante  para  fins  de  classificação  é  apenas  um  entre  dois 
possíveis  tratamentos.  O  segundo  utiliza  uma  função  de 
classificação,  também  conhecida  como  função  discrimi¬ 
nante  linear  de  Fisher.  As  funções  de  classificação,  uma 
para  cada  grupo,  são  usadas  exclusivamente  para  classifi¬ 
car  observações.  Nesse  método  de  classificação,  os  valores 
de  uma  observação  para  as  variáveis  independentes  são 
inseridos  nas  funções  de  classificação,  e  um  escore  de  clas¬ 
sificação  para  cada  grupo  é  calculado  para  aquela  obser¬ 
vação.  A  observação  é  então  classificada  no  grupo  com  o 
maior  escore  de  classificação. 

Examinamos  a  função  discriminante  como  o  meio  de 
classificação  porque  ela  fornece  uma  representação  conci¬ 
sa  e  simples  de  cada  função  discriminante,  simplificando 
o  processo  de  interpretação  e  a  avaliação  da  contribuição 
de  variáveis  independentes.  Ambos  os  métodos  conse¬ 
guem  resultados  comparáveis,  apesar  de  usarem  diferen¬ 
tes  meios. 

Cálculo  de  escores  Z  discriminantes 

Com  as  funções  discriminantes  retidas  definidas,  a  base 
para  calcular  os  escores  Z  discriminantes  foi  estabelecida. 
Como  discutido  anteriormente,  o  escore  Z  discriminante 
de  qualquer  função  discriminante  pode  ser  calculado  para 
cada  observação  pela  seguinte  fórmula: 

Z,-,  =  a  +  +  •  •  •  +  W„X„, 

onde 

Z.^.  =  escore  Z  discriminante  da  função  discriminante 
j  para  o  objeto  k 
a  =  intercepto 

TT;  =  coeficiente  discriminante  para  a  variável  inde¬ 
pendente  i 

X-^.  =  variável  independente  i  para  o  objeto  k 

Este  escore,  uma  variável  métrica,  fornece  uma  manei¬ 
ra  direta  de  comparar  observações  em  cada  função.  As¬ 
sume-se  que  as  observações  com  escores  Z  semelhantes 
são  mais  parecidas  com  base  nas  variáveis  que  constituem 
essa  função  do  que  aquelas  com  escores  totalmente  distin¬ 
tos.  A  função  discriminante  pode  ser  expressa  com  pesos 
e  valores  padronizados  ou  não-padronizados.  A  versão 
padronizada  é  mais  útil  para  fins  de  interpretação,  mas  a 
não-padronizada  é  mais  fácil  de  utilizar  no  cálculo  do  es¬ 
core  Z  discriminante. 

Avaliação  de  diferenças  de  grupos 

Uma  vez  que  os  escores  Z  discriminantes  são  calculados, 
a  primeira  avaliação  de  ajuste  geral  do  modelo  é  deter¬ 
minar  a  magnitude  de  diferenças  entre  os  membros  de 
cada  grupo  em  termos  dos  escores  Z  discriminantes.  Uma 
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medida  resumo  das  diferenças  de  grupos  é  uma  compara¬ 
ção  dos  centróídes  dos  grupos,  o  escore  Z  discriminante 
médio  para  todos  os  membros  dos  grupos.  Uma  medida 
de  sucesso  da  análise  discriminante  é  sua  habilidade  em 
definir  função(ões)  discriminante(s)  que  resulte(m)  em 
centróides  de  grupos  significantemente  diferentes.  As  di¬ 
ferenças  entre  centróides  são  medidas  em  termos  do 
de  Mahalanobis,  para  o  qual  há  testes  disponíveis  para  de¬ 
terminar  se  as  diferenças  são  estatisticamente  significan- 
tes.  O  pesquisador  deve  garantir  que,  mesmo  com  funções 
discriminantes  significantes,  há  diferenças  consideráveis 
entre  os  grupos. 

Os  centróides  de  grupos  em  cada  função  discriminan¬ 
te  também  podem  ser  representados  graficamente  para 
demonstrar  os  resultados  de  uma  perspectiva  gráfica. 
Gráficos  geralmente  são  preparados  para  as  primeiras 
duas  ou  três  funções  discriminantes  (assumindo  que  elas 
são  funções  estatisticamente  significantes).  Os  valores 
para  cada  grupo  mostram  sua  posição  no  espaço  discri¬ 
minante  reduzido  (assim  chamado  porque  nem  todas  as 
funções  e,  assim,  nem  toda  a  variância,  são  representa¬ 
das  graficamente).  O  pesquisador  pode  ver  as  diferenças 
entre  os  grupos  em  cada  função;  no  entanto,  a  inspeção 
visual  não  explica  totalmente  o  que  são  essas  diferenças. 
Pode-se  desenhar  círculos  que  envolvam  a  distribuição  de 
observações  em  volta  de  seus  respectivos  centróides  para 
esclarecer  melhor  as  diferenças  de  grupos,  mas  esse  pro¬ 
cedimento  está  além  do  escopo  deste  texto  (ver  Dillon  e 
Goldstein  [4]). 

Avaliação  da  precisão  preditiva 
de  pertinência  a  grupo 

Dado  que  a  variável  dependente  é  não-métrica,  não  é  pos¬ 
sível  usar  uma  medida  como  P^,  como  se  faz  em  regressão 
múltipla,  para  avaliar  a  precisão  preditiva.  Em  vez  disso, 
cada  observação  deve  ser  avaliada  com  o  objetivo  de  sa¬ 
ber  se  ela  foi  corretamente  classificada.  Ao  fazer  isso,  di¬ 
versas  considerações  importantes  devem  ser  feitas: 

•  A  concepção  estatística  e  prática  para  desenvolver  matrizes 
de  classificação 

•  A  determinação  do  escore  de  corte 

•  A  construção  das  matrizes  de  classificação 

•  Os  padrões  para  avaliar  a  precisão  de  classificação 

Por  que  matrizes  de  classificação  são  desenvolvidas.  Os 

testes  estatísticos  para  avaliar  a  significância  das  funções 
discriminantes  somente  avaliam  o  grau  de  diferença  en¬ 
tre  os  grupos  com  base  nos  escores  Z  discriminantes, 
mas  não  dizem  quão  bem  a  função  prevê.  Esses  testes 
estatísticos  sofrem  das  mesmas  desvantagens  dos  testes 
de  hipóteses  clássicos.  Por  exemplo,  suponha  que  os  dois 
grupos  são  considerados  significantemente  diferentes 
além  do  nível  0,01.  Com  amostras  suficientemente  gran¬ 
des,  as  médias  de  grupo  (centróides)  poderiam  ser  virtu¬ 
almente  idênticas  e  ainda  teriam  significância  estatística. 


Para  determinar  a  habilidade  preditiva  de  uma  função 
discriminante,  o  pesquisador  deve  construir  matrizes  de 
classificação. 

A  matriz  de  classificação  fornece  uma  perspectiva  so¬ 
bre  significância  prática,  e  não  sobre  significância  estatís¬ 
tica.  Com  a  análise  discriminante  múltipla,  o  percentual 
corretamente  classificado,  também  conhecido  como  razão 
de  sucesso,  revela  o  quão  bem  a  função  discriminante 
classificou  os  objetos.  Com  uma  amostra  suficientemen¬ 
te  grande  em  análise  discriminante,  poderíamos  ter  uma 
diferença  estatisticamente  significante  entre  os  dois  (ou 
mais)  grupos  e  mesmo  assim  classificar  corretamente 
apenas  53%  (quando  a  chance  é  de  50%,  com  grupos  de 
mesmo  tamanho)  [16].  Em  tais  casos,  o  teste  estatístico 
indicaria  significância  estatística,  ainda  que  a  razão  de  su¬ 
cesso  viabilizasse  um  julgamento  à  parte  a  ser  feito  em 
termos  de  significância  prática.  Logo,  devemos  usar  o  pro¬ 
cedimento  da  matriz  de  classificação  para  avaliar  precisão 
preditiva  além  de  simples  significância  estatística. 

Cálculo  do  escore  de  corte.  Usando  as  funções  discrimi¬ 
nantes  consideradas  significantes,  podemos  desenvolver 
matrizes  de  classificação  para  uma  avaliação  mais  preci¬ 
sa  do  poder  discriminatório  das  funções.  Antes  que  uma 
matriz  de  classificação  seja  definida,  porém,  o  pesquisador 
deve  determinar  o  escore  de  corte  (também  chamado  de 
valor  Z  crítico)  para  cada  função  discriminante.  O  escore 
de  corte  é  o  critério  em  relação  ao  qual  o  escore  discrimi¬ 
nante  de  cada  objeto  é  comparado  para  determinar  em 
qual  grupo  o  objeto  deve  ser  classificado. 

O  escore  de  corte  representa  o  ponto  divisor  usado 
para  classificar  observações  em  um  entre  dois  grupos  ba¬ 
seado  no  escore  da  função  discriminante.  O  cálculo  de  um 
escore  de  corte  entre  dois  grupos  quaisquer  é  baseado 
nos  centróides  de  dois  grupos  (média  de  grupo  dos  esco¬ 
res  discriminantes)  e  no  tamanho  relativo  dos  grupos.  Os 
centróides  são  facilmente  calculados  e  fornecidos  em  cada 
estágio  do  processo  stepwise.  Para  calcular  corretamente 
o  escore  de  corte  ótimo,  o  pesquisador  deve  abordar  dois 
pontos: 

1.  Definir  as  probabilidades  a  priori,  baseado  nos  tamanhos 
relativos  dos  grupos  observados  ou  especificados  pelo  pes¬ 
quisador  (ou  assumidos  iguais,  ou  com  valores  dados  pelo 
pesquisador). 

2.  Calcular  o  valor  do  escore  de  corte  ótimo  como  uma  média 
ponderada  sobre  os  tamanhos  assumidos  dos  grupos  (obti¬ 
do  a  partir  das  probabilidades  a  priori). 

Definição  das  probabilidades  a  priori.  O  impacto 
e  a  importância  de  tamanhos  relativos  de  grupos  são  mui¬ 
tas  vezes  desconsiderados,  apesar  de  serem  baseados  nas 
suposições  do  pesquisador  relativas  à  representatividade 
da  amostra.  Neste  caso,  representatividade  se  relaciona  à 
representação  dos  tamanhos  relativos  dos  grupos  na  po¬ 
pulação  real,  o  que  pode  ser  estabelecido  como  probabili- 
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dades  a priori  (ou  seja,  a  proporção  relativa  de  cada  grupo 
em  relação  à  amostra  total). 

A  questão  fundamental  é:  os  tamanhos  relativos  dos 
grupos  são  representativos  dos  tamanhos  de  grupos  na 
população?  A  suposição  padrão  para  a  maioria  dos  pro¬ 
gramas  estatísticos  é  de  probabilidades  iguais;  em  outras 
palavras,  cada  grupo  é  considerado  como  tendo  a  mesma 
chance  de  ocorrer,  mesmo  que  os  tamanhos  dos  grupos 
na  amostra  sejam  desiguais.  Se  o  pesquisador  está  inse¬ 
guro  sobre  se  as  proporções  observadas  na  amostra  são 
representativas  das  proporções  da  população,  a  aborda¬ 
gem  conservadora  é  empregar  probabilidades  iguais.  Em 
alguns  casos,  estimativas  das  probabilidades  a  priori  po¬ 
dem  estar  disponíveis,  como  em  pesquisa  anterior.  Aqui  a 
suposição  padrão  de  probabilidades  iguais  a  priori  é  subs¬ 
tituída  por  valores  especificados  pelo  pesquisador.  Em 
qualquer  caso,  os  reais  tamanhos  de  grupos  são  substituí¬ 
dos  com  base  nas  probabilidades  a  priori  especificadas. 

No  entanto,  se  a  amostra  foi  conduzida  aleaforiamen- 
te  e  o  pesquisador  sente  que  os  tamanhos  de  grupos  são 
representativos  da  população,  então  o  pesquisador  pode 
especificar  probabilidade  a  priori  com  base  na  amostra 
de  estimação.  Assim,  os  verdadeiros  tamanhos  de  gru¬ 
pos  são  considerados  representativos  e  diretamente  usa¬ 
dos  no  cálculo  do  escore  de  corte  (ver  a  discussão  que 
se  segue).  Em  todos  os  casos,  porém,  o  pesquisador  deve 
especificar  como  as  probabilidades  a  priori  são  calcula¬ 
das,  o  que  afeta  os  tamanhos  de  grupos  usados  no  cálculo 
como  ilustrado. 


Por  exemplo,  considere  uma  amostra  de  teste  consis¬ 
tindo  de  200  observações,  com  tamanhos  de  grupos  de 
60  a  140  que  se  relacionam  com  probabilidades  a  priori 
de  30%  e  70%,  respectivamente.  Se  a  amostra  é  consi¬ 
derada  representativa,  então  os  tamanhos  de  60  e  140 
são  empregados  no  cálculo  do  escore  de  corte.  Não  obs¬ 
tante,  se  a  amostra  é  considerada  não-representativa,  o 
pesquisador  deve  especificar  as  probabilidades  a  prio¬ 
ri.  Se  elas  são  especificadas  como  iguais  (50%  e  50%), 
os  tamanhos  amostrais  de  100  e  100  seriam  usados  no 
cálculo  do  escore  de  corte  no  lugar  dos  tamanhos  reais. 
Especificar  outros  valores  para  as  probabilidades  a  prio¬ 
ri  resultaria  em  diferentes  tamanhos  amostrais  para  os 
dois  grupos. 


Cálculo  do  escore  de  corte  ótimo.  A  importância 
das  probabilidades  a  priori  no  escore  de  corte  é  muito  evi¬ 
dente  depois  que  se  percebe  como  o  mesmo  é  calculado. 
A  fórmula  básica  para  computar  o  escore  de  corte  entre 
dois  grupos  quaisquer  é: 

N  Z  +N 

^  _  A  B _ B  A 

N  +N 


onde 

=  escore  de  corte  ótimo  entre  grupos  A  e  B 
=  número  de  observações  no  grupo  A 

Ng  =  número  de  observações  no  grupo  B 
=  centróide  para  o  grupo  A 

Zg  =  centróide  para  o  grupo  B 

Com  tamanhos  desiguais  de  grupos,  o  escore  de  cor¬ 
te  ótimo  para  uma  função  discriminante  é  agora  a  média 
ponderada  dos  centróides  de  grupos.  O  escore  de  corte 
é  ponderado  na  direção  do  grupo  menor,  gerando,  com 
sorte,  uma  melhor  classificação  do  grupo  maior. 

Se  os  grupos  são  especificados  como  sendo  de  iguais 
tamanhos  (probabilidades  a  priori  definidas  como  iguais), 
então  o  escore  de  corte  ótimo  estará  a  meio  caminho  en¬ 
tre  os  dois  centróides  e  se  torna  simplesmente  a  média  dos 
mesmos: 

z 

CE  2 

onde 

Z(,g  =  valor  do  escore  de  corte  crítico  para  grupos  de 
mesmo  tamanho 
=  centróide  do  grupo  A 

Zg  =  centróide  do  grupo  B 

Ambas  as  fórmulas  para  cálculo  do  escore  de  corte  óti¬ 
mo  assumem  que  as  distribuições  são  normais  e  as  estru¬ 
turas  de  dispersão  de  grupos  são  conhecidas. 


O  conceito  de  um  escore  de  corte  ótimo  para  grupos 
iguais  e  distintos  é  ilustrado  nas  Figuras  5-7  e  5-8,  res¬ 
pectivamente.  Os  escores  de  corte  ponderados  e  não- 
ponderados  são  mostrados.  Fica  evidente  que  se  o  grupo 
A  é  muito  menor  que  o  grupo  B,  o  escore  de  corte  ótimo 
está  mais  próximo  ao  centróide  do  grupo  A  do  que  ao 
centróide  do  grupo  B.  Além  disso,  se  o  escore  de  corte 
não-ponderado  fosse  usado,  nenhum  dos  objetos  no  gru¬ 
po  A  seria  mal  classificado,  mas  uma  parte  substancial 
dos  que  estão  no  grupo  B  seria  mal  classificada. 


Custos  de  má  classificação.  O  escore  de  corte  ótimo 
também  deve  considerar  o  custo  de  classificar  um  obje¬ 
to  no  grupo  errado.  Se  os  custos  de  má  classificação  são 
aproximadamente  iguais  para  todos  os  grupos,  o  escore 
de  corte  ótimo  será  aquele  que  classificar  mal  o  menor  nú¬ 
mero  de  objetos  em  todos  os  grupos.  Se  os  custos  de  má 
classificação  são  desiguais,  o  escore  de  corte  ótimo  será  o 
que  minimizar  os  custos  de  má  classificação.  Abordagens 
mais  sofisticadas  para  determinar  escores  de  corte  são  dis¬ 
cutidas  em  Dillon  e  Goldstein  [4]  e  Huberty  et  al.  [13]. 
Essas  abordagens  são  baseadas  em  um  modelo  estatístico 
bayesiano  e  são  adequadas  quando  os  custos  de  má  classi- 
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Escore  de  corte  =  ■^CE 


FIGURA  5-7  Escore  de  corte  ótimo  com  amostras  de  tamanhos  iguais. 


ficação  em  certos  grupos  são  altos,  quando  os  grupos  são 
de  tamanhos  muito  diferentes,  ou  quando  se  deseja  tirar 
vantagem  de  um  conhecimento  a  priori  de  probabilidades 
de  pertinência  a  grupo. 

Na  prática,  quando  se  calcula  o  escore  de  corte,  ge¬ 
ralmente  não  é  necessário  inserir  as  medidas  originais  da 
variável  para  cada  indivíduo  na  função  discriminante  e 
obter  o  escore  discriminante  para  cada  pessoa  para  usar 
no  cálculo  de  e  Zg  (centróides  dos  grupos  A  e  B).  O 
programa  de  computador  fornece  os  escores  discriminan¬ 
tes,  bem  como  Z^  e  Zg  como  output  regular.  Quando  o 
pesquisador  tem  os  centróides  de  grupo  e  os  tamanhos  da 
amostra,  o  escore  de  corte  ótimo  pode  ser  obtido  simples¬ 
mente  substituindo-se  os  valores  na  fórmula  apropriada. 

Construção  das  matrizes  de  classificação.  Para  validar  a 
função  discriminante  pelo  uso  de  matrizes  de  classificação, 
a  amostra  deve  ser  aleatoriamente  dividida  em  dois  gru¬ 
pos.  Um  dos  grupos  (a  amostra  de  análise)  é  usado  para 
computar  a  função  discriminante.  O  outro  (a  amostra  de 
teste  ou  de  validação)  é  retido  para  uso  no  desenvolvi¬ 
mento  da  matriz  de  classificação.  O  procedimento  envolve 
a  multiplicação  dos  pesos  gerados  pela  amostra  de  análise 


pelas  medidas  originais  da  variável  da  amostra  de  teste. 
Em  seguida,  os  escores  discriminantes  individuais  para  a 
amostra  de  teste  são  comparados  com  o  valor  do  escore 
de  corte  crítico  e  classificados  como  se  segue: 

Classifique  um  indivíduo  no  grupo  A  se  Z,,  <  Z^, 
ou 

Classifique  um  indivíduo  no  grupo  B  se  Z,,  >  Zct. 
onde 

Z„  =  escore  Z  discriminante  para  o  n-ésimo  indivíduo 
Z^,  =  valor  do  escore  de  corte  crítico 

Os  resultados  do  procedimento  de  classificação  são 
apresentados  em  forma  matricial,  como  mostrado  na  Ta¬ 
bela  5-4.  As  entradas  na  diagonal  da  matriz  representam  o 
número  de  indivíduos  corretamente  classificados.  Os  nú¬ 
meros  fora  da  diagonal  representam  as  classificações  in¬ 
corretas.  As  entradas  sob  a  coluna  rotulada  de  “Tamanho 
do  grupo  real”  representam  o  número  de  indivíduos  que 
realmente  estão  em  cada  um  dos  dois  grupos.  As  entradas 
na  base  das  colunas  representam  o  número  de  indivíduos 
designados  aos  grupos  pela  função  discriminante.  O  per- 


Escore  de  corte  Escore  de  corte 

ótimo  ponderado  não-ponderado 


FIGURA  5-8  Escore  de  corte  ótimo  com  tamanhos  desiguais  de  amostras. 
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centual  corretamente  classificado  para  cada  grupo  é  mos¬ 
trado  no  lado  direito  da  matriz,  e  o  percentual  geral  corre- 
tamente  classificado,  também  conhecido  como  a  razão  de 
sucesso,  é  mostrado  na  base. 


Em  nosso  exemplo,  o  número  de  indivíduos  correta¬ 
mente  designados  ao  grupo  1  é  22,  enquanto  3  mem¬ 
bros  do  grupo  1  estão  incorretamente  designados  ao 
grupo  2.  Do  mesmo  modo,  o  número  de  classificações 
corretas  no  grupo  2  é  20,  e  o  número  de  designações 
incorretas  no  grupo  1  é  5.  Assim,  os  percentuais  de 
precisão  de  classificação  da  função  discriminante  para 
os  grupos  reais  1  e  2  são  88%  e  80%,  respectivamente. 
A  precisão  de  classificação  geral  (razão  de  sucesso)  é 
84%. 


Um  tópico  final  sobre  os  procedimentos  de  classifi¬ 
cação  é  o  teste  t  disponível  para  determinar  o  nível  de 
significância  para  a  precisão  de  classificação.  A  fórmu¬ 
la  para  uma  análise  de  dois  grupos  (igual  tamanho  de 
amostra)  é 

P-Q,5 

|q,5(i,o-'q^ 

V  N 

onde 

p  =  proporção  corretamente  classificada 

N  =  tamanho  da  amostra 

Essa  fórmula  pode  ser  adaptada  para  uso  com  mais 
grupos  e  diferentes  tamanhos  de  amostra. 

Estabelecimento  de  padrões  de  comparação  para  a  razão 
de  sucesso.  Como  observado  anteriormente,  a  precisão 
preditiva  da  função  discriminante  é  medida  pela  razão 
de  sucesso,  a  qual  é  obtida  a  partir  da  matriz  de  classi¬ 
ficação.  O  pesquisador  pode  questionar  o  que  é  ou  não 
considerado  um  nível  aceitável  de  precisão  preditiva  para 
uma  função  discriminante.  Por  exemplo,  60%  é  um  nível 
aceitável  ou  deveríamos  esperar  obter  de  80%  a  90%  de 
precisão  preditiva?  Para  responder  essa  questão  o  pesqui¬ 


sador  deve  primeiro  determinar  o  percentual  que  poderia 
ser  classificado  corretamente  por  chances  {sem  a  ajuda  da 
função  discriminante). 

Padrões  de  comparação  para  a  razão  de  sucesso  em 
grupos  de  mesmo  tamanho.  Quando  os  tamanhos  de 
amostra  dos  grupos  são  iguais,  a  determinação  da  classifi¬ 
cação  por  chances  é  bem  simples;  ela  é  obtida  dividindo- 
se  1  pelo  número  de  grupos.  A  fórmula  é 

Cjoual  =  l/(Número  de  grupos). 

Por  exemplo,  para  uma  função  de  dois  grupos,  a  pro¬ 
babilidade  seria  de  0,50;  para  uma  função  de  três  grupos, 
seria  de  0,33,  e  assim  por  diante. 

Padrões  de  comparação  para  a  razão  de  sucesso  em 
grupos  de  tamanhos  desiguais.  A  determinação  da 
classificação  por  chances  para  situações  nas  quais  os  ta¬ 
manhos  dos  grupos  são  desiguais  é  um  pouco  mais  com¬ 
plicada.  Devemos  considerar  apenas  o  maior  grupo,  a 
probabilidade  combinada  de  todos  os  tamanhos  de  gru¬ 
pos,  ou  algum  outro  padrão?  Imaginemos  que  temos  uma 
amostra  total  de  200  indivíduos  divididos  como  amostras 
de  teste  e  de  análise  de  100  observações  cada.  Na  amostra 
de  teste,  75  objetos  pertencem  a  um  grupo  e  25  ao  outro. 
Examinaremos  os  possíveis  caminhos  nos  quais  podemos 
construir  um  padrão  para  comparação  e  aquilo  que  cada 
um  representa. 

•  Conhecido  como  o  critério  de  chance  máxima,  poderíamos 
arbitrariamente  designar  todos  os  indivíduos  ao  maior  gru¬ 
po.  O  critério  da  chance  máxima  deve  ser  usado  quando 
o  único  objetivo  da  análise  discriminante  é  maximizar  o 
percentual  corretamente  classificado  [16].  É  também  o  pa¬ 
drão  mais  conservador,  pois  ele  gera  o  mais  alto  padrão  de 
comparação.  No  entanto,  são  raras  as  situações  nas  quais 
estamos  interessados  apenas  em  maximizar  o  percentual 
corretamente  classificado.  Geralmente,  o  pesquisador  usa  a 
análise  discriminante  para  identificar  corretamente  os  mem¬ 
bros  de  todos  os  grupos.  Em  casos  nos  quais  os  tamanhos 
das  amostras  são  desiguais  e  o  pesquisador  deseja  classificar 
os  membros  de  todos  os  grupos,  a  função  discriminante  vai 
contra  as  chances,  classificando  um  indivíduo  no(s)  grupo(s) 
menor(es).  O  critério  por  chances  não  leva  esse  fato  em 
consideração  [16]. 


TABELA  5-4  Matriz  de  classificação  para  análise  discriminante  de  dois  grupos 


Grupo  real 

Grupo  previsto 

1  2 

Tamanho  do 
grupo  real 

Percentual  correta¬ 
mente  classificado 

1 

22 

3 

25 

88 

2 

Tamanho  previsto 

5 

20 

25 

80 

do  grupo 

27 

23 

50 

84“ 

“Percentual  corretamente  classificado  =  (Número  corretamente  classificado/Número  total  de  observações)  x  100 

=  [(22  +  20)/50]  X  100 
=  84% 
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Em  nosso  exemplo  simples  de  uma  amostra  com  dois 
grupos  (75  e  25  pessoas  cada),  usando  esse  método  te¬ 
ríamos  uma  precisão  de  classificação  de  75%,  o  que  se 
conseguiria  classificando-se  todos  no  grupo  maior  sem 
a  ajuda  de  qualquer  função  discriminante.  Pode-se  con¬ 
cluir  que,  a  menos  que  a  função  discriminante  consiga 
uma  precisão  de  classificação  maior  do  que  75%,  ela 
deve  ser  descartada,  pois  não  nos  ajuda  a  melhorar  a 
precisão  preditiva  que  podemos  atingir  sem  qualquer 
análise  discriminante. 


•  Quando  os  tamanhos  de  grupos  são  desiguais  e  o  pesquisa¬ 
dor  deseja  identificar  corretamente  os  membros  de  todos  os 
grupos,  não  apenas  do  maior,  o  critério  de  chances  propor¬ 
cionais  é  considerado  por  muitos  como  o  mais  apropriado. 
A  fórmula  para  esse  critério  é 

CpRO  =/+(!  -Pf 

onde 

p  =  proporção  de  indivíduos  no  grupo  1 
1-p  =  proporção  de  indivíduos  no  grupo  2 


Usando  os  tamanhos  de  grupos  de  nosso  exemplo  ante¬ 
rior  (75  e  25),  percebemos  que  o  critério  de  chances  pro¬ 
porcionais  seria  de  62,5%  [0,75^ -i-  (1,0  -  0,75)^=  0,625] 
comparado  com  75%.  Logo,  neste  caso,  uma  precisão 
preditiva  de  75%  seria  aceitável  porque  está  acima  dos 
62,5%  do  critério  de  chances  proporcionais. 


•  Um  problema  dos  critérios  de  chance  máxima  e  de  chances 
proporcionais  são  os  tamanhos  das  amostras  usados  para  cál¬ 
culo  dos  padrões.  Você  deve  usar  grupos  com  o  tamanho  da 
amostra  geral,  da  amostra  de  análise/estimação,  ou  da  amos¬ 
tra  de  validação/teste?  Aqui  vão  algumas  sugestões: 

•  Se  os  tamanhos  das  amostras  de  análise  e  estimação  são 
considerados  suficientemente  grandes  (i.e.,  amostra  total 
de  100  com  cada  grupo  tendo  pelo  menos  20  casos),  obte¬ 
nha  padrões  separados  para  cada  amostra. 

•  Se  as  amostras  separadas  não  são  consideradas  suficien¬ 
temente  grandes,  use  os  tamanhos  de  grupos  da  amostra 
total  para  calcular  os  padrões. 

•  Atente  a  tamanhos  de  grupos  diferentes  entre  amostras 
quando  usar  o  critério  de  chance  máxima,  pois  ele  depen¬ 
de  do  maior  tamanho  de  grupo.  Esta  orientação  é  espe¬ 
cialmente  crítica  quando  a  amostra  é  pequena  ou  quando 
as  proporções  de  tamanhos  de  grupos  variam  muito  de 
amostra  para  amostra.  Este  é  outro  motivo  de  cautela  no 
emprego  do  critério  de  chance  máxima. 

Esses  critérios  de  chances  são  úteis  somente  quando 
computados  com  amostras  de  teste  (abordagem  da  parti¬ 
ção  da  amostra).  Se  os  indivíduos  usados  no  cálculo  da  fun¬ 
ção  discriminante  são  os  classificados,  o  resultado  é  um  viés 
ascendente  na  precisão  preditiva.  Em  tais  casos,  os  critérios 
deveriam  ser  ajustados  para  cima  em  função  desse  viés. 


Comparação  da  razão  de  sucesso  com  o  padrão.  A 

questão  de  “quanta  precisão  de  classificação  devo  ter?” 
é  crucial.  Se  o  percentual  de  classificações  corretas  é  sig- 
nificantemente  maior  do  que  se  esperaria  por  chances,  o 
pesquisador  pode  proceder  à  interpretação  das  funções 
discriminantes  e  de  perfis  de  grupos.  No  entanto,  se  a  pre¬ 
cisão  de  classificação  não  é  maior  do  que  pode  ser  espera¬ 
do  das  chances,  quaisquer  diferenças  que  pareçam  existir 
merecem  pouca  ou  nenhuma  interpretação;  ou  seja,  as 
diferenças  em  perfis  de  escores  não  forneceriam  qualquer 
informação  significativa  para  identificar  a  pertinência  a 
grupos. 

A  questão,  então,  é  o  quanto  a  precisão  de  classi¬ 
ficação  deve  ser  relativa  às  chances?  Por  exemplo,  se 
as  chances  são  de  50%  (dois  grupos,  com  iguais  tama¬ 
nhos),  uma  precisão  de  classificação  (preditiva)  de  60% 
justifica  ir  para  o  estágio  de  interpretação?  Em  última 
instância,  a  decisão  depende  do  custo  em  relação  ao  va¬ 
lor  da  informação.  O  argumento  do  custo  versus  valor 
oferece  pouca  ajuda  ao  pesquisador  iniciante,  mas  o 
seguinte  critério  é  sugerido:  A  precisão  de  classificação 
deve  ser  pelo  menos  um  quarto  maior  do  que  a  obtida 
por  chances. 


Por  exemplo,  se  a  precisão  por  chances  for  de  50%,  a 
precisão  de  classificação  deverá  ser  62,5%  (62,5%  =  1,25 
X  50%).  Se  a  precisão  de  chances  for  de  30%,  a  preci¬ 
são  de  classificação  deverá  ser  37,5%  (37,5%  =  1,25  x 
30%). 


Esse  critério  fornece  apenas  uma  estimativa  grosseira 
do  nível  aceitável  de  precisão  preditiva.  O  critério  é  fácil 
de  aplicar  com  grupos  de  mesmo  tamanho.  Com  grupos  de 
tamanhos  desiguais,  um  limite  superior  é  alcançado  quan¬ 
do  o  modelo  de  chance  máxima  é  usado  para  determinar 
a  precisão  de  chances.  No  entanto,  isso  não  representa  um 
grande  problema,  pois  sob  a  maioria  das  circunstâncias  o 
modelo  de  chance  máxima  não  seria  usado  com  grupos  de 
tamanhos  distintos. 

Razões  de  sucesso  geral  versus  específicas  de  gru¬ 
pos.  Até  este  ponto,  nos  concentramos  no  cálculo  da 
razão  de  sucesso  geral  em  todos  os  grupos  avaliando  a 
precisão  preditiva  de  uma  análise  discriminante.  O  pes¬ 
quisador  também  deve  estar  preocupado  com  a  razão  de 
sucesso  (percentual  corretamente  classificado)  para  cada 
grupo  separado.  Se  você  se  concentrar  somente  na  razão 
de  sucesso  geral,  é  possível  que  um  ou  mais  grupos,  par¬ 
ticularmente  os  menores,  possam  ter  razões  de  sucesso 
inaceitáveis  enquanto  a  razão  de  sucesso  geral  é  aceitá¬ 
vel.  O  pesquisador  deve  calcular  a  razão  de  sucesso  de 
cada  grupo  e  avaliar  se  a  análise  discriminante  fornece 
níveis  adequados  de  precisão  preditiva  tanto  no  nível  ge¬ 
ral  quanto  para  cada  grupo. 
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Medidas  com  base  estatística  de  precisão  de  classificação 
relacionada  a  chances*  Um  teste  estatístico  do  poder 
discriminatório  da  matriz  de  classificação  quando  com¬ 
parada  com  um  modelo  de  chances  é  a  estatística  Q  de 
Press.  Essa  medida  simples  compara  o  número  de  clas¬ 
sificações  corretas  com  o  tamanho  da  amostra  total  e  o 
número  de  grupos.  O  valor  calculado  é  então  comparado 
com  um  valor  crítico  (o  valor  qui-quadrado  para  um  grau 
de  liberdade  no  nível  de  confiança  desejado).  Se  ele  exce¬ 
de  este  valor  crítico,  então  a  matriz  de  classificação  pode 
ser  considerada  estatisticamente  melhor  do  que  as  chan¬ 
ces.  A  estatística  Q  é  calculada  pela  seguinte  fórmula: 


JV(iC-l) 

onde 

A  =  tamanho  da  amostra  total 
n  =  número  de  observações  corretamente  classifica¬ 
das 

K  =  número  de  grupos 


Por  exemplo,  na  Tabela  5-4,  a  estatística  Q  seria  baseada 
em  uma  amostra  total  de  A  =  50,  n  =  42  observações  cor¬ 
retamente  classificadas,  eK  =  2  grupos.  A  estatística  cal¬ 
culada  seria: 

T,  f50-(42x2)f 

Q  de  Press  =  - - - —  =  23,12 

50(2-1) 

O  valor  crítico  em  um  nível  de  significância  de  0,01  é 
6,63.  Assim,  concluiríamos  que,  no  exemplo,  as  previsões 
seriam  significantemente  melhores  do  que  chances,  as 
quais  teriam  uma  taxa  de  classificação  correta  de  50%. 


Esse  teste  simples  é  sensível  ao  tamanho  da  amostra; 
amostras  grandes  são  mais  prováveis  de  mostrar  signifi¬ 
cância  do  que  amostras  pequenas  da  mesma  taxa  de  clas¬ 
sificação. 


Por  exemplo,  se  o  tamanho  da  amostra  é  aumentado  para 
100  no  exemplo  e  a  taxa  de  classificação  permanece  em 
84%,  a  estatística  Q  aumenta  para  46,24.  Se  o  tamanho 
da  amostra  sobe  para  200,  mas  mantém  a  taxa  de  classifi¬ 
cação  em  84%,  a  estatística  Q  novamente  aumenta  para 
92,48%.  Mas  se  a  amostra  for  apenas  20  e  a  taxa  de  classi¬ 
ficação  incorreta**  for  ainda  de  84%  (17  previsões  corre¬ 
tas),  a  estatística  Q  seria  de  somente  9,8.  Ou  seja,  examine 
a  estatística  Q  à  luz  do  tamanho  amostrai,  pois  aumentos 
no  tamanho  da  amostra  fazem  subir  a  estatística  Q  ainda 
que  seja  para  a  mesma  taxa  de  classificação  geral. 


*  N.  de  R.  T.:  A  palavra  “chance”  também  poderia  ser  traduzida  como 
“acaso”. 

**  N.  de  R.  T.:  A  frase  correta  seria  “taxa  de  classificação  correta”. 


Porém,  é  necessário  cuidado  nas  conclusões  baseadas 
apenas  nessa  estatística,  pois  à  medida  que  a  amostra  fica 
maior,  uma  taxa  de  classificação  menor  ainda  será  consi¬ 
derada  significante. 

Diagnóstico  por  casos 

O  meio  final  de  avaliar  o  ajuste  de  modelo  é  examinar  os 
resultados  preditivos  em  uma  base  de  casos.  Semelhante 
à  análise  de  resíduos  em  regressão  múltipla,  o  objetivo  é 
entender  quais  observações  (1)  foram  mal  classificadas  e 
(2)  não  são  representativas  dos  demais  membros  do  gru¬ 
po.  Apesar  de  a  matriz  de  classificação  fornecer  precisão 
de  classificação  geral,  ela  não  detalha  os  resultados  indi¬ 
viduais.  Além  disso,  mesmo  que  possamos  denotar  quais 
casos  são  correta  ou  incorretamente  classificados,  ainda 
precisamos  de  uma  medida  da  similaridade  de  uma  obser¬ 
vação  com  o  restante  do  grupo. 

Má  classificação  de  casos  individuais 

Quando  se  analisam  resíduos  de  uma  análise  de  regressão 
múltipla,  uma  decisão  importante  envolve  estabelecer  o 
nível  de  resíduo  considerado  substancial  e  merecedor  de 
atenção.  Em  análise  discriminante,  essa  questão  é  mais 
simples,  porque  uma  observação  é  ou  correta,  ou  incorre¬ 
tamente  classificada.  Todos  os  programas  de  computador 
fornecem  informação  que  identifica  quais  casos  são  mal 
classificados  e  para  quais  grupos  eles  foram  mal  classifi¬ 
cados.  O  pesquisador  pode  identificar  não  apenas  aqueles 
casos  com  erros  de  classificação,  mas  uma  representação 
direta  do  tipo  de  má  classificação. 

Análise  de  casos  mal  classificados 

O  propósito  de  identificar  e  analisar  as  observações  mal 
classificadas  é  identificar  quaisquer  características  dessas 
observações  que  pudessem  ser  incorporadas  à  análise  dis¬ 
criminante  para  melhorar  a  precisão  preditiva.  Essa  análi¬ 
se  pode  assumir  a  forma  de  se  estabelecer  o  perfil  de  casos 
mal  classificados  tanto  nas  variáveis  independentes  quan¬ 
to  em  outras  variáveis  não  incluídas  no  modelo. 

O  perfil  das  variáveis  independentes.  Examinar  esses 
casos  nas  variáveis  independentes  pode  identificar  ten¬ 
dências  não-lineares  ou  outras  relações  ou  atributos  que 
conduziram  à  má  classificação.  Várias  técnicas  são  parti¬ 
cularmente  adequadas  em  análise  discriminante: 

•  Uma  representação  gráfica  das  observações  é  talvez  a  abor¬ 
dagem  mais  simples  e  efetiva  para  examinar  as  caracterís¬ 
ticas  de  observações,  especialmente  as  mal  classificadas.  A 
abordagem  mais  comum  é  fazer  o  gráfico  das  observações 
com  base  em  seus  escores  Z  discriminantes  e  mostrar  a  so¬ 
breposição  entre  grupos  e  os  casos  mal  classificados.  Se  duas 
ou  mais  funções  são  mantidas,  os  pontos  de  corte  ótimo 
também  podem  ser  representados  graficamente  para  forne¬ 
cer  aquilo  que  é  conhecido  como  um  mapa  territorial,  que 
exibe  as  regiões  correspondentes  para  cada  grupo. 
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•  Representar  graficamente  as  observações  individuais  com 
os  centróides  dos  grupos,  como  anteriormente  discutido, 
mostra  não  apenas  as  características  gerais  dos  grupos  via 
centróides,  mas  também  a  variação  nos  membros  nos  gru¬ 
pos.  Isso  é  análogo  às  áreas  definidas  no  exemplo  de  três 
grupos  no  começo  deste  capítulo,  em  que  escores  de  cor¬ 
te  em  ambas  as  funções  definiam  áreas  correspondentes  às 
previsões  de  classificação  para  cada  grupo. 

•  Uma  avaliação  empírica  direta  da  similaridade  de  uma  ob¬ 
servação  com  os  membros  do  outro  grupo  pode  ser  feita 
calculando-se  a  distância  de  Mahalanobis  da  observação 
ao  centróide  do  grupo.  Com  base  no  conjunto  de  variáveis 
independentes,  observações  mais  próximas  ao  centróide 
têm  um  de  Mahalanobis  menor  e  são  consideradas  mais 
representativas  do  grupo  do  que  as  mais  afastadas. 

•  No  entanto,  a  medida  empírica  deve  ser  combinada  com  uma 
análise  gráfica,  pois  apesar  de  um  grande  de  Mahalanobis 
indicar  observações  que  são  bastante  diferentes  dos  centrói¬ 
des  de  grupo,  isso  nem  sempre  indica  má  classificação.  Por 
exemplo,  em  uma  situação  de  dois  grupos,  um  membro  do 
grupo  A  pode  ter  uma  grande  distância  D'  de  Mahalanobis, 
indicando  que  ele  é  menos  representativo  do  grupo.  Contu¬ 
do,  se  essa  distância  está  afastada  do  centróide  do  grupo  B, 
então  realmente  aumentam  as  chances  de  classificação  corre¬ 
ta,  mesmo  que  ele  seja  menos  representativo  do  grupo.  Uma 
menor  distância  que  coloca  uma  observação  entre  os  dois 
centróides  provavelmente  teria  uma  menor  probabilidade 
de  classificação  correta,  mesmo  que  ela  esteja  mais  próxima 
ao  centróide  de  seu  grupo  do  que  na  situação  anterior. 

Apesar  de  não  existir  qualquer  análise  pré-especifi- 
cada,  como  na  regressão  múltipla,  o  pesquisador  é  enco¬ 
rajado  a  avaliar  esses  casos  mal  classificados  de  diversos 
pontos  de  vista,  na  tentativa  de  descobrir  as  caracterís¬ 
ticas  únicas  que  eles  têm  em  comparação  com  os  outros 
membros  do  seu  grupo. 

Perfil  de  variáveis  não  presentes  na  análise.  O  exame  de 
outras  variáveis  quanto  às  suas  diferenças  nos  casos  mal 
classificados  seria  o  primeiro  passo  para  sua  possível  in¬ 
clusão  na  análise  discriminante.  Muitas  vezes,  variáveis 
que  discriminam  apenas  em  um  conjunto  menor  de  casos 
não  são  identificadas  no  primeiro  conjunto  de  análises, 
mas  se  tornam  mais  evidentes  na  análise  de  casos  mal 
classificados.  O  pesquisador  é  encorajado  a  rever  as  áreas 
de  suporte  conceituai  para  identificar  novas  possíveis  va¬ 
riáveis  que  possam  se  relacionar  unicamente  com  os  casos 
mal  classificados  e  aumentar  a  precisão  preditiva  geral. 

Resumo 

O  estágio  de  estimação  e  avaliação  tem  várias  semelhan¬ 
ças  com  as  outras  técnicas  de  dependência,  permitindo  um 
processo  de  estimação  direta  ou  stepwise  e  uma  análise  da 
precisão  preditiva  geral  e  de  casos.  O  pesquisador  deve  de¬ 
dicar  considerável  atenção  a  essas  questões  para  evitar  o 
uso  de  um  modelo  de  análise  discriminante  fundamental¬ 
mente  errado. 


-  REGRAS  PRÁTICAS  5-3  - 

Avaliação  do  ajuste  de  modelo  e  precisão  preditiva 

•  A  matriz  de  classificação  e  a  razão  de  sucesso 
substituem  como  a  medida  de  ajuste  de  modelo: 

•  Avalie  a  razão  de  sucesso  geral  e  por  grupo 

•  Se  as  amostras  de  estimação  e  análise  excederem  100 
casos  e  cada  grupo  exceder  20  casos,  derive  padrões 
separados  para  cada  amostra;  caso  contrário,  derive 
um  único  padrão  a  partir  da  amostra  geral 

•  Critérios  múltiplos  são  usados  para  comparação  com  a 
razão  de  sucesso: 

•  O  critério  de  chance  máxima  para  avaliação  da 
razão  de  sucesso  é  o  mais  conservador,  dando  a  mais 
elevada  base  para  exceder 

•  Seja  cuidadoso  no  uso  do  critério  de  chance  máxima 
em  situações  com  amostras  gerais  menores  que  100 
e/ou  grupos  com  menos  de  20 

•  O  critério  de  chance  proporcional  considera 
todos  os  grupos  no  estabelecimento  do  padrão  de 
comparação  e  é  o  mais  popular 

•  A  verdadeira  precisão  preditiva  (razão  de  sucesso) 
deve  exceder  qualquer  valor  de  critério  em  pelo 
menos  25  % 

•  Analise  as  observações  mal  classificadas  gráfica  (mapa 
territorial)  e  empiricamente  (D^  de  Mahalanobis) 


ESTÁGIO  5:  INTERPRETAÇÃO 
DOS  RESULTADOS 

Se  a  função  discriminante  é  estatisticamente  significante  e 
a  precisão  de  classificação  é  aceitável,  o  pesquisador  deve 
se  concentrar  em  fazer  interpretações  substanciais  das 
descobertas.  Esse  processo  envolve  o  exame  das  funções 
discriminantes  para  determinar  a  importância  relativa  de 
cada  variável  independente  na  discriminação  entre  os  gru¬ 
pos.  Três  métodos  para  determinar  a  importância  relativa 
foram  propostos: 

1.  Pesos  discriminantes  padronizados 

2.  Cargas  discriminantes  (correlações  de  estrutura) 

3.  Valores  F  parciais 

Pesos  discriminantes 

A  abordagem  tradicional  para  interpretar  funções  dis¬ 
criminantes  examina  o  sinal  e  a  magnitude  do  peso 
discriminante  padronizado  (às  vezes  chamado  de  coefi¬ 
ciente  discriminante)  designado  para  cada  variável  ao  se 
computarem  as  funções  discriminantes.  Quando  o  sinal 
é  ignorado,  cada  peso  representa  a  contribuição  relativa 
de  sua  variável  associada  àquela  função.  As  variáveis 
independentes  com  pesos  relativamente  maiores  con¬ 
tribuem  mais  para  o  poder  discriminatório  da  função 
do  que  as  variáveis  com  pesos  menores.  O  sinal  indica 
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apenas  que  a  variável  tem  uma  contribuição  positiva  ou 
negativa  [4]. 

A  interpretação  de  pesos  discriminantes  é  análoga 
à  interpretação  de  pesos  beta  em  análise  de  regressão  e 
está,  portanto,  sujeita  às  mesmas  críticas.  Por  exemplo, 
um  peso  pequeno  pode  indicar  que  sua  variável  corres¬ 
pondente  é  irrelevante  na  determinação  de  uma  relação, 
ou  que  ela  tenha  sido  deixada  de  lado  na  relação  por  cau¬ 
sa  de  um  elevado  grau  de  multicolinearidade.  Um  outro 
problema  do  uso  de  pesos  discriminantes  é  que  eles  es¬ 
tão  sujeitos  a  considerável  instabilidade.  Esses  problemas 
sugerem  cuidado  ao  se  usarem  pesos  para  interpretar  os 
resultados  da  análise  discriminante. 

Cargas  discriminantes 

As  cargas  discriminantes,  às  vezes  chamadas  de  correla¬ 
ções  de  estrntnra,  são  cada  vez  mais  usadas  como  uma 
base  para  interpretação,  por  conta  das  deficiências  na  utili¬ 
zação  de  pesos.  Medindo  a  correlação  linear  simples  entre 
cada  variável  independente  e  a  função  discriminante,  as 
cargas  discriminantes  refletem  a  variância  que  as  variáveis 
independentes  compartilham  com  a  função  discriminan¬ 
te.  Em  relação  a  isso,  elas  podem  ser  interpretadas  como 
cargas  fatoriais  na  avaliação  da  contribuição  relativa  de 
cada  variável  independente  para  a  função  discriminante. 
(O  Capítulo  3  discute  melhor  a  interpretação  de  cargas 
fatoriais.) 

Uma  característica  ímpar  de  cargas  é  que  elas  podem 
ser  calculadas  para  todas  as  variáveis,  sejam  elas  usadas  na 
estimação  da  função  discriminante  ou  não.  Este  aspecto 
é  particularmente  útil  quando  um  processo  de  estimação 
stepwise  é  empregado  e  algumas  variáveis  não  são  incluí¬ 
das  na  função  discriminante.  Em  vez  de  não  se  ter  forma 
alguma  de  compreender  seu  impacto  relativo,  as  cargas 
fornecem  um  efeito  relativo  de  cada  variável  em  uma  me¬ 
dida  comum. 

Com  as  cargas,  a  questão  principal  é:  Quais  valores  as 
cargas  devem  assumir  para  serem  consideradas  substan¬ 
tivas  discriminadoras  dignas  de  nota?  Tanto  em  análise 
discriminante  simultânea  quanto  stepwise,  variáveis  que 
exibem  uma  carga  de  ±  0,40  ou  mais  são  consideradas 
substantivas.  Com  procedimentos  stepwise,  tal  determi¬ 
nação  é  suplementada,  pois  a  técnica  evita  que  variáveis 
não-significantes  entrem  na  função.  Porém,  multicoline¬ 
aridade  e  outros  fatores  podem  evitar  uma  variável  na 
equação,  o  que  não  significa  necessariamente  que  ela  não 
tenha  um  efeito  substancial. 

As  cargas  discriminantes  (assim  como  os  pesos)  podem 
estar  sujeitas  à  instabilidade.  As  cargas  são  consideradas 
relativamente  mais  válidas  do  que  os  pesos  como  um  meio 
de  interpretação  do  poder  discriminatório  de  variáveis  in¬ 
dependentes  por  causa  de  sua  natureza  correlacionai.  O 
pesquisador  ainda  deve  ser  cuidadoso  ao  usar  cargas  para 
interpretar  funções  discriminantes. 


Valores  F  parciais 

Como  anteriormente  discutido,  duas  abordagens  compu¬ 
tacionais  -  simultânea  e  stepwise  -  podem  ser  utilizadas 
para  determinar  funções  discriminantes.  Quando  o  mé¬ 
todo  stepwise  é  selecionado,  um  meio  adicional  de  inter¬ 
pretar  o  poder  discriminatório  relativo  das  variáveis  inde¬ 
pendentes  está  disponível  pelo  uso  de  valores  F  parciais. 
Isso  é  obtido  examinando-se  os  tamanhos  absolutos  dos 
valores  F  significantes  e  ordenando-os.  Valores  F  grandes 
indicam  maior  poder  discriminatório.  Na  prática,  as  or¬ 
denações  que  usam  a  abordagem  dos  valores  F  são  iguais 
à  ordenação  determinada  a  partir  do  uso  de  pesos  discri¬ 
minantes,  mas  os  valores  F  indicam  o  nível  associado  de 
signiflcância  para  cada  variável. 

Interpretação  de  duas  ou  mais  funções 

Quando  há  duas  ou  mais  funções  discriminantes  signi- 
ficantes,  temos  problemas  adicionais  de  interpretação. 
Primeiro,  podemos  simplificar  os  pesos  ou  cargas  discri¬ 
minantes  para  facilitar  a  determinação  do  perfil  de  cada 
função?  Segundo,  como  representamos  o  impacto  de  cada 
variável  nas  funções?  Esses  problemas  ocorrem  tanto  na 
medida  dos  efeitos  discriminantes  totais  das  funções  quan¬ 
to  na  avaliação  do  papel  de  cada  variável  no  perfil  de  cada 
função  separadamente.  Tratamos  dessas  duas  questões 
introduzindo  os  conceitos  de  rotação  das  funções,  o  índice 
de  potência,  e  representações  de  vetores  expandidos. 

Rotação  das  funções  discriminantes 

Depois  que  as  funções  discriminantes  foram  desenvolvi¬ 
das,  elas  podem  ser  rotacionadas  para  redistribuir  a  va¬ 
riância.  (Q  conceito  é  melhor  explicado  no  Capítulo  3.) 
Basicamente,  a  rotação  preserva  a  estrutura  original  e  a 
confiabilidade  da  solução  discriminante,  ao  passo  que  tor¬ 
na  as  funções  muito  mais  fáceis  de  interpretar.  Na  maio¬ 
ria  dos  casos,  a  rotação  VARIMAX  é  empregada  como  a 
base  para  a  rotação. 

índice  de  potência 

Anteriormente  discutimos  o  uso  de  pesos  padronizados  ou 
cargas  discriminantes  como  medidas  da  contribuição  de 
uma  variável  a  uma  função  discriminante.  Quando  duas 
ou  mais  funções  são  determinadas,  contudo,  uma  medida 
resumo  ou  composta  é  útil  para  descrever  as  contribuições 
de  uma  variável  em  todas  as  funções  significantes.  Q  índice 
de  potência  é  uma  medida  relativa  entre  todas  as  variáveis 
que  é  indicativa  do  poder  discriminante  de  cada  variável 
[18].  Ele  inclui  a  contribuição  de  uma  variável  a  uma  fun¬ 
ção  discriminante  (sua  carga  discriminante)  e  a  contribui¬ 
ção  relativa  da  função  para  a  solução  geral  (uma  medida 
relativa  entre  as  funções  com  base  nos  autovalores).  A 
composição  é  simplesmente  a  soma  dos  índices  de  potência 
individuais  em  todas  as  funções  discriminantes  significan- 
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tes.  A  interpretação  da  medida  composta  é  limitada,  contu¬ 
do,  pelo  fato  de  que  é  útil  apenas  na  representação  da  po¬ 
sição  relativa  (como  o  oposto  de  uma  ordenação)  de  cada 
variável,  e  o  valor  absoluto  não  tem  qualquer  significado 
real.  O  índice  de  potência  é  calculado  por  um  processo  de 
dois  passos: 


Passo  1:  Calcular  um  valor  de  potência  para  cada  função  sig- 
nificante.  No  primeiro  passo,  o  poder  discriminatório 
de  uma  variável,  representado  pelo  quadrado  da  carga 
discriminante  não-rotacionada,  é  “ponderado”  pela 
contribuição  relativa  da  função  discriminante  para  a 
solução  geral.  Primeiro,  a  medida  do  autovalor  relativo 
para  cada  função  discriminante  significante  é  calculada 
simplesmente  como: 


Autovalor  relativo 
da  função 
discriminante  j 


Autovalor  da  função 
discriminante  j 

Soma  de  autovalores  em  todas  as 
funções  significantes 


O  valor  potência  de  cada  variável  em  uma  função  dis¬ 
criminante  é  então: 

Valor  potência  ^ 

da  variável  i=  (Carga  discriminante,  )  x 
na  função  /  Autovalor  relativo  da  função  j 


Passo  2:  Calcular  um  índice  de  potência  composto  em  todas  as 
funções  significantes.  Uma  vez  que  um  valor  potência 
tenha  sido  calculado  para  cada  função,  o  índice  de  po¬ 
tência  composto  para  cada  variável  é  calculado  como: 

Soma  dos  valores  de 

Potência  composta^  potência  da  variável  i  em 

da  variável  i  todas  as  funções  discriminantes 
significantes 


O  índice  de  potência  agora  representa  o  efeito  discrimi¬ 
nante  total  da  variável  em  todas  as  funções  discriminantes 
significantes.  É  apenas  uma  medida  relativa,  contudo,  e  seu 
valor  absoluto  não  tem  qualquer  significado  importante. 
Uma  ilustração  de  cálculo  de  índice  de  potência  é  forneci¬ 
da  no  exemplo  para  análise  discriminante  de  três  grupos. 


Disposição  gráfica  de  escores  e 
cargas  discriminantes 

Para  representar  diferenças  nos  grupos  nas  variáveis 
preditoras,  o  pesquisador  pode  usar  dois  diferentes  tra¬ 
tamentos  para  representação  gráfica.  O  mapa  territorial 
representa  graficamente  os  casos  individuais  de  funções 
discriminantes  significantes  para  permitir  ao  pesquisador 
uma  avaliação  da  posição  relativa  de  cada  observação 
com  base  nos  escores  da  função  discriminante.  A  segunda 
abordagem  é  representar  graficamente  as  cargas  discrimi¬ 
nantes  para  entender  o  agrupamento  relativo  e  a  magnitu¬ 
de  de  cada  carga  sobre  cada  função.  Cada  abordagem  será 
discutida  detalhadamente  na  próxima  seção. 

Mapa  territorial.  O  método  gráfico  mais  comum  é  o 
mapa  territorial,  no  qual  cada  observação  é  impressa  em 


um  gráfico  com  base  nos  escores  Z  da  função  discrimi¬ 
nante  das  observações.  Por  exemplo,  considere  que  uma 
análise  discriminante  de  três  grupos  tem  duas  funções 
discriminantes  significantes.  Um  mapa  territorial  é  criado 
fazendo-se  o  gráfico  dos  escores  Z  discriminantes  de  cada 
observação  para  a  primeira  função  discriminante  sobre  o 
eixo  A  e  os  escores  para  a  segunda  função  discriminante 
sobre  o  eixo  Y.  Desse  modo,  isso  fornece  diversas  pers¬ 
pectivas  de  análise: 

•  O  gráfico  dos  membros  de  cada  grupo  com  diferentes  sím¬ 
bolos  permite  um  retrato  fácil  das  diferenças  de  cada  grupo, 
bem  como  suas  sobreposições  um  com  o  outro. 

•  O  gráfico  dos  centróides  de  cada  grupo  fornece  uma  manei¬ 
ra  de  avaliar  cada  membro  de  grupo  relativamente  ao  seu 
centróide.  Este  procedimento  é  particularmente  útil  na  ava¬ 
liação  da  possibilidade  de  grandes  medidas  de  Mahalanobis 

conduzirem  a  classificações  ruins. 

•  Retas  representando  os  escores  de  corte  também  podem  ser 
graficamente  representadas,  denotando  fronteiras  que  re¬ 
presentam  os  intervalos  de  escores  discriminantes  previstos 
em  cada  grupo.  Quaisquer  membros  de  grupos  que  estejam 
fora  dessas  fronteiras  são  mal  classificados.  Denotar  os  casos 
mal  classificados  permite  uma  avaliação  sobre  qual  função 
discriminante  foi  mais  responsável  pela  má  classificação,  e 
sobre  o  grau  em  que  um  caso  é  mal  classificado. 

Gráfico  vetorial  de  cargas  discriminantes.  A  abordagem 
gráfica  mais  simples  é  representar  cargas  reais  rotaciona- 
das  ou  não-rotacionadas.  A  abordagem  preferencial  seria 
com  cargas  rotacionadas.  Semelhante  ao  gráfico  de  cargas 
fatoriais  (ver  Capítulo  3),  este  método  representa  o  grau 
em  que  cada  variável  é  associada  com  cada  função  discri¬ 
minante. 

Uma  técnica  ainda  mais  precisa,  porém,  envolve  o 
gráfico  de  cargas  bem  como  vetores  para  cada  carga  e 
centróide  de  grupo.  Um  vetor  é  meramente  uma  reta  de¬ 
senhada  a  partir  da  origem  (centro)  de  um  gráfico  até  as 
coordenadas  das  cargas  de  uma  variável  particular  ou  um 
centróide  de  grupo.  Com  a  representação  de  um  vetor  ex¬ 
pandido,  o  comprimento  de  cada  vetor  se  torna  indicativo 
da  importância  relativa  de  cada  variável  na  discriminação 
entre  os  grupos.  O  procedimento  gráfico  segue  em  três 
passos: 

1.  Seleção  de  variáveis:  Todas  as  variáveis,  sejam  incluídas 
no  modelo  ou  não,  podem  ser  graficamente  representadas 
como  vetores.  Desse  modo,  a  importância  de  variáveis  co- 
lineares  que  não  estão  incluídas,  como  em  stepwise,  ainda 
pode  ser  retratada. 

2.  Expansão  de  vetores:  As  cargas  discriminantes  de  cada  va¬ 
riável  são  expandidas  multiplicando-se  a  carga  discriminan¬ 
te  (preferencialmente  após  a  rotação)  por  seu  respectivo  va¬ 
lor  F  univariado.  Notamos  que  os  vetores  apontam  para  os 
grupos  com  a  maior  média  sobre  o  preditor  respectivo  e  na 
direção  oposta  dos  grupos  com  os  menores  escores  médios. 

3.  Gráfico  dos  centróides  de  grupos:  Os  centróides  de  grupo 
também  são  expandidos  nesse  procedimento,  sendo  multi¬ 
plicados  pelo  valor  F  aproximado  associado  a  cada  função 
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discriminante.  Se  as  cargas  são  expandidas,  os  centróides 
também  devem  ser  expandidos  para  representá-los  com 
precisão  no  mesmo  gráfico.  Os  valores  í' aproximados  para 
cada  função  discriminante  são  obtidos  pela  seguinte  fór¬ 
mula: 


de  sucesso,  o  pesquisador  deve  usar  o  perfil  de  grupos 
para  garantir  que  as  médias  de  grupos  sejam  indicadores 
válidos  do  modelo  conceituai  usado  na  seleção  de  variá¬ 
veis  independentes. 


Valor  .  =  Autovalor,-  . 

rimçaO|  runçaoy 


^^Amo.tradees..maç.o-^G^ 

NG-1 


onde 

A^Amostra  de  estimação  =  tamanho  da  amostra  de  estimação 


Por  exemplo,  considere  que  a  amostra  de  50  observações 
tenha  sido  dividida  em  três  grupos.  O  multiplicador  de 
cada  autovalor  seria  (50  -  3)/(3  -  1)  =  23,5. 


Quando  completado,  o  pesquisador  dispõe  de  um  re¬ 
trato  do  agrupamento  de  variáveis  em  cada  função  dis¬ 
criminante,  a  magnitude  da  importância  de  cada  variável 
(representada  pelo  comprimento  de  cada  vetor)  e  o  perfil 
de  cada  centróide  de  grupo  (mostrado  pela  proximidade 
de  cada  vetor).  Apesar  de  este  procedimento  dever  ser 
feito  manualmente  na  maioria  dos  casos,  ele  dá  um  retra¬ 
to  completo  das  cargas  discriminantes  e  dos  centróides  de 
grupos.  Para  mais  detalhes  sobre  esse  procedimento,  ver 
Dillon  e  Goldstein  [4]. 

Qual  método  interpretativo  usar? 

Diversos  métodos  para  interpretar  a  natureza  das  funções 
discriminantes  foram  discutidos,  tanto  para  soluções  de 
uma  função  quanto  de  múltiplas.  Quais  métodos  devem 
ser  usados?  A  abordagem  das  cargas  é  mais  válida  do  que 
o  emprego  de  pesos  e  deve  ser  utilizada  sempre  que  pos¬ 
sível.  Q  uso  de  valores  F  parciais  e  univariados  permite 
ao  pesquisador  empregar  diversas  medidas  e  procurar 
alguma  consistência  nas  avaliações  das  variáveis.  Se  duas 
ou  mais  funções  são  estimadas,  então  o  pesquisador  pode 
utilizar  diversas  técnicas  gráficas  e  o  índice  de  potência, 
que  ajuda  na  interpretação  da  solução  multidimensional. 
Q  ponto  mais  básico  é  que  o  pesquisador  deve  usar  todos 
os  métodos  disponíveis  para  chegar  à  interpretação  mais 
precisa. 


ESTÁGIO  6:  VALIDAÇÃO 
DOS  RESULTADOS 

Q  estágio  final  de  uma  análise  discriminante  envolve  a 
validação  dos  resultados  discriminantes  para  garantir  que 
os  resultados  têm  validade  externa  e  interna.  Com  a  pro¬ 
pensão  da  análise  discriminante  para  aumentar  a  razão  de 
sucesso  se  avaliada  apenas  sobre  a  amostra  de  análise,  a 
validação  é  um  passo  essencial.  Além  de  validar  as  razões 


Procedimentos  de  validação 

Validação  é  um  passo  crítico  em  qualquer  análise  discri¬ 
minante,  pois  muitas  vezes,  especialmente  com  amostras 
menores,  os  resultados  podem  carecer  de  generalidade 
(validade  externa).  A  técnica  mais  comum  para  estabe¬ 
lecer  validade  externa  é  a  avaliação  de  razões  de  suces¬ 
so.  Validação  pode  ocorrer  com  uma  amostra  separada 
(amostra  de  teste)  ou  utilizando-se  um  procedimento  que 
repetidamente  processa  a  amostra  de  estimação.  Validade 
externa  é  admitida  quando  a  razão  de  sucesso  da  aborda¬ 
gem  selecionada  excede  os  padrões  de  comparação  que 
representam  a  precisão  preditiva  esperada  pelo  acaso  (ver 
discussão  anterior). 

Utilização  de  uma  amostra  de  teste 

Geralmente,  a  validação  das  razões  de  sucesso  é  execu¬ 
tada  criando-se  uma  amostra  de  teste,  também  chamada 
de  amostra  de  validação.  G  propósito  de  se  utilizar  uma 
amostra  de  teste  para  fins  de  validação  é  ver  o  quão  bem 
a  função  discriminante  funciona  em  uma  amostra  de  ob¬ 
servações  não  usadas  para  obter  a  mesma.  Este  processo 
envolve  o  desenvolvimento  de  uma  função  discriminante 
com  a  amostra  de  análise  e  então  a  sua  aplicação  na  amos¬ 
tra  de  teste.  A  justificativa  para  dividir  a  amostra  total  em 
dois  grupos  é  que  um  viés  ascendente  ocorrerá  na  precisão 
preditiva  da  função  discriminante  se  os  indivíduos  usados 
no  desenvolvimento  da  matriz  de  classificação  forem  os 
mesmos  utilizados  para  computar  a  função;  ou  seja,  a  pre¬ 
cisão  de  classificação  será  mais  alta  do  que  é  válido  se  ela 
for  aplicada  na  amostra  de  estimação. 

Qutros  pesquisadores  têm  sugerido  que  uma  confiança 
maior  ainda  poderia  ser  depositada  na  validade  da  função 
discriminante  seguindo-se  esse  procedimento  diversas  ve¬ 
zes  [18].  Ao  invés  de  dividir  aleatoriamente  a  amostra  to¬ 
tal  em  grupos  de  análise  e  de  teste  uma  vez,  o  pesquisador 
dividiria  aleatoriamente  a  amostra  total  em  amostras  de 
análise  e  de  teste  várias  vezes,  sempre  testando  a  valida¬ 
de  da  função  discriminante  pelo  desenvolvimento  de  uma 
matriz  de  classificação  e  de  uma  razão  de  sucesso.  Então 
as  diversas  razões  de  sucesso  teriam  uma  média  para  se 
obter  uma  única  medida. 

Validação  cruzada 

A  técnica  de  validação  cruzada  para  avaliar  validade  ex¬ 
terna  é  feita  com  múltiplos  subconjuntos  da  amostra  total 
[2,4].  A  abordagem  mais  amplamente  usada  é  o  método 
jackknife.  Validação  cruzada  é  baseada  no  princípio  do 
“deixe  um  de  fora”.  Q  uso  mais  comum  desse  método  é 
estimar  k  -  í  amostras,  eliminando-se  uma  observação 
por  vez  a  partir  de  uma  amostra  de  k  casos.  Elma  fun- 
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ção  discriminante  é  calculada  para  cada  subamostra,  e 
em  seguida  a  pertinência  a  grupo  prevista  da  observação 
eliminada  é  feita  com  a  função  discriminante  estimada 
sobre  os  demais  casos.  Depois  que  todas  as  previsões  de 
pertinência  a  grupo  foram  feitas,  uma  por  vez,  uma  ma¬ 
triz  de  classificação  é  construída  e  a  razão  de  sucesso  é 
calculada. 

Validação  cruzada  é  muito  sensível  a  amostras  pe¬ 
quenas.  Orientações  sugerem  que  ela  seja  usada  somente 
quando  o  tamanho  do  grupo  menor  é  pelo  menos  três  ve¬ 
zes  o  número  de  variáveis  preditoras,  e  a  maioria  dos  pes¬ 
quisadores  sugere  uma  proporção  de  cinco  para  um  [13]. 
No  entanto,  validação  cruzada  pode  representar  a  única 
técnica  de  validação  possível  em  casos  em  que  a  amos¬ 
tra  original  é  muito  pequena  para  dividir  em  amostras  de 
análise  e  de  teste,  mas  ainda  excede  as  orientações  já  dis¬ 
cutidas.  Validação  cruzada  também  está  se  tornando  mais 
amplamente  usada  à  medida  que  os  principais  programas 
de  computador  a  disponibilizam  como  opção. 

Diferenças  de  perfis  de  grupos 

Uma  outra  técnica  de  validação  é  estabelecer  o  perfil  dos 
grupos  sobre  as  variáveis  independentes  para  garantir 
sua  correspondência  com  as  bases  conceituais  usadas  na 
formulação  do  modelo  original.  Depois  que  o  pesquisa¬ 
dor  identifica  as  variáveis  independentes  que  oferecem 
a  maior  contribuição  à  discriminação  entre  os  grupos,  o 
próximo  passo  é  traçar  o  perfil  das  características  dos  gru¬ 
pos  com  base  nas  médias  dos  mesmos.  Esse  perfil  permite 
ao  pesquisador  compreender  o  caráter  de  cada  grupo  de 
acordo  com  as  variáveis  preditoras. 

-  REGRAS  PRÁTICAS  5-4  - 

Interpretação  e  validação  de  funções 
discriminantes 

•  Cargas  discriminantes  são  o  método  preferido  para 
avaliar  a  contribuição  de  cada  variável  em  uma  função 
discriminante,  pois  elas  são: 

•  Uma  medida  padronizada  de  importância  (variando 
de  0  a  1) 

•  Disponíveis  para  todas  as  variáveis  independentes, 
sejam  usadas  no  processo  de  estimação  ou  não 

•  Não  afetadas  por  multicolinearidade 

•  Cargas  excedendo  ±  0,40  são  consideradas  substantivas 
para  fins  de  interpretação 

•  No  caso  de  mais  de  uma  função  discriminante, 
certifique-se  de: 

•  Usar  cargas  rotacionadas 

•  Avaliar  a  contribuição  de  cada  variável  em  todas  as 
funções  com  o  índice  de  potência 

•  A  função  discriminante  deve  ser  validada  com  a 
amostra  de  teste  ou  um  dos  procedimentos  “deixe  um 
de  fora” 


Por  exemplo,  olhando  os  dados  da  pesquisa  da  Kitchen- 
Aid  apresentados  na  Tabela  5-1,  percebemos  que  a  ava¬ 
liação  média  de  “durabilidade”  para  o  grupo  “compra¬ 
ria”  é  7,4,  enquanto  a  avaliação  média  comparável  de 
“durabilidade”  para  o  grupo  “não  compraria”  é  de  3,2. 
Assim,  um  perfil  desses  dois  grupos  mostra  que  o  grupo 
“compraria”  avalia  a  durabilidade  percebida  do  novo 
produto  bem  mais  do  que  o  grupo  “não  compraria”. 


Outra  abordagem  é  estabelecer  o  perfil  de  grupos  em 
um  conjunto  separado  de  variáveis  que  deve  espelhar  as 
diferenças  observadas  de  grupos.  Esse  perfil  separado  for¬ 
nece  uma  avaliação  de  validade  externa,  de  modo  que  os 
grupos  variam  tanto  na(s)  variável(eis)  independente(s) 
quanto  no  conjunto  de  variáveis  associadas.  Essa  técnica 
é  semelhante,  em  caráter,  à  validação  de  agrupamentos 
obtidos  descrita  no  Capítulo  8. 


UM  EXEMPLO  ILUSTRATIVO 
DE  DOIS  GRUPOS 

Para  ilustrar  a  aplicação  da  análise  discriminante  de  dois 
grupos,  usamos  variáveis  obtidas  da  base  de  dados  HBAT 
introduzida  no  Capítulo  1.  Esse  exemplo  examina  cada 
um  dos  seis  estágios  do  processo  de  construção  de  modelo 
para  um  problema  de  pesquisa  particularmente  adequado 
à  análise  discriminante  múltipla. 

Estágio  1:  Objetivos  da  análise  discriminante 


Você  lembra  que  uma  das  características  de  cliente  obti¬ 
da  pela  HBAT  em  sua  pesquisa  foi  uma  variável  categó¬ 
rica  (A,)  que  indicava  a  região  na  qual  a  empresa  estava 
localizada:  EU  A/ América  do  Norte  ou  fora.  A  equipe 
administrativa  da  HBAT  está  interessada  em  quaisquer 
diferenças  de  percepções  entre  aqueles  clientes  localiza¬ 
dos  e  servidos  por  sua  equipe  de  venda  nos  EUA  versus 
aqueles  fora  dos  EUA  e  que  são  servidos  principalmente 
por  distribuidores  independentes.  A  despeito  de  diferen¬ 
ças  encontradas  em  termos  de  suporte  de  vendas  devido 
à  natureza  da  equipe  de  venda  servindo  cada  área  geo¬ 
gráfica,  a  equipe  administrativa  está  interessada  em  ver 
se  as  outras  áreas  de  operação  (linha  do  produto,  preço 
etc.)  são  vistas  de  maneira  distinta  por  estes  dois  con¬ 
juntos  de  clientes.  Esta  indagação  segue  a  óbvia  neces¬ 
sidade  por  parte  da  administração  de  sempre  procurar 
melhor  entender  seu  cliente,  neste  caso  se  concentrando 
em  diferenças  que  podem  ocorrer  entre  áreas  geográfi¬ 
cas.  Se  quaisquer  percepções  de  HBAT  forem  notadas 
como  diferindo  significativamente  entre  firmas  nessas 
duas  regiões,  a  companhia  será  então  capaz  de  desen- 
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volver  estratégias  para  remediar  quaisquer  deficiências 
percebidas  e  desenvolver  estratégias  diferenciadas  para 
acomodar  as  percepções  distintas. 


Para  tanto,  a  análise  discriminante  foi  selecionada  para 
identificar  aquelas  percepções  da  HBAT  que  melhor  dife¬ 
renciam  as  empresas  em  cada  região  geográfica. 

Estágio  2:  Projeto  de  pesquisa 
para  análise  discriminante 

O  estágio  de  projeto  de  pesquisa  se  concentra  em  três  ques¬ 
tões-chave:  selecionar  variáveis  dependente  e  independen¬ 
tes,  avaliar  a  adequação  do  tamanho  da  amostra  para  a  aná¬ 
lise  planejada,  e  dividir  a  amostra  para  fins  de  validação. 

Seleção  de  variáveis  dependente  e  independentes 

A  análise  discriminante  requer  uma  única  medida  depen¬ 
dente  não-métrica  e  uma  ou  mais  medidas  independentes 
métricas  que  são  afetadas  para  fornecer  diferenciação  en¬ 
tre  os  grupos  baseados  na  medida  dependente. 


Como  a  variável  dependente  Região  (At)  é  uma  variá¬ 
vel  categórica  de  dois  grupos,  a  análise  discriminante  é  a 
técnica  apropriada.  O  levantamento  coletou  percepções 
da  HBAT  que  agora  podem  ser  usadas  para  distinguir 
entre  os  dois  grupos  de  firmas.  A  análise  discriminante 
usa  como  variáveis  independentes  as  13  variáveis  de  per¬ 
cepção  a  partir  do  banco  de  dados  (A  a  As)  discri¬ 
minar  entre  firmas  em  cada  área  geográfica. 


Tamanho  da  amostra 

Dado  o  tamanho  relativamente  pequeno  da  amostra 
HBAT  (100  observações),  questões  como  tamanho  amos¬ 
trai  são  particularmente  importantes,  especialmente  a  di¬ 
visão  da  amostra  em  amostras  de  teste  e  de  análise  (ver 
discussão  na  próxima  seção). 


A  amostra  de  100  observações,  quando  particionada  em 
amostras  de  análise  e  de  teste  de  60  e  40  respectivamente, 
mal  atende  à  proporção  mínima  de  5  para  1  de  observa¬ 
ções  para  variáveis  independentes  (60  observações  para 
13  variáveis  independentes  em  potencial)  sugerida  para 
a  amostra  de  análise.  Apesar  de  essa  proporção  crescer 
para  quase  8  para  1  se  a  amostra  não  for  dividida,  consi- 
dera-se  mais  importante  validar  os  resultados  do  que  au¬ 
mentar  o  número  de  observações  na  amostra  de  análise. 

Os  dois  grupos  de  26  e  34  na  amostra  de  estimação 
também  excedem  o  tamanho  mínimo  de  20  observações 
por  grupo.  Finalmente,  os  dois  grupos  são  suficientemen¬ 
te  comparáveis  em  tamanho  para  não  impactar  adversa¬ 
mente  os  processos  de  estimação  ou  de  classificação. 


Divisão  da  amostra 

A  discussão  anterior  enfatizou  a  necessidade  de  validar 
a  função  discriminante  dividindo  a  amostra  em  duas  par¬ 
tes,  uma  usada  para  estimação  e  a  outra  para  validação. 
Em  qualquer  momento  em  que  uma  amostra  de  teste  é 
empregada,  o  pesquisador  deve  garantir  que  os  tamanhos 
de  amostra  resultantes  sejam  suficientes  para  embasar  o 
número  de  pr editores  incluídos  na  análise. 


A  base  de  dados  HBAT  tem  100  observações;  foi  deci¬ 
dido  que  uma  amostra  de  teste  de  40  observações  seria 
suficiente  para  fins  de  validação.  Essa  parfição  deixaria 
ainda  60  observações  para  a  esfimaçâo  da  função  discri- 
minanfe.  Além  disso,  os  tamanhos  relativos  de  grupos  na 
amostra  de  estimação  (26  e  34  nos  dois  grupos)  permiti¬ 
riam  a  estimação  sem  complicações  devidas  a  diferenças 
consideráveis  de  tamanhos  de  grupos. 


É  importante  garantir  aleatoriedade  na  seleção  da 
amostra  de  validação,  de  modo  que  qualquer  ordenação 
das  observações  não  afete  os  processos  de  estimação  e  de 
validação. 

Estágio  3:  Suposições  da  análise  discriminante 

As  principais  suposições  inerentes  à  análise  discrimi¬ 
nante  envolvem  a  formação  da  variável  estatística  ou 
função  discriminante  (normalidade,  linearidade  e  mul- 
ticolinearidade)  e  a  estimação  da  função  discriminan¬ 
te  (matrizes  de  variância  e  co variância  iguais).  Como 
examinar  as  variáveis  independentes  quanto  à  norma¬ 
lidade,  linearidade  e  multicolinearidade  é  explicado 
no  Capítulo  2.  Para  fins  de  nossa  ilustração  da  análise 
discriminante,  essas  suposições  são  atendidas  em  níveis 
aceitáveis. 

A  maioria  dos  programas  estatísticos  tem  um  ou  mais 
teste(s)  estatístico(s)  para  a  suposição  de  matrizes  de  co- 
variância  ou  dispersão  iguais  abordada  no  Capítulo  2.  O 
mais  comum  é  o  teste  M  de  Box  (para  mais  detalhes,  ver 
Capítulo  2). 


Neste  exemplo  de  dois  grupos,  a  significância  de  dife¬ 
renças  nas  matrizes  de  covariância  entre  os  dois  gru¬ 
pos  é  de  0,011.  Mesmo  que  a  significância  seja  menor 
que  0,05  (nesse  teste  o  pesquisador  procura  por  valo¬ 
res  acima  do  nível  desejado  de  significância),  a  sensibi¬ 
lidade  do  teste  a  outros  fatores  que  não  sejam  apenas 
diferenças  de  covariância  (p.ex.,  normalidade  das  va¬ 
riáveis  e  tamanho  crescente  da  amostra)  faz  desse  um 
nível  aceitável. 


Nenhuma  ação  corretiva  adicional  faz-se  necessária 
antes  que  a  estimação  da  função  discriminante  possa  ser 
realizada. 
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Estágio  4:  Estimação  do  modelo 
discriminante  e  avaliação  do  ajnste  geral 

O  pesquisador  tem  a  escolha  de  duas  técnicas  de  estima¬ 
ção  (simultânea  versus  stepwise)  para  determinar  as  va¬ 
riáveis  independentes  incluídas  na  função  discriminante. 
Uma  vez  que  a  técnica  de  estimação  é  escolhida,  o  pro¬ 
cesso  determina  a  composição  da  função  discriminante 
sujeita  à  exigência  de  significância  estatística  especificada 
pelo  pesquisador. 


O  principal  objetivo  dessa  análise  é  identificar  o  con¬ 
junto  de  variáveis  independentes  (percepções  HBAT) 
que  diferencia  ao  máximo  entre  os  dois  grupos  de 
clientes.  Se  o  conjunto  de  variáveis  de  percepções  fos¬ 
se  menor  ou  a  meta  fosse  simplesmente  determinar 
as  capacidades  discriminantes  do  conjunto  inteiro  de 
variáveis  de  percepção,  sem  se  preocupar  com  o  im¬ 
pacto  de  qualquer  percepção  individual,  então  a  abor¬ 
dagem  simultânea  de  inclusão  de  todas  as  variáveis 
diretamente  na  função  discriminante  seria  empregada. 
Mas  neste  caso,  mesmo  com  o  conhecimento  de  mul- 
ticolinearidade  entre  as  variáveis  de  percepção  vista 
no  desempenho  da  análise  fatorial  (ver  Capítulo  3),  a 
abordagem  stepwise  é  considerada  mais  adequada.  De¬ 
vemos  observar,  porém,  que  multicolinearidade  pode 
impactar  sobre  quais  variáveis  entram  na  função  discri¬ 
minante  e  assim  exigir  particular  atenção  no  processo 
de  interpretação. 


Avaliação  de  diferenças  de  grupos 

Iniciemos  nossa  avaliação  da  análise  discriminante  de 
dois  grupos  examinando  a  Tabela  5-5,  que  mostra  as  mé¬ 
dias  de  grupos  para  cada  uma  das  variáveis  independen¬ 
tes,  com  base  nas  60  observações  que  constituem  a  amos¬ 
tra  de  análise. 

Para  identificar  quais  das  cinco  variáveis,  mais  alguma 
das  demais,  melhor  discrimina  entre  os  grupos,  devemos 
estimar  a  função  discriminante. 


Ao  estabelecer  o  perfil  dos  dois  grupos,  podemos  pri¬ 
meiramente  identificar  cinco  variáveis  com  as  maio¬ 
res  diferenças  nas  médias  de  grupo  {X^,  Xjj,  Aj2,  Xjj,  e 
Ajy).  A  Tabela  5-5  também  exibe  o  lambda  de  Wilks  e  a 
ANOVA  univariada  utilizada  para  avaliar  a  significân¬ 
cia  entre  médias  das  variáveis  independentes  para  os 
dois  grupos.  Esses  testes  indicam  que  as  cinco  variáveis 
de  percepção  são  também  as  únicas  com  diferenças  uni- 
variadas  significantes  entre  os  dois  grupos.  Finalmente, 
os  valores  de  Mahalanobis  mínimos  são  também  da¬ 
dos.  Este  valor  é  importante  porque  ele  é  a  medida  usa¬ 
da  para  selecionar  variáveis  para  entrada  no  processo 
de  estimação  stepwise.  Como  apenas  dois  grupos  estão 


envolvidos,  o  maior  valor  tem  também  a  diferença 
entre  grupos  mais  significante  (note  que  o  mesmo  fato 
não  ocorre  necessariamente  com  três  ou  mais  grupos, 
nos  quais  grandes  diferenças  entre  dois  grupos  quais¬ 
quer  podem  não  resultar  nas  maiores  diferenças  gerais 
em  todos  os  grupos,  como  será  mostrado  no  exemplo 
de  três  grupos). 

O  exame  das  diferenças  de  grupos  leva  à  identifica¬ 
ção  de  cinco  variáveis  de  percepção  {X^,  Ajj,  Ajj,  e 
X^j)  como  o  conjunto  mais  lógico  de  candidatos  a  entra¬ 
rem  na  análise  discriminante.  Essa  considerável  redução 
a  partir  do  conjunto  maior  de  13  variáveis  de  percepção 
reforça  a  decisão  de  se  usar  um  processo  de  estimação 
stepwise. 


Estimação  da  função  discriminante 

O  procedimento  stepwise  começa  com  todas  as  variáveis 
excluídas  do  modelo  e  então  seleciona  a  variável  que: 

1.  Mostra  diferenças  estatisticamente  significantes  nos  grupos 
(0,05  ou  menos  exigido  para  entrada) 

2.  Dá  a  maior  distância  de  Mahalanobis  (D^)  entre  os  grupos 

Este  processo  continua  a  incluir  variáveis  na  função 
discriminante  desde  que  elas  forneçam  discriminação  adi¬ 
cional  estatisticamente  significante  entre  os  grupos  além 
daquelas  diferenças  já  explicadas  pelas  variáveis  na  fun¬ 
ção  discriminante. Esta  técnica  é  semelhante  ao  processo 
stepwise  em  regressão  múltipla  (ver  Capítulo  4),  que  adi¬ 
ciona  variáveis  com  aumentos  significantes  na  variância 
explicada  da  variável  dependente.  Além  disso,  em  casos 
nos  quais  duas  ou  mais  variáveis  entram  no  modelo,  as  va¬ 
riáveis  já  presentes  são  avaliadas  para  possível  remoção. 
Uma  variável  pode  ser  removida  se  existir  elevada  multi¬ 
colinearidade  entre  ela  e  as  demais  variáveis  independen¬ 
tes  incluídas,  de  modo  que  sua  significância  fica  abaixo  do 
nível  para  remoção  (0,10). 


Estimação  stepwise’.  adição  da  primeira  variável 
Ajj.  A  partir  de  nossa  revisão  de  diferenças  de  gru¬ 
pos,  percebemos  que  Ajj  tinha  a  maior  diferença  signi¬ 
ficante  entre  grupos  e  o  maior  de  Mahalanobis  (ver 
Tabela  5-5).  Logo,  entra  como  a  primeira  variável 
no  procedimento  stepwise  (ver  Tabela  5-6).  Como  ape¬ 
nas  uma  variável  entra  no  modelo  discriminante  neste 
momento,  os  níveis  de  significância  e  as  medidas  de 
diferenças  de  grupos  coincidem  com  aqueles  dos  testes 
univariados. 

Depois  que  A^  entra  no  modelo,  as  demais  variáveis 
são  avaliadas  com  base  em  suas  habilidades  discriminan¬ 
tes  incrementais  (diferenças  de  médias  de  grupos  depois 
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TABELA  5-5  Estatísticas  descritivas  de  grupo  e  testes  de  iguaidade  para  a  amostra  de  estimação  na  anáiise  discriminante  de  dois  grupos 


Médias  de  grupos  da  variá-  Teste  de  igualdade  de  médias  de  [f  de  Mahalanobis 
vel  dependente:  X,  Região  grupos*  mínimo 


Variáveis  independentes 

Grupo  0: 
EUA/Améri¬ 
ca  do  Norte 
{n  =  26) 

Grupo  1: 
Fora  da  Amé¬ 
rica  do  Norte 
(n  =  34) 

Lambda 

deWiiks 

Vaior  F 

Significân¬ 

cia 

[f  mínimo 

Entre 

grupos 

Xe 

Qualidade  do  produto 

8,527 

7,297 

0,801 

14,387 

0,000 

0,976 

Oe  1 

X, 

Atividades  de  Comércio  eietrônico 

3,388 

3,626 

0,966 

2,054 

0,157 

0,139 

Oe  1 

Xe 

Suporte  técnico 

5,569 

5,050 

0,973 

1,598 

0,211 

0,108 

Oe  1 

Xe 

Soiução  de  reciamação 

5,577 

5,253 

0,986 

0,849 

0,361 

0,058 

Oe  1 

X:o 

Anúncio 

3,727 

3,979 

0,987 

0,775 

0,382 

0,053 

Oe  1 

Ai 

Linha  do  produto 

6,785 

5,274 

0,695 

25,500 

0,000 

1,731 

Oe  1 

imagem  da  equipe  de  venda 

4,427 

5,238 

0,856 

9,733 

0,003 

0,661 

Oe  1 

As 

Preço  competitivo 

5,600 

7,418 

0,645 

31,992 

0,000 

2,171 

Oe  1 

As 

Garantia  e  reciamações 

6,050 

5,918 

0,992 

0,453 

0,503 

0,031 

Oe  1 

As 

Novos  produtos 

4,954 

5,276 

0,990 

0,600 

0,442 

0,041 

Oe  1 

As 

Encomenda  e  cobrança 

4,231 

4,153 

0,999 

0,087 

0,769 

0,006 

Oe  1 

Az 

Fiexibiiidade  de  preço 

3,631 

4,932 

0,647 

31,699 

0,000 

2,152 

Oe  1 

As 

Veiocidade  de  entrega 

3,873 

3,794 

0,997 

0,152 

0,698 

0,010 

Oe  1 

*  Lambda  de  Wilks  (estatística  U)  e  razão  Funivariada  com  1  e  58  graus  de  liberdade. 


(Continuação) 

que  a  variância  associada  com  é  removida).  Nova¬ 
mente,  variáveis  com  níveis  de  significância  maiores  que 
0,05  são  eliminadas  de  consideração  para  entrada  no 
próximo  passo. 

O  exame  das  diferenças  univariadas  mostradas  na 
Tabela  5-5  identifica  Jíj,  (Flexibilidade  de  preço)  como 
a  variável  com  a  segunda  maior  diferença.  No  entanto, 
o  processo  stepwise  não  utiliza  esses  resultados  univa- 
riados  quando  a  função  discriminante  tem  uma  ou  mais 
variáveis.  Ele  calcula  os  valores  e  os  testes  de  signi¬ 
ficância  estatística  de  diferenças  de  grupos  depois  que  o 
efeito  das  variáveis  nos  modelos  é  removido  (neste  caso 
apenas  está  no  modelo). 

Como  mostrado  na  última  parte  da  Tabela  5-6,  três 
variáveis  (X^,  Xjj  e  X^j)  claramente  atendem  ao  crité¬ 
rio  de  nível  de  significância  de  0,05  para  consideração  no 
próximo  estágio.  X^-j  permanece  como  o  próximo  melhor 
candidato  a  entrar  no  modelo  porque  ela  tem  o  maior 

de  Mahalanobis  (4,300)  e  o  maior  valor  F  a  entrar. 
Não  obstante,  outras  variáveis  (p.ex.,  X^^  têm  substan¬ 
ciais  reduções  em  seu  nível  de  significância  e  no  de 
Mahalanobis  em  relação  ao  que  se  mostra  na  Tabela  5-5 
devido  à  variável  única  no  modelo  (Xjj). 

Estimação  stepwise:  adição  da  segunda  variável  X^^.  No 

passo  2  (ver  Tabela  5-7),  X^j  entra  no  modelo,  conforme 
esperado.  O  modelo  geral  é  significante  {F  =  31,129)  e 
melhora  a  discriminação  entre  grupos,  como  evidencia¬ 
do  pela  diminuição  no  lambda  de  Wilks  de  0,645  para 


0,478.  Além  disso,  o  poder  discriminante  de  ambas  as  va¬ 
riáveis  incluídas  nesse  ponto  é  também  estatisticamente 
significante  (valores  Fde  20,113  para  e  19,863  para 
Xj,).  Com  ambas  as  variáveis  estatisticamente  significan- 
tes,  o  procedimento  se  dirige  para  o  exame  das  variáveis 
fora  da  equação  na  busca  de  potenciais  candidatos  para 
inclusão  na  função  discriminante  com  base  em  sua  dis¬ 
criminação  incremental  entre  os  grupos. 

Júji  é  a  próxima  variável  a  atender  às  exigências  para 
inclusão,  mas  seu  nível  de  significância  e  sua  habilida¬ 
de  discriminante  foram  reduzidos  substancialmente  por 
conta  da  multicolinearidade  com  X^^  e  X^-j  já  na  função 
discriminante.  Mais  notável  ainda  é  o  considerável  au¬ 
mento  no  de  Mahalanobis  em  relação  aos  resultados 
univariados  nos  quais  cada  variável  é  considerada  sepa¬ 
radamente.  No  caso  de  X^^  o  valor  mínimo  aumenta 
de  1,731  (ver  Tabela  5-5)  para  5,045  (Tabela  5-7),  o  que 
indica  um  espalhamento  e  uma  separação  dos  grupos 
por  conta  de  e  Aj,  já  na  função  discriminante.  Note 
que  Ajg  é  quase  idêntica  em  poder  discriminante  rema¬ 
nescente,  mas  Ajj  entrará  no  terceiro  passo  devido  à  sua 
pequena  vantagem. 

Estimação  stepwise:  adição  de  uma  terceira  variável 
Ajj.  A  Tabela  5-8  revê  os  resultados  do  terceiro  passo 
do  processo  stepwise,  onde  Ajj  entra  na  função  discri¬ 
minante.  Os  resultados  gerais  ainda  são  estatisticamente 
significantes  e  continuam  a  melhorar  na  discriminação, 
como  evidenciado  pela  diminuição  no  valor  lambda  de 

(Continua) 


CAPÍTULO  5  Análise  Discriminante  Múltipla  e  Regressão  Logística  255 


TABELA  5-6  Resultados  do  passo  1  da  análise  discriminante  stepwise  de  dois  grupos 


Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,645 

31,992 

1,58 

0,000 

Variáveis  adicionadas/removidas  no  passo  1 

F 

Variável  adicionada 

if  mínimo 

Valor 

Significância 

Entre  grupos 

X,3  Preços  competitivos 

2,171 

31,992 

0,000 

Oe  1 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  de  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  0  passo  1 

Variável 

Tolerância 

Fpara  remover 

[f 

Entre  grupos 

X,3  Preços  competitivos 

1,000 

31,992 

Variáveis  fora  da  análise  após  0  passo  1 

Variável 

Tolerância 

Tolerância  mínima 

F  para  entrar  [f 

'  mínimo 

Entre  grupos 

Xg  Qualidade  de  produto 

0,965 

0,965 

4,926 

2,699 

Oe  1 

Xj  Atividades  de  comércio  eletrônico 

0,917 

0,917 

0,026 

2,174 

Oe  1 

Xg  Suporte  técnico 

0,966 

0,966 

0,033 

2,175 

Oe  1 

Xg  Solução  de  reclamação 

0,844 

0,844 

1,292 

2,310 

Oe  1 

X,„  Anúncio 

0,992 

0,992 

0,088 

2,181 

Oe  1 

X„  Linha  de  produto 

0,849 

0,849 

6,076 

2,822 

Oe  1 

X,2  Imagem  da  equipe  de  venda 

0,987 

0,987 

3,949 

2,595 

Oe  1 

X,4  Garantia  e  reclamações 

0,918 

0,918 

0,617 

2,237 

Oe  1 

X,5  Novos  produtos 

1,000 

1,000 

0,455 

2,220 

Oe  1 

X,g  Encomenda  e  cobrança 

0,836 

0,836 

3,022 

2,495 

Oe  1 

X,2  Flexibilidade  de  preço 

1,000 

1,000 

19,863 

4,300 

Oe  1 

X,g  Velocidade  de  entrega 

0,910 

0,910 

1,196 

2,300 

Oe  1 

Teste  de  significância  de  diferenças  de  grupos  após  0  passo  1° 

EUA/América  do  Norte 

Fora  da  América  do  Norte 

F 

31,992 

Sig. 

0,000 

“t  ,58  graus  de  liberdade 

(Continuação) 

Wilks  (de  0,478  para  0,438).  Note,  porém,  que  a  queda 
foi  muito  menor  do  que  aquela  encontrada  quando  a 
segunda  variável  foi  adicionada  à  função  discrimi¬ 
nante.  Com  Xjj,  e  Xy  estatisticamente  significantes, 
o  procedimento  se  dirige  para  a  identificação  de  candi¬ 
datos  remanescentes  para  inclusão. 

Como  visto  na  última  parte  da  Tabela  5-8,  nenhuma 
das  10  variáveis  independentes  que  sobraram  passam 
pelo  critério  de  entrada  de  significância  estatística  de 
0,05.  Depois  que  X^^  entrou  na  equação,  as  duas  variá¬ 
veis  remanescentes  que  tinham  diferenças  univariadas 
significantes  nos  grupos  (X^  e  ^^2)  apresentam  um  po¬ 
der  discriminatório  adicional  relativamente  pequeno  e 
não  atendem  ao  critério  de  entrada.  Assim,  o  processo 


de  estimação  pára  com  as  três  variáveis  Xy  e  Xy) 
constituindo  a  função  discriminante. 

Resumo  do  processo  de  estimação  stepwise.  A  Tabela 
5-9  fornece  os  resultados  gerais  da  análise  discriminan¬ 
te  stepwise  depois  que  todas  as  variáveis  significantes 
foram  incluídas  na  estimação  da  função  discriminante. 
Essa  tabela  resumo  descreve  as  três  variáveis  (Ajj,  e 
Ajy)  que  são  discriminadores  significantes  com  base  em 
seus  lambda  de  Wilks  e  nos  valores  mínimos  de  de 
Mahalanobis. 

Diversos  resultados  distintos  são  dados  abordando 
tanto  o  ajuste  geral  do  modelo  quanto  o  impacto  de  va¬ 
riáveis  específicas. 
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TABELA  5-7  Resultados  do  passo  2  da  análise  discriminante  stepwise  de  dois  grupos 


Ajuste  geral  do  modelo 

Valor 

Vaior  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,478 

31,129 

2,57 

0,000 

Variáveis  adicionadas/removidas  no  passo  2 

F 

Variável  adicionada 

[f  mínimo 

Valor 

Significância 

Entre  grupos 

X,3  Flexibilidade  de  preço 

4,300 

31,129 

0,000 

0e1 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  de  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  2 

Variável 

Tolerância 

F  para  remover 

tf 

Entre  grupos 

X,3  Preços  competitivos 

1,000 

20,113 

2,152 

Oe  1 

X„  Flexibilidade  de  preço 

1,000 

19,863 

2,171 

Oe  1 

Variáveis  fora  da  análise  após  o  passo  2 

Variável 

Tolerância 

Tolerância  mínima 

F  para  entrar  tf 

'  mínimo 

Entre  grupos 

Xg  Qualidade  de  produto 

0,884 

0,884 

0,681 

4,400 

Oe  1 

Xj  Atividades  de  comércio  eletrônico 

0,804 

0,804 

2,486 

4,665 

Oe  1 

Xg  Suporte  técnico 

0,966 

0,966 

0,052 

4,308 

Oe  1 

Xg  Solução  de  reclamação 

0,610 

0,610 

1,479 

4,517 

Oe  1 

X,o  Anúncio 

0,901 

0,901 

0,881 

4,429 

Oe  1 

X,,  Linha  de  produto 

0,848 

0,848 

5,068 

5,045 

Oe  1 

X,2  Imagem  da  equipe  de  venda 

0,944 

0,944 

0,849 

4,425 

Oe  1 

X,4  Garantia  e  reclamações 

0,916 

0,916 

0,759 

4,411 

Oe  1 

X,5  Novos  produtos 

0,986 

0,986 

0,017 

4,302 

Oe  1 

X,g  Encomenda  e  cobrança 

0,625 

0,625 

0,245 

4,336 

Oe  1 

X,g  Velocidade  de  entrega 

0,519 

0,519 

4,261 

4,927 

Oe  1 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  2’ 

EUA/América  do  Norte 

Fora  da  América  do  Norte  F  32,129 

Sig.  0,000 

“2,57  graus  de  liberdade 


(Continuação) 

•  As  medidas  multivariadas  de  ajuste  geral  do  modelo 
são  relatadas  sob  a  legenda  "Funções  discriminantes 
canônicas " .  Observe  que  a  função  discriminante  é  al¬ 
tamente  significante  (0,000)  e  retrata  uma  correlação 
canônica  de  0,749.  Interpretamos  essa  correlação  ele- 
vando-a  ao  quadrado  (0,749)^=  0,561.  Logo,  56,1%  da 
variância  na  variável  dependente  (X^)  pode  ser  explica¬ 
da  por  este  modelo,  o  qual  inclui  apenas  três  variáveis 
independentes. 

•  Os  coeficientes  padronizados  da  função  discriminante 
são  fornecidos,  mas  são  menos  preferidos  para  fins  de 
interpretação  do  que  as  cargas  discriminantes.  Os  coe¬ 
ficientes  discriminantes  não-padronizados  são  usados 
para  calcular  os  escores  Z  discriminantes  que  podem 
ser  empregados  na  classificação. 


•  As  cargas  discriminantes  são  relatadas  sob  a  legenda 
"Matriz  estrutural"  e  são  ordenadas  da  maior  para  a 
menor  em  termos  de  tamanho  da  carga.  As  cargas  são 
discutidas  depois  na  fase  de  interpretação  (estágio  5). 

•  Os  coeficientes  da  função  de  classificação,  também 
conhecidos  como  funções  discriminantes  lineares  de 
Fisher,  são  utilizados  na  classificação  e  discutidos  poste¬ 
riormente. 

•  Centróides  de  grupo  são  também  relatados,  e  eles  re¬ 
presentam  a  média  dos  escores  individuais  da  função 
discriminante  para  cada  grupo.  Centróides  fornecem 
uma  medida  resumo  da  posição  relativa  de  cada  grupo 
nas  funções  discriminantes.  Neste  caso,  a  Tabela  5-9 
revela  que  o  centróide  de  grupo  para  as  firmas  nos 
EU  A/ América  do  Norte  (grupo  0)  é  -1,273,  enquanto 

(Continua) 
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TABELA  5-8  Resultados  do  passo  3  da  análise  discriminante  stepwise  de  dois  grupos 


Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,438 

23,923 

3,  56 

0,000 

Variáveis  adicionadas/removidas  no  passo  3 

F 

Cf  mínimo 

Valor 

Significância 

Entre  grupos 

X„  Linha  de  produto 

5,045 

23,923 

0,000 

Oe  1 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  de  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  3 

Variável 

Tolerância 

Fpara  remover 

[f 

Entre  grupos 

X,3  Preços  competitivos 

0,849 

7,258 

4,015 

Oe  1 

X,7  Flexibilidade  de  preço 

0,999 

18,416 

2,822 

Oe  1 

X„  Linha  de  produto 

0,848 

5,068 

4,300 

Oe  1 

Variáveis  fora  da  análise  após  o  passo  3 

Variável 

Tolerância 

Tolerância  mínima 

Fpara  entrar 

[f  mínimo 

Entre  grupos 

Xg  Qualidade  de  produto 

0,802 

0,769 

0,019 

5,048 

Oe  1 

X-,  Atividades  de  comércio  eletrônico 

0,801 

0,791 

2,672 

5,482 

Oe  1 

Xg  Suporte  técnico 

0,961 

0,832 

0,004 

5,046 

Oe  1 

Xg  Solução  de  reclamação 

0,233 

0,233 

0,719 

5,163 

Oe  1 

X,g  Anúncio 

0,900 

0,840 

0,636 

5,149 

Oe  1 

X,2  Imagem  da  equipe  de  venda 

0,931 

0,829 

1,294 

5,257 

Oe  1 

X,4  Garantia  e  reclamações 

0,836 

0,775 

2,318 

5,424 

Oe  1 

X,5  Novos  produtos 

0,981 

0,844 

0,076 

5,058 

Oe  1 

X,g  Encomenda  e  cobrança 

0,400 

0,400 

1,025 

5,213 

Oe  1 

X,g  Velocidade  de  entrega 

0,031 

0,031 

0,208 

5,079 

Oe  1 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  3’ 

EUA/América  do  Norte 

Fora  da  América  do  Norte 

F 

23,923 

Sig. 

0,000 

“3,56  graus  de  liberdade 

{Conlimmção) 

O  centróide  para  as  firmas  fora  da  América  do  Norte 
(grupo  1)  é  0,973.  Para  mostrar  que  a  média  geral  é  0, 
multiplique  o  número  em  cada  grupo  por  seu  centróide 
e  some  ao  resultado  (p.ex.,  26  x  -1,273  +  34  X  0,973 
=  0,0). 


Os  resultados  do  modelo  geral  são  aceitáveis  com  base 
em  significância  estatística  e  prática.  No  entanto,  antes  de 
proceder  com  uma  interpretação  dos  resultados,  o  pesqui¬ 
sador  precisa  avaliar  a  precisão  de  classificação  e  exami¬ 
nar  os  resultados  caso  a  caso. 

Avaliação  da  precisão  de  classificação 

Com  o  modelo  geral  estatisticamente  significante  e  expli¬ 
cando  56%  da  variação  entre  os  grupos  (ver  a  discussão 


anterior  e  a  Tabela  5-9),  passamos  para  a  avaliação  de 
precisão  preditiva  da  função  discriminante.  Em  tal  pro¬ 
cesso  devemos  completar  três  tarefas: 

1.  Calcular  o  escore  de  corte,  o  critério  no  qual  o  escore  Z  dis¬ 
criminante  de  cada  observação  é  julgado  para  determinar 
em  qual  grupo  ela  deve  ser  classificada. 

2.  Classificar  cada  observação  e  desenvolver  as  matrizes  de 
classificação  para  as  amostras  de  análise  e  de  teste. 

3.  Avaliar  os  níveis  de  precisão  preditiva  a  partir  das  ma¬ 
trizes  de  classificação  quanto  a  significância  estatística  e 
prática. 

Apesar  de  o  exame  da  amostra  de  teste  e  de  sua  preci¬ 
são  preditiva  ser  realmente  feito  no  estágio  de  validação, 
os  resultados  são  discutidos  agora  para  facilitar  a  compa¬ 
ração  entre  as  amostras  de  estimação  e  de  teste. 
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TABELA  5-9  Estatísticas  resumo  para  análise  discriminante  de  dois  grupos 


Ajuste  geral  do  modelo:  funções  discriminantes  canônicas 


Função  Autovalor 

Percentual  de  variância 

Função  %  Cumulativo  % 

Correlação  Lambda  de 
canônica  Wilks 

Qui-qua- 

drado  df  Significância 

1  1 ,282 

100 

100 

0,749  0,438 

46,606  3  0,000 

Função  discriminante  e  coeficientes  da  função  de  classificação 

Funções  discriminantes 

Funções  de  ciassificação 

Grupo  0:  EUA/América 

Grupo  1 :  Fora  da  América 

Variáveis  independentes 

Não-padronizado 

Padronizado 

do  Norte 

do  Norte 

X,,  Linha  de  produto 

-0,363 

-0,417 

7,725 

6,909 

X,3  Preços  competitivos 

0,398 

0,490 

6,456 

7,349 

X,7  Flexibilidade  de  preço 

0,749 

0,664 

4,231 

5,912 

Constante 

-3,752 

-52,800 

-60,623 

Matriz  estrutural’ 

Variáveis  independentes 

Função  1 

X,3  Preços  competitivos 

0,656 

X,7  Flexibilidade  de  preço 

0,653 

X,,  Linha  de  produto 

-0,586 

X-,  Atividades  de  comércio  eletrônico 

* 

0,429 

Xg  Qualidade  de  produto* 

-0,418 

X,4  Garantia  e  reclamações* 

-0,329 

X,„  Anúncio* 

0,238 

Xg  Solução  de  reclamações* 

-0,181 

X,2  Imagem  da  equipe  de  venda* 

0,164 

X,g  Encomenda  e  cobrança* 

-0,149 

Xg  Suporte  técnico* 

-0,136 

X,g  Velocidade  de  entrega* 

-0,060 

X,5  Novos  produtos* 

0,041 

'Variável  não  usada  na  anãlise 

Médias  de  grupos  (centróides)  de  funções  discriminantes 

X4  Região 

Função  1 

EUA/América  do  Norte 

-1 ,273 

Fora  da  América  do  Norte 

0,973 

“Correlações  internas  de  grupos  entre  variáveis  discriminantes  e  funções  discriminantes  canônicas  padronizadas  ordenadas  por  tamanho  absoluto  de  correlação 
na  função, 


Cálculo  do  escore  de  corte.  O  pesquisador  deve  primei¬ 
ramente  determinar  como  as  probabilidades  a  priori  de 
classificação  são  determinadas,  ou  com  base  nos  tama¬ 
nhos  reais  dos  grupos  (assumindo  que  eles  são  represen¬ 
tativos  da  população),  ou  especificadas  pelo  pesquisador, 
sendo  que  mais  freqüentemente  são  estabelecidas  como 
iguais  em  uma  postura  conservadora  do  processo  de  clas¬ 
sificação. 


Nesta  amostra  de  análise  de  60  observações,  sabemos 
que  a  variável  dependente  consiste  em  dois  grupos,  26 
empresas  localizadas  nos  EUA  e  34  empresas  fora  do 
país.  Se  não  estamos  certos  de  que  as  proporções  da  po¬ 


pulação  são  representadas  pela  amostra,  então  devemos 
empregar  probabilidades  iguais.  No  entanto,  como  nos¬ 
sa  amostra  de  empresas  é  aleatoriamente  extraída,  po¬ 
demos  estar  razoavelmente  certos  de  que  essa  amostra 
reflete  as  proporções  da  população.  Logo,  essa  análise 
discriminante  usa  as  proporções  da  amostra  para  especi¬ 
ficar  as  probabilidades  a  priori  para  fins  de  classificação. 
Tendo  especificado  as  probabilidades  a  priori,  o  escore 
de  corte  ótimo  pode  ser  calculado.  Como  nesta  situação 
os  grupos  são  considerados  representativos,  o  cálculo 
se  torna  uma  média  ponderada  dos  dois  centróides  de 
grupos: 

{Continua) 
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{Continuação) 

Z  (26x0, 973)  +  (34x-l, 273)  ^ 

“  JV  +JV„  26  +  34 

A  B 

Substituindo  os  valores  apropriados  na  fórmula,  po¬ 
demos  obter  o  escore  de  corte  crítico  (assumindo  custos 
iguais  de  má  classificação)  de  =  —0,2997. 


Classificação  de  observações  e  construção  de  matrizes  de 
classificação.  Uma  vez  que  o  escore  de  corte  tenha  sido 
calculado,  cada  observação  pode  ser  classificada  compa¬ 
rando  seu  escore  discriminante  com  o  de  corte. 


O  procedimento  para  classificar  empresas  com  o  escore 
de  corte  ótimo  é  o  seguinte: 

•  Classifique  uma  empresa  como  sendo  do  grupo  0  (Esta¬ 
dos  Unidos/ América  do  Norte)  se  seu  escore  discrimi¬ 
nante  for  menor  que  -0,2997. 

•  Classifique  uma  empresa  como  sendo  do  grupo  1  (Fora 
dos  Estados  Unidos)  se  seu  escore  discriminante  for 
maior  que  -0,2997. 

Matrizes  de  classificação  para  as  observações  nas 
amostras  de  análise  e  de  validação  foram  calculadas,  e 
os  resultados  são  exibidos  na  Tabela  5-10.  A  amostra  de 
análise  tem  86,7%  de  precisão  de  previsão,  que  é  ligeira¬ 
mente  maior  que  a  precisão  de  85%  da  amostra  de  teste, 
como  já  antecipado.  Além  disso,  a  amostra  que  passou 
por  validação  cruzada  conseguiu  uma  precisão  preditiva 
de  83,3%. 


Avaliação  da  precisão  de  classificação  atingida.  Ainda 
que  todas  as  medidas  de  precisão  de  classificação  sejam 


bastante  altas,  o  processo  de  avaliação  requer  uma  com¬ 
paração  com  a  precisão  de  classificação  em  uma  série  de 
medidas  baseadas  em  chances.  Essas  medidas  refletem 
a  melhora  do  modelo  discriminante  quando  se  compara 
com  a  classiflcação  de  indivíduos  sem  o  uso  da  função  dis¬ 
criminante.  Sabendo-se  que  a  amostra  geral  é  de  100  ob¬ 
servações  e  que  os  grupos  de  teste/validação  são  menores 
do  que  20,  usaremos  a  amostra  geral  para  estabelecer  os 
padrões  de  comparação. 

A  primeira  medida  é  o  critério  de  chance  proporcio¬ 
nal,  o  qual  considera  que  os  custos  da  má  classiflcação  são 
iguais  (ou  seja,  queremos  identificar  os  membros  de  cada 
grupo  igualmente  bem).  O  critério  de  chance  proporcio¬ 
nal  é: 

CpRo  =  +  (1  -  pf 

onde 

CpifQ  =  critério  de  chance  proporcional 
p  =  proporção  de  empresas  no  grupo  0 
1-p  =  proporção  de  empresas  no  grupo  1 


O  grupo  de  clientes  localizados  nos  Estados  Unidos 
(grupo  0)  constitui  39,0%  da  amostra  de  análise  (39/100), 
com  o  segundo  grupo  representando  clientes  localizados 
fora  dos  Estados  Unidos  (grupo  1)  formando  os  61,0% 
restantes.  O  valor  calculado  de  chance  proporcional  é  de 
0,524  (0,390^  -f  0,610"  =  0,524). 


O  critério  de  chance  máxima  é  simplesmente  o  per¬ 
centual  corretamente  classificado  se  todas  as  observações 
fossem  colocadas  no  grupo  com  a  maior  probabilidade 
de  ocorrência.  Ele  reflefe  nosso  padrão  mais  conserva- 


TABELA  5-10  Resultados  de  classificação  para  análise  discriminante  de  dois  grupos 


Resultados  de  classificação’  '’’ 

C 

Pertinência  prevista  em  grupo 

Amostra 

Grupo  real 

EUA/América  do  Norte 

Fora  da  América  do  Norte 

Totai 

Amostra  de  estimação 

EU/VAmérica  do  Norte 

25 

1 

26 

96,2% 

3,8% 

Fora  da  América  do  Norte 

7 

27 

34 

20,6% 

79,4% 

Amostra  de  validação  cruzada'' 

EU/VAmérica  do  Norte 

24 

2 

26 

92,3 

7,7 

Fora  da  América  do  Norte 

8 

26 

34 

23,5 

76,5 

Amostra  de  teste 

EU/VAmérica  do  Norte 

9 

4 

13 

69,2 

30,8 

Fora  da  América  do  Norte 

2 

25 

27 

7,4 

92,6 

“86,7%  dos  casos  originais  selecionados  e  agrupados  (amostra  de  estimação)  corretamente  classificados. 

‘'85,0%  dos  casos  originais  nâo-selecionados  e  agrupados  (amostra  de  validação)  corretamente  classificados. 

“83,3%  dos  casos  selecionados  validados  por  cruzamento  corretamente  classificados. 

“Validação  cruzada  é  feita  somente  para  aqueles  casos  da  análise  (amostra  de  estimação).  Em  validação  cruzada,  cada  caso  é  classificado  pelas  funções 
derivadas  de  todos  os  casos  distintos  daquele. 
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dor  e  assume  nenhuma  diferença  no  custo  de  uma  má 
classificação. 


Como  o  grupo  1  (clientes  fora  dos  Estados  Unidos)  é  o 
maior,  com  61%  da  amostra,  estaríamos  corretos  61,0% 
do  tempo  se  designássemos  todas  as  observações  a  esse 
grupo.  Se  escolhemos  o  critério  de  chance  máxima  como 
o  padrão  de  avaliação,  nosso  modelo  deve  ter  um  de¬ 
sempenho  superior  a  61%  de  precisão  de  classificação 
para  ser  aceitável. 


Para  tentar  garantir  significância  prática,  a  precisão  de 
classificação  alcançada  deve  exceder  o  padrão  de  compa¬ 
ração  escolhido  em  25%.  Assim,  devemos  selecionar  um 
padrão  de  comparação,  calcular  o  valor  de  referência  e 
comparar  com  a  razão  de  sucesso  conseguida. 


Todos  os  níveis  de  precisão  de  classificação  (razões 
de  sucesso)  excedem  85%,  o  que  é  consideravelmente 
maior  do  que  o  critério  de  chance  proporcional  de  52,4% 
ou  mesmo  do  critério  de  chance  máxima  de  61,0%. 
Todas  as  três  razões  também  excedem  o  valor  de  refe¬ 
rência  sugerido  desses  valores  (padrão  de  comparação 
mais  25%),  que  neste  caso  é  de  65,5%  (52,4%  x  1,25  = 
65,5%)  para  a  chance  proporcional  e  76,3%  (61,0%  x 
1,25  =  76,3%)  para  a  chance  máxima.  Em  todos  os  casos 
(amostra  de  análise,  de  teste  e  de  validação  cruzada),  os 
níveis  de  precisão  de  classificação  são  substancialmente 
maiores  do  que  os  valores  de  referência,  indicando  um 
nível  aceitável  de  precisão  de  classificação.  Além  disso, 
a  razão  de  sucesso  para  grupos  individuais  é  considerada 
adequada  também. 


A  medida  final  de  precisão  de  classificação  é  o  Q  de 
Press,  que  é  uma  medida  estatística  que  compara  precisão 
de  classificação  com  um  processo  aleatório. 


O  pesquisador  sempre  deve  lembrar  de  tomar  cuidado 
na  aplicação  de  uma  amostra  de  validação  com  pequenos 
conjuntos  de  dados.  Nesse  caso,  a  pequena  amostra  de  40 
para  validação  foi  adequada,  mas  tamanhos  maiores  são 
sempre  mais  desejáveis. 

Diagnósticos  por  casos 

Além  dos  resultados  gerais,  podemos  examinar  as  obser¬ 
vações  individuais  no  que  se  refere  à  precisão  preditiva  e 
identificar  especificamente  os  casos  mal  classificados.  Nes¬ 
ta  operação,  podemos  encontrar  os  casos  específicos  mal 
classificados  para  cada  grupo  nas  amostras  de  análise  e  de 
teste  e  ainda  promover  uma  análise  adicional  na  qual  se 
determine  o  perfil  dos  casos  mal  classificados. 


A  Tabela  5-11  contém  as  previsões  de  grupo  para  as 
amostras  de  análise  e  de  validação  e  nos  permite  identifi¬ 
car  os  casos  específicos  para  cada  tipo  de  má  classificação 
tabulada  nas  matrizes  de  classificação  (ver  Tabela  5-10). 
Para  a  amostra  de  análise,  os  sete  clientes  localizados 
fora  dos  Estados  Unidos  que  foram  mal  classificados  no 
grupo  de  clientes  na  América  do  Norte  podem  ser  iden¬ 
tificados  como  os  casos  3,  94,  49,  64,  24,  53  e  32.  Ana¬ 
logamente,  o  único  cliente  dos  Estados  Unidos  que  foi 
mal  classificado  é  identificado  como  caso  43.  Um  exame 
semelhante  pode  ser  feito  para  a  amostra  de  validação. 


Assim  que  os  casos  mal  classificados  são  identifica¬ 
dos,  uma  análise  adicional  pode  ser  realizada  para  com¬ 
preender  as  razões  dessa  má  classificação.  Na  Tabela 
5-12,  os  casos  mal  classificados  são  combinados  a  partir 
das  amostras  de  análise  e  de  validação  e  então  compara¬ 
dos  com  os  casos  corretamente  classificados.  O  objetivo 
é  identificar  diferenças  específicas  nas  variáveis  indepen¬ 
dentes  que  possam  identificar  novas  variáveis  a  serem 
acrescentadas  ou  características  em  comum  que  devam 
ser  consideradas. 


A  partir  da  discussão  anterior,  o  cálculo  para  a  amostra 
de  estimação  é 


Q  de  Press 


amostra  de  estimação 


[60-(52x2)]U^^ 

60(2-1) 


E  o  cálculo  para  a  amostra  de  validação  é 


Q  de  Press 


amostra  de  teste 


[40 -(34x2)]^ 
40(2-1) 


19,6 


Em  ambos  os  casos,  os  valores  calculados  excedem  o 
valor  crítico  de  6,63.  Assim,  a  precisão  de  classificação  para 
a  amostra  de  análise  e,  mais  importante,  para  a  amostra  de 
validação  excede  em  um  nível  estatisticamente  significante 
a  precisão  esperada  de  classificação  por  chance. 


Os  cinco  casos  (tanto  na  amostra  de  análise  quanto  na  de 
validação)  mal  classificados  entre  os  clientes  dos  Estados 
Unidos  (grupo  0)  têm  diferenças  significantes  em  duas 
das  três  variáveis  independentes  na  função  discriminante 
(Ajj  e  X^j),  bem  como  em  uma  variável  não  incluída  na 
função  discriminante  (X^).  Para  tal  variável,  o  perfil  dos 
casos  mal  classificados  não  é  semelhante  ao  seu  grupo 
correto;  logo,  não  ajuda  na  classificação.  Analogamente, 
os  nove  casos  mal  classificados  do  grupo  1  (fora  dos  Es¬ 
tados  Unidos)  mostram  quatro  diferenças  significantes 
(Ag,  Ajj,  e  Aj,),  mas  apenas  Ag  não  está  na  função 
discriminante.  Podemos  ver  que  aqui  Ag  funciona  contra 
a  precisão  de  classificação  porque  os  casos  mal  classifi¬ 
cados  são  mais  semelhantes  ao  grupo  incorreto  do  que 
ao  outro. 

(Continua) 
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TABELA  5-1 1  Previsões  de  grupo  para  casos  individuais  na  análise  discriminante  de  dois  grupos 


Identificação 
do  caso  Grupo  real 

Escore  Z 
discriminante 

Grupo  previsto 

Identificação 
de  caso 

Grupo  real 

Escore  Z 
discriminante 

Grupo  previsto 

Amostra  de  análise 

72 

0 

-2,10690 

0 

24 

1 

-0,60937 

0 

14 

0 

-2,03496 

0 

53 

1 

-0,45623 

0 

31 

0 

-1,98885 

0 

32 

1 

-0,36094 

0 

54 

0 

-1,98885 

0 

80 

1 

-0,14687 

1 

27 

0 

-1 ,76053 

0 

38 

1 

-0,04489 

1 

29 

0 

-1 ,76053 

0 

60 

1 

-0,04447 

1 

16 

0 

-1,71859 

0 

65 

1 

0,09785 

1 

61 

0 

-1,71859 

0 

35 

1 

0,84464 

1 

79 

0 

-1,57916 

0 

1 

1 

0,98896 

1 

36 

0 

-1,57108 

0 

4 

1 

1,10834 

1 

98 

0 

-1,57108 

0 

68 

1 

1,12436 

1 

58 

0 

-1 ,48136 

0 

44 

1 

1 ,34768 

1 

45 

0 

-1 ,33840 

0 

17 

1 

1 ,35578 

1 

2 

0 

-1 ,29645 

0 

67 

1 

1 ,35578 

1 

52 

0 

-1 ,29645 

0 

33 

1 

1,42147 

1 

50 

0 

-1 ,24651 

0 

87 

1 

1 ,57544 

1 

47 

0 

-1 ,20903 

0 

6 

1 

1 ,58353 

1 

88 

0 

-1,10294 

0 

46 

1 

1,60411 

1 

11 

0 

-0,74943 

0 

12 

1 

1 ,75931 

1 

56 

0 

-0,73978 

0 

69 

1 

1 ,82233 

1 

95 

0 

-0,73978 

0 

86 

1 

1 ,82233 

1 

81 

0 

-0,72876 

0 

10 

1 

1 ,85847 

1 

5 

0 

-0,60845 

0 

30 

1 

1,90062 

1 

37 

0 

-0,60845 

0 

15 

1 

1,91724 

1 

63 

0 

-0,38398 

0 

92 

1 

1,97960 

1 

43 

0 

0,23553 

1 

7 

1 

2,09505 

1 

3 

1 

-1 ,65744 

0 

20 

1 

2,22839 

1 

94 

1 

-1,57916 

0 

8 

1 

2,39938 

1 

49 

1 

-1 ,04667 

0 

100 

1 

2,62102 

1 

64 

1 

-0,67406 

0 

48 

1 

2,90178 

1 

Amostra  de  teste 

23 

0 

22,38834 

0 

25 

1 

1 ,47048 

1 

93 

0 

-2,03496 

0 

18 

1 

1,60411 

1 

59 

0 

-1 ,20903 

0 

73 

1 

1,61002 

1 

85 

0 

-1,10294 

0 

21 

1 

1 ,69348 

1 

83 

0 

-1,03619 

0 

90 

1 

1,69715 

1 

91 

0 

-0,89292 

0 

97 

1 

1 ,70398 

1 

82 

0 

-0,74943 

0 

40 

1 

1,75931 

1 

76 

0 

-0,72876 

0 

77 

1 

1 ,86055 

1 

96 

0 

-0,57335 

0 

28 

1 

1 ,97494 

1 

13 

0 

0,13119 

1 

71 

1 

2,22839 

1 

89 

0 

0,51418 

1 

19 

1 

2,28652 

1 

42 

0 

0,63440 

1 

57 

1 

2,31456 

1 

78 

0 

0,63440 

1 

9 

1 

2,36823 

1 

22 

1 

-2,73303 

0 

41 

1 

2,53652 

1 

74 

1 

-1 ,04667 

0 

26 

1 

2,59447 

1 

51 

1 

0,09785 

1 

70 

1 

2,59447 

1 

62 

1 

0,94702 

1 

66 

1 

2,90178 

1 

75 

1 

0,98896 

1 

34 

1 

2,97632 

1 

99 

1 

1,13130 

1 

55 

1 

2,97632 

1 

84 

1 

1 ,30393 

1 

39 

1 

3,21116 

1 
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TABELA  5-12  Perfil  de  observações  corretamente  classificadas  e  mal  classificadas  na  análise  discriminante  de  dois  grupos 


Escores  médios 

Teste  t 

Variável  dependente: 

Corretamente 

Mal 

Significãncia 

^4  Região  Variáveis  (Grupo/Perfil) 

classificada 

classificada 

Diferença 

estatística 

EUA/América  do 

Norte 

(n  =  34) 

(n  =  5) 

Xg  Qualidade  do  produto 

8,612 

9,340 

-0,728 

0,000® 

Xj  Atividades  de  comércio  eletrônico 

3,382 

4,380 

-0,998 

0,068® 

Xg  Suporte  técnico 

5,759 

5,280 

0,479 

0,487 

Xg  Solução  de  reclamação 

5,356 

6,140 

-0,784 

0,149 

X,g  Anúncio 

3,597 

4,700 

-1,103 

0,022 

X,,  Linha  do  produto® 

6,726 

6,540 

0,186 

0,345® 

X,2  Imagem  da  equipe  de  venda 

4,459 

5,460 

-1,001 

0,018 

X,3  Preços  competitivos® 

5,609 

8,060 

-2,451 

0,000 

X,4  Garantia  e  reclamações 

6,215 

6,060 

0,155 

0,677 

X,5  Novos  produtos 

5,024 

4,420 

0,604 

0,391 

X,s  Encomenda  e  cobrança 

4,188 

4,540 

-0,352 

0,329 

X,2  Flexibilidade  de  preço® 

3,568 

4,480 

-0,912 

0,000® 

X,g  Velocidade  de  entrega 

3,826 

4,160 

-0,334 

0,027® 

Fora  da  América  do 

Norte 

(n  =  52) 

(n  =  9) 

Xg  Qualidade  do  produto 

6,906 

9,156 

-2,250 

0,000 

Xj  Atividades  de  comércio  eletrônico 

3,860 

3,289 

0,571 

0,159® 

Xg  Suporte  técnico 

5,085 

5,544 

-0,460 

0,423 

Xg  Solução  de  reclamação 

5,365 

5,822 

-0,457 

0,322 

X,o  Anúncio 

4,229 

3,922 

0,307 

0,470 

X,,  Linha  do  produto® 

4,954 

6,833 

-1 ,879 

0,000 

X,2  Imagem  da  equipe  de  venda 

5,465 

5,467 

-1 ,282E-03 

0,998 

X,3  Preços  competitivos® 

7,960 

5,833 

2,126 

0,000 

X,4  Garantia  e  reclamações 

5,867 

6,400 

-0,533 

0,007® 

X,5  Novos  produtos 

5,194 

5,778 

-0,584 

0,291 

X,s  Encomenda  e  cobrança 

4,267 

4,533 

-0,266 

0,481 

X„  Flexibilidade  de  preço® 

5,458 

3,722 

1,735 

0,000 

X,g  Velocidade  de  entrega 

3,881 

3,989 

-0,108 

0,714 

Nota-,  Casos  das  amostras  de  análise  e  validação  incluídos  para  a  amostra  total  de  100. 

“Variáveis  Incluídas  na  função  discriminante. 

“Teste  (executado  com  estimativas  separadas  de  variância  no  lugar  de  uma  estimativa  coletiva,  pois  o  teste  Levene  detectou  diferenças  significantes  nas  variações 
entre  os  dois  grupos. 


(Continuação) 

As  descobertas  sugerem  que  os  casos  mal  classifi¬ 
cados  podem  representar  um  terceiro  grupo,  pois  eles 
compartilham  perfis  muito  semelhantes  nessas  variáveis, 
mais  do  que  acontece  nos  dois  grupos  existentes.  A  ad¬ 
ministração  pode  analisar  esse  grupo  quanto  a  variáveis 
adicionais  ou  avaliar  se  um  padrão  geográfico  entre  os 
casos  mal  classificados  justifica  um  terceiro  grupo. 


Pesquisadores  devem  examinar  os  padrões  em  ambos 
os  grupos  com  o  objetivo  de  entender  as  características 
comuns  a  eles  em  uma  tentativa  de  definir  os  motivos  para 
a  má  classificação. 

Estágio  5:  Interpretação  dos  resultados 

Após  estimar  a  função,  a  próxima  fase  é  a  interpretação. 
Este  estágio  envolve  o  exame  da  função  para  determinar 


a  importância  relativa  de  cada  variável  independente  na 
discriminação  entre  os  grupos,  interpretar  a  função  dis¬ 
criminante  com  base  nas  cargas  discriminantes,  e  então 
fazer  o  perfil  de  cada  grupo  sobre  o  padrão  de  valores 
médios  para  variáveis  identificadas  como  discriminadoras 
importantes. 

Identificação  de  variáveis  discriminantes  importantes 

Como  anteriormente  discutido,  cargas  discriminantes  são 
consideradas  a  medida  mais  adequada  de  poder  discrimi¬ 
nante,  mas  consideraremos  também  os  pesos  discriminan¬ 
tes  para  fins  de  comparação.  Os  pesos  discriminantes,  na 
forma  padronizada  ou  não,  representam  a  contribuição 
de  cada  variável  à  função  discriminante.  Contudo,  como 
discutiremos,  multicolinearidade  entre  as  variáveis  inde¬ 
pendentes  pode  causar  impacto  na  interpretação  usando 
somente  os  pesos. 
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Cargas  discriminantes  são  calculadas  para  cada  va¬ 
riável  independente,  mesmo  para  aquelas  que  não  estão 
incluídas  na  função  discriminante.  Assim,  pesos*  discri¬ 
minantes  representam  o  único  impacto  de  cada  variável 
independente  e  não  são  restritas  apenas  ao  impacto  com¬ 
partilhado  devido  à  multicolinearidade.  Além  disso,  como 
elas  são  relativamente  pouco  afetadas  pela  multicolineari¬ 
dade,  elas  representam  mais  precisamente  a  associação  de 
cada  variável  com  o  escore  discriminante. 


A  Tabela  5-13  contém  o  conjunto  inteiro  de  medidas 
interpretativas,  incluindo  pesos  discriminantes  padro¬ 
nizados  e  não-padronizados,  cargas  para  a  função  dis¬ 
criminante,  lambda  de  Wilks  e  a  razão  F  univariada.  As 
13  variáveis  independentes  originais  foram  examinadas 
pelo  procedimento  stepwise,  e  três  e  X^-,)  são 

suflcientemente  significantes  para  serem  incluídas  na 
função.  Para  fins  de  interpretação,  ordenamos  as  variá¬ 
veis  independentes  em  termos  de  suas  cargas  e  valores  F 
univariados  -  ambos  indicadores  do  poder  discriminante 
de  cada  variável.  Sinais  dos  pesos  ou  cargas  não  afetam  a 
ordem;  eles  simplesmente  indicam  uma  relação  positiva 
ou  negativa  com  a  variável  dependente. 


Análise  de  lambda  de  Wilks  eoF  univariado.  O  lambda 
de  Wilks  e  o  F  univariado  representam  os  efeitos  sepa¬ 
rados  ou  univariados  de  cada  variável,  não  consideran¬ 
do  multicolinearidade  entre  as  variáveis  independentes. 
Análogos  às  correlações  bivariadas  da  regressão  múltipla, 
eles  indicam  a  habilidade  de  cada  variável  para  discrimi¬ 
nar  entre  os  grupos,  mas  apenas  separadamente.  Para  in¬ 
terpretar  qualquer  combinação  de  duas  ou  mais  variáveis 


*  N.  de  R.  T.:  A  palavra  correta  seria  “cargas”. 


independentes,  exige-se  análise  dos  pesos  ou  cargas  dis¬ 
criminantes  como  descrito  nas  próximas  seções. 


A  Tabela  5-13  mostra  que  as  variáveis  (Au,  Ajj  e  A^)  com 
os  três  maiores  valores  F  (e  os  menores  lambdas  de  Wi¬ 
lks)  eram  também  as  variáveis  que  entraram  na  função 
discriminante.  Ag,  porém,  tinha  um  efeito  discriminante 
significante  quando  considerada  separadamente,  mas  tal 
efeito  era  compartilhado  com  as  outras  três  variáveis,  de 
maneira  que  sozinha  ela  não  contribuía  suficientemente 
para  entrar  na  função  discriminante.  Todas  as  demais  va¬ 
riáveis  tinham  valores  F  não-significantes  e  valores  lamb¬ 
da  de  Wilks  correspondentemente  elevados. 


Análise  dos  pesos  discriminantes.  Os  pesos  discrimi¬ 
nantes  estão  disponíveis  em  formas  não-padronizadas 
e  padronizadas.  Os  pesos  não-padronizados  (mais  a 
constante)  são  usados  para  calcular  o  escore  discrimi¬ 
nante,  mas  podem  ser  afetados  pela  escala  da  variável 
independente  (exatamente  como  pesos  de  regressão 
múltipla).  Assim,  os  pesos  padronizados  refletem  mais 
verdadeiramente  o  impacto  de  cada  variável  sobre  a  fun¬ 
ção  discriminante  e  são  mais  apropriados  para  fins  de 
interpretação.  Se  for  usada  estimação  simultânea,  mul¬ 
ticolinearidade  entre  quaisquer  variáveis  independentes 
causará  impacto  sobre  os  pesos  estimados.  No  entanto,  o 
impacto  da  multicolinearidade  pode  ser  até  maior  para  o 
procedimento  stepwise,  pois  ela  afeta  não  somente  os  pe¬ 
sos  mas  pode  também  impedir  que  uma  variável  sequer 
entre  na  equação. 


A  Tabela  5-13  fornece  os  pesos  padronizados  (coeficien¬ 
tes)  para  as  três  variáveis  incluídas  na  função  discrimi- 


TABELA  5-13  Resumo  de  medidas  interpretativas  para  análise  discriminante  de  dois  grupos 


Coeficientes  discriminantes 

Cargas  discriminantes 

Lambda 
de  Wiiks 

Razão  F  univariada 

Variáveis  independentes 

Não  padroni¬ 
zados 

Padronizados 

Carga 

Ordenação 

Valor 

Valor  F 

Sig. 

Ordenação 

Xg  Qualidade  do  produto 

NI 

NI 

-0,418 

5 

0,801 

14,387 

0,000 

4 

X-,  Atividades  de  comércio 
eletrônico 

NI 

NI 

0,429 

4 

0,966 

2,054 

0,157 

6 

Xg  Suporte  técnico 

NI 

NI 

-0,136 

11 

0,973 

1,598 

0,211 

7 

Xg  Solução  de  reclamação 

NI 

NI 

-0,181 

8 

0,986 

0,849 

0,361 

8 

X|o  Anúncio 

NI 

NI 

0,238 

7 

0,987 

0,775 

0,382 

9 

X,,  Linha  do  produto 

-0,363 

-0,417 

-0,586 

3 

0,695 

25,500 

0,000 

3 

X,2  Imagem  da  equipe  de  venda 

NI 

NI 

0,164 

9 

0,856 

9,733 

0,003 

5 

X|3  Preços  competitivos 

0,398 

0,490 

0,656 

1 

0,645 

31,992 

0,000 

1 

X|4  Garantia  e  reclamações 

NI 

NI 

-0,329 

6 

0,992 

0,453 

0,503 

11 

X,5  Novos  produtos 

NI 

NI 

0,041 

13 

0,990 

0,600 

0,442 

10 

X,g  Encomenda  e  cobrança 

NI 

NI 

-0,149 

10 

0,999 

0,087 

0,769 

13 

X|7  Flexibilidade  de  preço 

0,749 

0,664 

0,653 

2 

0,647 

31 ,699 

0,000 

2 

X,g  Velocidade  de  entrega 

NI 

NI 

-0,060 

12 

0,997 

0,152 

0,698 

12 

NI  =  Não  incluído  na  função  discriminante  estimada 


264  Análise  Multivariada  de  Dados 


nante.  O  impacto  da  multicolinearidade  sobre  os  pesos 
pode  ser  visto  ao  se  examinar  e  X^,.  Essas  duas  variá¬ 
veis  têm  poder  discriminante  essencialmente  equivalen¬ 
te  quando  vistas  nos  testes  lambda  de  Wilks  e  F  univa- 
riado.  Seus  pesos  discriminantes,  contudo,  refletem  um 
impacto  sensivelmente  maior  para  X^j  do  que  para  X^^, 
que  agora  é  mais  comparável  com  Xjj.  Essa  mudança  em 
importância  relativa  é  devida  à  multicolinearidade  entre 
Xj3  e  Xjj,  o  que  reduz  o  efeito  único  de  X^^  e  assim  dimi¬ 
nui  os  pesos  discriminantes  também. 


Interpretação  da  função  discriminante 
com  base  nas  cargas  discriminantes 

As  cargas  discriminantes,  em  contraste  com  os  pesos  dis¬ 
criminantes,  são  menos  afetadas  pela  multicolinearidade  e, 
portanto,  mais  úteis  para  a  interpretação.  Além  disso,  como 
cargas  são  calculadas  para  todas  as  variáveis,  elas  fornecem 
uma  medida  interpretativa  até  mesmo  para  variáveis  não 
incluídas  na  função  discriminante.  Uma  regra  prática  ante¬ 
rior  indicava  que  cargas  acima  de  ±  0,40  deveriam  ser  usa¬ 
das  para  identificar  variáveis  discriminantes  importantes. 


As  cargas  das  três  variáveis  da  função  discriminante  (ver 
Tabela  5-13)  são  as  três  maiores,  e  todas  excedem  ±  0,40, 
garantindo  assim  inclusão  no  processo  de  interpretação. 
Duas  variáveis  adicionais  (JQ  e  Xj),  porém,  também  têm 
cargas  acima  da  referência  ±  0,40.  A  inclusão  de  X^  não  é 
inesperada,  como  era  a  quarta  variável  com  efeito  discri¬ 
minante  univariado,  mas  não  foi  incluída  na  função  dis¬ 
criminante  devido  à  multicolinearidade  (como  mostrado 
no  Capítulo  3,  Análise  Fatorial,  onde  JQ  e  formavam 
um  fator).  X,,  porém,  apresenta  outra  situação;  ela  não 
tinha  um  efeito  univariado  significante.  A  combinação 
das  três  variáveis  na  função  discriminante  criou  um  efeito 
que  é  associado  com  X,,  mas  X-,  não  acrescenta  qualquer 
poder  discriminante  adicional.  Com  relação  a  isso,  X-,  é 
descritiva  da  função  discriminante  mesmo  não  sendo  in¬ 
cluída  nem  tendo  um  efeito  univariado  significante. 


Interpretar  a  função  discriminante  e  sua  discriminação 
entre  esses  dois  grupos  exige  que  o  pesquisador  considere 
todas  essas  cinco  variáveis.  Na  medida  em  que  elas  carac¬ 
terizam  ou  descrevem  a  função  discriminante,  todas  re¬ 
presentam  algum  componente  da  mesma. 

Com  as  variáveis  discriminantes  identificadas  e  a  função 
discriminante  descrita  em  termos  daquelas  variáveis  com 


Os  três  efeitos  mais  fortes  na  função  discriminante,  que 
são  geralmente  comparáveis  com  base  nos  valores  de  car¬ 
ga,  são  Xj3  (Preços  competitivos),  Xj,  (Flexibilidade  de 
preço)  e  Xjj  (Linha  do  produto).  X,  (Atividades  de  co¬ 
mércio  eletrônico)  e  o  efeito  de  Xg  (Qualidade  do  produ¬ 
to)  podem  ser  adicionados  aos  efeitos  de  X^.  Obviamente, 


diversos  fatores  diferentes  estão  sendo  combinados  para 
diferenciar  entre  os  grupos,  exigindo  assim  mais  definição 
de  perfil  dos  grupos  para  se  entenderem  as  diferenças. 


cargas  suficientemente  elevadas,  o  pesquisador  prossegue 
então  para  o  perfil  de  cada  grupo  sobre  essas  variáveis 
para  compreender  as  diferenças  entre  as  mesmas. 

Perfil  das  variáveis  discriminantes 

O  pesquisador  está  interessado  em  interpretações  das  va¬ 
riáveis  individuais  que  têm  significância  estatística  e  prá¬ 
tica.  Tais  interpretações  são  conseguidas  primeiramente 
identificando-se  as  variáveis  com  substantivo  poder  dis¬ 
criminatório  (ver  a  discussão  anterior)  e  em  seguida  en- 
tendendo-se  o  que  o  grupo  distinto  diz  cada  variável  in¬ 
dicada. 


Como  descrito  no  Capítulo  1,  escores  maiores  nas  variá¬ 
veis  independentes  indicam  percepções  mais  favoráveis 
da  FIBAT  sobre  aquele  atributo  (exceto  para  Xj3,  onde 
escores  menores  são  preferíveis).  Retornando  à  Tabela 
5-5,  vemos  diversos  perfis  entre  os  dois  grupos  sobre  es¬ 
sas  cinco  variáveis. 

•  O  grupo  0  (clientes  nos  Estados  Unidos/ América  do 
Norte)  têm  percepções  maiores  sobre  três  variáveis:  X^ 
(Qualidade  do  produto),  X^^*  (Preços  competitivos)  e 
Xjj  (Linha  do  produto). 

•  O  grupo  1  (clientes  fora  da  América  do  Norte)  têm 
percepções  maiores  nas  outras  duas  variáveis:  X^  (Ati¬ 
vidades  de  comércio  eletrônico)  e  Xj,  (Flexibilidade  de 
preço). 

Olhando  esses  dois  perfis,  podemos  perceber  que  os 
clientes  dos  EUA/América  do  Norte  têm  percepções 
muito  melhores  dos  produtos  FIBAT,  enquanto  os  de¬ 
mais  clientes  se  sentem  melhor  com  questões  sobre  pre¬ 
ço  e  comércio  eletrônico.  Note  que  X^  e  Xj3,  ambas  com 
percepções  mais  elevadas  entre  os  clientes  dos  EUA/ 
América  do  Norte,  formam  o  fator  Valor  do  produto 
desenvolvido  no  Capítulo  3.  A  administração  deveria 
usar  esses  resultados  para  desenvolver  estratégias  que 
acentuem  esses  pontos  fortes  e  desenvolver  outras  van¬ 
tagens  para  fins  de  complementação. 

O  perfil  médio  também  ilustra  a  interpretação  dos 
sinais  (positivos  e  negativos)  nos  pesos  e  as  cargas  dis¬ 
criminantes.  Os  sinais  refletem  o  perfil  médio  relativo 
dos  dois  grupos.  Os  sinais  positivos,  neste  exemplo,  são 
associados  com  variáveis  que  têm  escores  maiores  para 
o  grupo  1.  Os  pesos  e  cargas  negativas  são  para  aque¬ 
las  variáveis  com  o  padrão  oposto  (i.e.,  valores  maiores 
no  grupo  0).  Logo,  os  sinais  indicam  o  padrão  entre  os 
grupos. 


*  N.  de  R.  T.:  A  tabela  indica  o  contrário,  ou  seja,  a  média  de  X■^^  é 
maior  no  grupo  1  (7,418  versus  5,600). 
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Estágio  6:  Validação  dos  resultados 

O  estágio  final  aborda  a  validade  interna  e  externa  da  fun¬ 
ção  discriminante.  O  principal  meio  de  validação  é  pelo 
uso  da  amostra  de  validação  e  a  avaliação  de  sua  precisão 
preditiva.  Desse  modo,  a  validade  é  estabelecida  se  a  fun¬ 
ção  discriminante  classifica,  em  um  nível  aceitável,  obser¬ 
vações  que  não  foram  usadas  no  processo  de  estimação. 
Se  a  amostra  de  validação  é  obtida  a  partir  da  amostra 
original,  então  essa  abordagem  estabelece  validade  inter¬ 
na.  Se  uma  outra  amostra  separada,  talvez  de  uma  outra 
população  ou  de  outro  segmento  da  população,  forma  a 
amostra  de  validação,  então  isso  corresponde  a  uma  vali¬ 
dação  externa  dos  resultados  discriminantes. 


Em  nosso  exemplo,  a  amostra  de  teste  surge  a  partir  da 
amostra  original.  Como  anteriormente  discutido,  a  preci¬ 
são  de  classificação  (razões  de  sucesso)  para  as  amostras 
de  teste  e  de  validação  cruzada  estava  muito  acima  das 
referências  em  todas  as  medidas  de  precisão  preditiva. 
Como  tal,  a  análise  estabelece  validade  interna.  Para  o 
propósito  de  validade  externa,  amostras  adicionais  de¬ 
vem  ser  extraídas  de  populações  relevantes  e  a  precisão 
de  classificação  deve  ser  avaliada  em  tantas  situações 
quanto  possível. 


O  pesquisador  é  encorajado  a  estender  o  processo  de 
validação  por  meio  de  perfis  expandidos  dos  grupos  e  o 
possível  uso  de  amostras  adicionais  para  estabelecer  a  va¬ 
lidade  externa.  Idéias  adicionais  da  análise  de  casos  mal 
classificados  podem  sugerir  variáveis  extras  que  podem 
melhorar  ainda  mais  o  modelo  discriminante. 

Uma  visão  gerencial 

A  análise  discriminante  de  clientes  HBAT,  baseada  em 
localização  geográfica  (dentro  ou  fora  da  América  do 
Norte),  identificou  um  conjunto  de  diferenças  em  percep¬ 
ção  que  pode  fornecer  uma  distinção  mais  sucinta  e  pode¬ 
rosa  entre  os  dois  grupos.  Várias  descobertas  importantes 
incluem  as  seguintes: 


•  Diferenças  são  encontradas  em  um  subconjunto  de  ape¬ 
nas  cinco  percepções,  o  que  permite  uma  concentração 
sobre  as  variáveis-chave,  não  tendo  que  se  lidar  com  o 
conjunto  inteiro.  As  variáveis  identificadas  como  discri¬ 
minantes  entre  os  grupos  (listadas  em  ordem  de  impor¬ 
tância)  são  Ai3  (Preços  competitivos),  Xj,  (Flexibilidade 
de  preço),  Xjj  (Linha  do  produto),  X-j  (Atividades  de 
comércio  eletrônico)  e  (Qualidade  do  produto). 

•  Os  resultados  também  indicam  que  as  empresas  loca¬ 
lizadas  nos  Estados  Unidos  têm  melhores  percepções 
da  HBAT  do  que  suas  contrapartes  internacionais  em 
termos  de  valor  e  linha  de  produto,  enquanto  os  clientes 
que  não  são  norte-americanos  têm  uma  percepção  mais 
favorável  sobre  flexibilidade  de  preço  e  atividades  de 


comércio  eletrônico.  Essas  percepções  podem  resultar 
de  uma  maior  similaridade  entre  compradores  norte- 
americanos,  enquanto  clientes  internacionais  acham  a 
política  de  preços  em  sintonia  com  suas  necessidades. 

•  Os  resultados,  que  são  altamente  signiflcantes,  forne¬ 
cem  ao  pesquisador  a  habilidade  de  identificar  correta¬ 
mente  a  estratégia  de  compra  usada,  com  base  nessas 
percepções,  85%  do  tempo.  Esse  elevado  grau  de  con¬ 
sistência  gera  confiança  no  desenvolvimento  de  estraté¬ 
gias  baseadas  em  tais  resultados. 

•  A  análise  das  empresas  mal  classificadas  revelou  um  pe¬ 
queno  número  de  empresas  que  pareciam  “deslocadas”. 
Identificar  tais  empresas  pode  identificar  associações 
não  tratadas  por  localização  geográfica  (p.ex.,  mercados 
no  lugar  de  apenas  localização  física)  ou  outras  caracte¬ 
rísticas  de  firmas  ou  de  mercado  que  são  associadas  com 
localização  geográfica. 

Portanto,  conhecer  a  localização  de  uma  firma  dá 
idéias-chave  sobre  suas  percepções  da  HBAT  e,  mais  im¬ 
portante,  como  os  dois  grupos  de  clientes  diferem,  de  for¬ 
ma  que  a  administração  pode  empregar  uma  estratégia 
para  acentuar  as  percepções  positivas  em  suas  negocia¬ 
ções  com  esses  clientes  e  assim  solidificar  sua  posição. 


UM  EXEMPLO  ILUSTRATIVO 
DE  TRÊS  GRUPOS 

Para  ilustrar  a  aplicação  de  uma  análise  discriminante  de 
três  grupos,  novamente  usamos  a  base  de  dados  HBAT. 
No  exemplo  anterior,  estávamos  interessados  na  discrimi¬ 
nação  entre  apenas  dois  grupos,  de  modo  que  conseguimos 
desenvolver  uma  única  função  discriminante  e  um  escore 
de  corte  para  dividir  os  dois  grupos.  No  exemplo  de  três 
grupos,  é  necessário  desenvolver  duas  funções  discriminan¬ 
tes  separadas  para  distinguir  entre  os  três  grupos.  A  pri¬ 
meira  função  separa  um  grupo  dos  outros  dois,  e  a  segunda 
separa  os  dois  grupos  restantes.  Como  no  exemplo  ante¬ 
rior,  os  seis  estágios  do  processo  de  construção  do  modelo 
são  discutidos. 

Estágio  1:  Objetivos  da  análise  discriminante 

O  objetivo  da  HBAT  nessa  pesquisa  é  determinar  a  relação 
entre  as  percepções  que  as  empresas  têm  da  HBAT  e  o  pe¬ 
ríodo  de  tempo  em  que  uma  empresa  é  cliente  de  HBAT. 


Um  dos  paradigmas  emergentes  em  marketing  é  o  con¬ 
ceito  de  uma  relação  com  cliente,  baseada  no  estabeleci¬ 
mento  de  uma  mútua  parceria  entre  empresas  ao  longo 
de  repetidas  transações.  O  processo  de  desenvolvimento 
de  uma  relação  implica  a  formação  de  metas  e  valores 
compartilhados,  que  devem  coincidir  com  percepções 
melhoradas  de  HBAT.  Portanto,  a  formação  bem-suce¬ 
dida  de  uma  relação  deve  ser  entendida  por  meio  de  per- 
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cepções  melhores  de  HBAT  ao  longo  do  tempo.  Nessa 
análise,  as  firmas  são  agrupadas  conforme  sua  situação 
como  clientes  HBAT.  Se  HBAT  foi  bem-sucedida  no 
estabelecimento  de  relações  com  seus  clientes,  então  as 
percepções  sobre  a  HBAT  irão  melhorar  em  cada  situa¬ 
ção  como  cliente  HBAT. 


Estágio  2:  Projeto  de  pesquisa 
para  análise  discriminante 

Para  testar  essa  relação,  uma  análise  discriminante  é  exe¬ 
cutada  para  estabelecer  se  existem  diferenças  em  percep¬ 
ções  entre  grupos  de  clientes  com  base  na  extensão  da 
relação  de  clientela.  Se  for  o  caso,  a  HBAT  estará  então 
interessada  em  ver  se  diferentes  perfis  justificam  a  propo¬ 
sição  de  que  a  HBAT  teve  sucesso  no  melhoramento  de 
percepções  entre  clientes  estabelecidos,  um  passo  neces¬ 
sário  na  formação  de  relações  com  a  clientela. 

Seleção  de  variáveis  dependente  e  independentes 

Além  das  variáveis  dependentes  não-métricas  (categóri¬ 
cas)  definindo  grupos  de  interesse,  a  análise  discriminante 
também  requer  um  conjunto  de  variáveis  independentes 
métricas  que  são  consideradas  fornecedoras  de  base  para 
discriminação  ou  diferenciação  entre  os  grupos. 


Uma  análise  discriminante  de  três  grupos  é  realizada 
usando  (Tipo  de  cliente)  como  a  variável  dependente 
e  as  percepções  de  HBAT  por  parte  dessas  firmas  (X^  a 
Xjg)  como  as  variáveis  independentes.  Note  que  dife¬ 
re  da  variável  dependente  no  exemplo  de  dois  grupos  no 
sentido  de  que  ela  tem  três  categorias  nas  quais  classifi¬ 
car  o  tempo  de  permanência  como  cliente  de  HBAT  (1  = 
menos  que  1  ano,  2  =  f  a  5  anos,  e  3  =  mais  de  5  anos). 


Tamanho  amostrai  e  divisão  da  amostra 

Questões  relativas  ao  tamanho  da  amostra  são  particular¬ 
mente  importantes  com  análise  discriminante  devido  ao 
foco  não  apenas  no  tamanho  geral  da  amostra,  mas  tam¬ 
bém  no  tamanho  amostrai  por  grupo.  Juntamente  com  a 
necessidade  de  uma  divisão  da  amostra  para  obter  uma 
amostra  de  validação,  o  pesquisador  deve  considerar  cui¬ 
dadosamente  o  impacto  da  divisão  amostrai  em  termos  do 
tamanho  geral  e  do  tamanho  de  cada  um  dos  grupos. 


A  base  de  dados  da  HBAT  tem  uma  amostra  de  100,  a 
qual  será  novamente  particionada  em  amostras  de  aná¬ 
lise  e  de  validação  de  60  e  40  casos,  respectivamente.  Na 
amostra  de  análise,  a  proporção  de  casos  por  variáveis 
independentes  é  quase  5:1,  o  limite  inferior  recomenda¬ 
do.  Mais  importante,  na  amostra  de  análise,  apenas  um 
grupo,  com  13  observações,  fica  abaixo  do  nível  reco¬ 
mendado  de  20  casos  por  grupo.  Apesar  de  o  tamanho 


do  grupo  exceder  20  se  a  amostra  inteira  for  usada  na 
fase  de  análise,  a  necessidade  de  validação  dita  a  criação 
da  amostra  de  teste.  Os  três  grupos  são  de  tamanhos  re¬ 
lativamente  iguais  (22, 13  e  25),  evitando  assim  qualquer 
necessidade  de  igualar  os  tamanhos  dos  grupos.  A  análi¬ 
se  procede  com  atenção  para  a  classificação  e  interpreta¬ 
ção  desse  pequeno  grupo  de  13  observações. 


Estágio  3:  Suposições  da  análise  discriminante 

Como  no  caso  do  exemplo  de  dois  grupos,  as  suposições 
de  normalidade,  linearidade  e  colinearidade  das  variáveis 
independentes  já  foram  discutidas  detalhadamente  no  Ca¬ 
pítulo  2.  A  análise  feita  no  Capítulo  2  indicou  que  as  va¬ 
riáveis  independentes  atendem  essas  suposições  em  níveis 
adequados  para  viabilizar  a  continuidade  da  análise  sem 
ações  corretivas  adicionais.  A  suposição  remanescente,  a 
igualdade  de  matrizes  de  variância/covariância  ou  de  dis¬ 
persão,  também  é  abordada  no  Capítulo  2. 


O  teste  M  de  Box  avalia  a  similaridade  das  matrizes  de 
dispersão  das  variáveis  independentes  entre  os  três  gru¬ 
pos  (categorias).  O  teste  estatístico  indicou  diferenças 
no  nível  de  significância  de  0,09.  Neste  caso,  as  diferen¬ 
ças  entre  grupos  são  não-significantes  e  nenhuma  ação 
corretiva  se  faz  necessária.  Além  disso,  não  se  espera 
qualquer  impacto  sobre  os  processos  de  estimação  e 
classificação. 


Estágio  4:  Estimação  do  modelo 
discriminante  e  avaliação  do  ajuste  geral 

Como  no  exemplo  anterior,  começamos  nossa  análise  revi¬ 
sando  as  médias  de  grupo  e  os  desvios-padrão  para  ver  se  os 
grupos  são  significantemente  diferentes  em  alguma  variável. 
Com  essas  diferenças  em  mente,  empregamos  em  seguida 
um  processo  de  estimação  stepwise  para  obter  as  funções 
discriminantes  e  completamos  o  processo  avaliando  preci¬ 
são  de  classificação  com  diagnósticos  gerais  e  por  casos. 

Avaliação  de  diferenças  de  grupos 

Identificar  as  variáveis  mais  discriminantes  com  três  ou 
mais  grupos  é  mais  problemático  do  que  na  situação  com 
dois  grupos.  Para  três  ou  mais  grupos,  as  medidas  típicas 
de  significância  para  diferenças  em  grupos  (ou  seja,  lamb¬ 
da  de  Wilks  e  o  teste  F)  avaliam  apenas  as  diferenças  ge¬ 
rais  e  não  garantem  que  cada  grupo  é  significante  em  rela¬ 
ção  aos  demais.  Assim,  quando  examinar  variáveis  quanto 
a  suas  diferenças  gerais  entre  os  grupos,  certifique-se  tam¬ 
bém  de  tratar  das  diferenças  individuais  de  grupos. 


A  Tabela  5-14  dá  as  médias  de  grupos,  lambda  de  Wilks, 
razões  F  univariadas  (ANOVAs  simples)  e  mínimo 
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de  Mahalanobis  para  cada  variável  independente.  A  re¬ 
visão  dessas  medidas  revela  o  seguinte: 

•  Sobre  uma  base  univariada,  aproximadamente  metade 
(7  entre  13)  das  variáveis  exibe  diferenças  significantes 
entre  as  médias  dos  grupos.  As  variáveis  com  diferenças 
significantes  incluem  X^,  Xg,  Ajj,  Xjj,  X^^,  Xj,  e  Xjg. 

•  Apesar  de  maior  significância  estatística  corresponder 
a  uma  maior  discriminação  geral  (ou  seja,  as  variáveis 
mais  significantes  têm  os  menores  lambdas  de  Wilks), 
ela  nem  sempre  corresponde  à  maior  discriminação  en¬ 
tre  todos  os  grupos. 

•  A  inspeção  visual  das  médias  dos  grupos  revela  que 
quatro  das  variáveis  com  diferenças  significantes 
(Xj3,  Xjg,  e  Xjg)  diferenciam  apenas  um  grupo 
versus  os  outros  dois  grupos  [p.ex.,  Xjg  tem 
diferenças  significantes  somente  nas  médias  entre  o 
grupo  1  (3,059)  versus  grupos  2  (4,246)  e  3  (4,288)]. 
Essas  variáveis  têm  um  papel  limitado  em  análise 
discriminante  por  fornecerem  discriminação  apenas 
em  um  subconjunto  de  grupos. 

•  Três  variáveis  (X^,  Xg  e  Xjj)  fornecem  alguma 
discriminação,  em  vários  graus,  entre  todos  os  grupos 
simultaneamente.  Uma  ou  mais  dessas  variáveis 
podem  ser  usadas  em  combinação  com  as  quatro 
variáveis  precedentes  para  criar  uma  variável 
estatística  com  discriminação  máxima. 

•  O  valor  de  Mahalanobis  fornece  uma  medida  do 
grau  de  discriminação  entre  grupos.  Para  cada  variável, 
o  mínimo  de  Mahalanobis  é  a  distância  entre  os  dois 
grupos  mais  próximos.  Por  exemplo,  Xjj  tem  o  maior 
valor  e  é  a  variável  com  as  maiores  diferenças  entre 
todos  os  três  grupos.  Analogamente,  Xjg,  uma  variável 
com  pequenas  diferenças  entre  dois  dos  grupos,  tem  um 
pequeno  valor  D~.  Com  três  ou  mais  grupos,  o  mí¬ 


nimo  de  Mahalanobis  é  importante  na  identificação  da 
variável  que  dá  a  maior  diferença  entre  os  dois  grupos 
mais  parecidos. 


Todas  essas  medidas  se  combinam  para  ajudar  a  iden¬ 
tificar  os  conjuntos  de  variáveis  que  formam  as  funções 
discriminantes,  como  descritos  na  próxima  seção.  Quando 
mais  de  uma  função  é  criada,  cada  uma  fornece  discrimi¬ 
nação  entre  conjuntos  de  grupos.  No  exemplo  simples  do 
início  deste  capítulo,  uma  variável  discriminou  entre  os 
grupos  1  versus  2  e  3,  sendo  que  a  outra  discriminou  entre 
os  grupos  2  versus  3  e  1.  Esse  é  um  dos  principais  benefí¬ 
cios  que  surgem  do  uso  da  análise  discriminante. 

Estimação  da  função  discriminante 

O  procedimento  stepwise  é  realizado  da  mesma  manei¬ 
ra  do  exemplo  de  dois  grupos,  com  todas  as  variáveis  ini¬ 
cialmente  excluídas  do  modelo.  O  procedimento  então  se¬ 
leciona  a  variável  que  tem  uma  diferença  estatisticamente 
significante  nos  grupos  enquanto  maximiza  a  distância  de 
Mahalanobis  {D^)  entre  os  dois  grupos  mais  próximos. 
Desta  maneira,  variáveis  estatisticamente  significantes 
são  selecionadas  de  modo  a  maximizarem  a  discriminação 
entre  os  grupos  mais  semelhantes  em  cada  estágio. 

Este  processo  continua  enquanto  variáveis  adicionais 
fornecerem  discriminação  estatisticamente  significante 
além  daquelas  diferenças  já  explicadas  pelas  variáveis  na 
função  discriminante.  Uma  variável  pode  ser  removida  se 
alta  multicolinearidade  com  variáveis  independentes  na 
função  discriminante  faz  com  que  sua  significância  caia 
abaixo  do  nível  para  remoção  (0,10). 


TABELA  5-14  Estatísticas  descritivas  de  grupos  e  testes  de  igualdade  para  a  amostra  de  estimação  na  análise  discriminante  de  três  grupos 


Médias  de  grupo  da  variável 
dependente:  X,  Tipo  de  cliente 

Teste  de  igualdade  de 
médias  de  grupos’’ 

[f  mínimo  de 
Mahalanobis 

Variáveis  independentes 

Grupo  1: 
Menos  que  1 
ano  (n  =  22) 

Grupo  2: 1 
a  5  anos 
(n=13) 

Grupo  3: 
Mais  de  5 
anos  (n  =  25) 

Lambda 

deWiiks 

Valor  F 

Significância 

tf  mínimo 

Entre 

grupos 

Xg  Qualidade  do  produto 

7,118 

6,785 

9,000 

0,469 

32,311 

0,000 

0,121 

1  e2 

X-,  Atividades  de  comércio  ele¬ 
trônico 

3,514 

3,754 

3,412 

0,959 

1,221 

0,303 

0,025 

1  e3 

Xg  Suporte  técnico 

4,959 

5,615 

5,376 

0,973 

0,782 

0,462 

0,023 

2e3 

Xg  Solução  de  reclamação 

4,064 

5,900 

6,300 

0,414 

40,292 

0,000 

0,205 

2e3 

X,g  Anúncio 

3,745 

4,277 

3,768 

0,961 

1,147 

0,325 

0,000 

1  e3 

X,,  Linha  do  produto 

4,855 

5,577 

7,056 

0,467 

32,583 

0,000 

0,579 

1  e2 

X,2  Imagem  da  equipe  de  venda 

4,673 

5,346 

4,836 

0,943 

1,708 

0,190 

0,024 

1  e3 

X,3  Preços  competitivos 

7,345 

7,123 

5,744 

0,751 

9,432 

0,000 

0,027 

1  e2 

X,4  Garantia  e  reclamações 

5,705 

6,246 

6,072 

0,916 

2,619 

0,082 

0,057 

2e3 

X,5  Novos  produtos 

4,986 

5,092 

5,292 

0,992 

0,216 

0,807 

0,004 

1  e2 

X,g  Encomenda  e  cobrança 

3,291 

4,715 

4,700 

0,532 

25,048 

0,000 

0,000 

2e3 

X„  Flexibilidade  de  preço 

4,018 

5,508 

4,084 

0,694 

12,551 

0,000 

0,005 

1  e3 

X,g  Velocidade  de  entrega 

3,059 

4,246 

4,288 

0,415 

40,176 

0,000 

0,007 

2e3 

“Lambda  de  Wilks  (estatística  U)  e  razão  F  univariada  com  2  e  57  graus  de  liberdade. 
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Estimação  stepwise:  adição  da  primeira  variável, 
Xj^.  Os  dados  na  Tabela  5-14  mostram  que  a  primeira 
variável  a  entrar  no  modelo  é  Xjj  (Linha  do  produto), 
pois  ela  atende  aos  critérios  para  diferenças  estatistica¬ 
mente  significantes  nos  grupos  e  tem  o  maior  valor  (o 
que  significa  que  ela  tem  a  maior  separação  entre  os  dois 
grupos  mais  parecidos). 

Os  resultados  de  adicionar  como  a  primeira  va¬ 
riável  no  processo  stepwise  são  mostrados  na  Tabela 
5-15.  O  ajuste  geral  do  modelo  é  significante  e  todos  os 
grupos  são  significantemente  distintos,  apesar  de  os  gru¬ 
pos  1  (menos  de  um  ano)  e  2  (de  um  a  cinco  anos)  terem 


a  menor  diferença  entre  eles  (ver  seção  abaixo  detalhan¬ 
do  as  diferenças  de  grupos). 

Com  a  menor  diferença  entre  os  grupos  1  e  2,  o  pro¬ 
cedimento  discriminante  selecionará  agora  uma  variável 
que  maximiza  aquela  diferença  enquanto  pelo  menos 
mantém  as  demais.  Se  voltarmos  à  Tabela  5-14,  perce¬ 
beremos  que  quatro  variáveis  (Ag,  X^^,  Aj,  e  Ajg)  tinham 
diferenças  significantes,  com  substanciais  distinções  en¬ 
tre  os  grupos  1  e  2.  Olhando  a  Tabela  5-15,  vemos  que 
essas  quatro  variáveis  têm  o  maior  valor  mínimo,  e 
em  cada  caso  é  para  a  diferença  entre  os  grupos  2  e  3 
(o  que  significa  que  os  grupos  1  e  2  não  são  os  mais  pa- 

_ {Continua) 


TABELA  5-15  Resultados  do  passo  1  da  análise  discriminante  stepwise  de  três  grupos 

Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,467 

32,583 

2,57 

0,000 

Variável  adicionada/removida  no  passo  1 

F 

Variável  adicionada 

[f  mínimo 

Valor 

Significância 

Entre  grupos 

X„  Linha  de  produto 

0,579 

4,729 

0,000 

Menos  de  1  ano  e  de  1  a  5  anos 

Nota-,  Em  cada  passo,  a  variável  que  maximiza  a  distância  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  1 

Variável 

Tolerância 

Fpara  remover 

[f 

Entre  grupos 

X„  Linha  de  produto 

1,000 

32,583 

NA 

NA 

NA  =  Não  aplicável 

Variáveis  fora  da  análise  após  o  passo  1 

Variável 

Tolerância 

Tolerância  mínima 

F  para  entrar  D' 

'  mínimo 

Entre  grupos 

Xg  Qualidade  de  produto 

1,000 

1,000 

17,426 

0,698 

Menos  de  1  ano  e  de  1  a  5  anos 

Xy  Atividades  de  comércio  eletrônico 

0,950 

0,950 

1,171 

0,892 

Menos  de  1  ano  e  de  1  a  5  anos 

Xg  Suporte  técnico 

0,959 

0,959 

0,733 

0,649 

Menos  de  1  ano  e  de  1  a  5  anos 

Xg  Solução  de  reclamação 

0,847 

0,847 

15,446 

2,455 

De  1  a  5  anos  e  mais  de  5  anos 

X,o  Anúncio 

0,998 

0,998 

1,113 

0,850 

Menos  de  1  ano  e  de  1  a  5  anos 

X,2  Imagem  da  equipe  de  venda 

0,932 

0,932 

3,076 

1,328 

Menos  de  1  ano  e  de  1  a  5  anos 

X,3  Preços  competitivos 

0,882 

0,882 

2,299 

0,839 

Menos  de  1  ano  e  de  1  a  5  anos 

X,4  Garantia  e  reclamações 

0,849 

0,849 

0,647 

0,599 

Menos  de  1  ano  e  de  1  a  5  anos 

X,5  Novos  produtos 

0,993 

0,993 

0,415 

0,596 

Menos  de  1  ano  e  de  1  a  5  anos 

X,g  Encomenda  e  cobrança 

0,943 

0,943 

12,176 

2,590 

De  1  a  5  anos  e  mais  de  5  anos 

X„  Flexibilidade  de  preço 

0,807 

0,807 

17,300 

3,322 

De  1  a  5  anos  e  mais  de  5  anos 

X,8  Velocidade  de  entrega 

0,773 

0,773 

19,020 

2,988 

De  1  a  5  anos  e  mais  de  5  anos 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  T 

X,  Tipo  de  cliente 

Menos  de  1  ano 

De  1  a  5  anos 

De  1  a  5  anos 

F 

4,729 

Sig. 

0,034 

Mais  de  5  anos 

F 

62,893 

20,749 

Sig. 

0,000 

0,000 

'1  e  57  graus  de  liberdade. 
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recidos  depois  de  acrescentar  aquela  variável).  Assim, 
adicionar  qualquer  uma  dessas  variáveis  afeta  muito  as 
diferenças  entre  os  grupos  1  e  2,  o  par  que  era  mais  pa¬ 
recido  depois  que  foi  adicionada  no  primeiro  passo. 
O  procedimento  escolherá  porque  ela  criará  a  maior 
distância  entre  os  grupos  2  e  3. 

Estimação  stepwise:  Adição  da  segunda  variável, 
Xyj.  A  Tabela  5-16  detalha  o  segundo  passo  do  proce¬ 
dimento  stepwise:  o  acréscimo  de  X-^-j  (Flexibilidade  de 


preço)  à  função  discriminante.  A  discriminação  entre 
grupos  aumentou,  como  refletido  em  um  menor  valor 
lambda  de  Wilks  e  no  aumento  do  mínimo  (de  0,467 
para  0,288).  As  diferenças  de  grupos,  geral  e  individuais, 
ainda  são  estatisticamente  significantes.  O  acréscimo  de 
X-^i  aumentou  as  distinções  entre  os  grupos  1  e  2  consi¬ 
deravelmente,  de  forma  que  agora  os  dois  grupos  mais 
parecidos  são  2  e  3. 

Das  variáveis  fora  da  equação,  apenas  X^  (Qualidade 
de  produto)  satisfaz  o  nível  de  significância  necessário 

(Continua) 


TABELA  5-16  Resultados  do  passo  2  da  análise  discriminante  stepwise  de  três  grupos 

Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,288 

24,139 

4,  112 

0,000 

Variável  adicionada/removida  no  passo  2 

F 

Variável  adicionada 

[f  mínimo 

Valor 

Significância 

Entre  grupos 

X„  Flexibilidade  de  preço 

3,322 

13,958 

0,000 

De  1  a  5  anos  e  mais  de  5  anos 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  Mahaianobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  2 

Variável 

Tolerância 

Fpara  remover 

[f 

Entre  grupos 

X„  Linha  de  produto 

0,807 

39,405 

0,005 

Menos  de  1  ano  e  mais  de  5  anos 

X„  Flexibilidade  de  preço 

0,807 

17,300 

0,579 

Menos  de  1  ano  e  de  1  a  5  anos 

Variáveis  fora  da  análise  após  o  passo  2 

Variável 

Tolerância 

Tolerância  mínima  Fpara  entrar  [f 

■  mínimo 

Entre  grupos 

Xg  Qualidade  de  produto 

0,730 

0,589 

24,444 

6,071 

Menos  de  1  ano  e  de  1  a  5  anos 

Xj  Atividades  de  comércio  eletrônico 

0,880 

0,747 

0,014 

3,327 

Menos  de  1  ano  e  de  1  a  5  anos 

Xg  Suporte  técnico 

0,949 

0,791 

1,023 

3,655 

Menos  de  1  ano  e  de  1  a  5  anos 

Xg  Solução  de  reclamação 

0,520 

0,475 

3,932 

3,608 

Menos  de  1  ano  e  de  1  a  5  anos 

X,g  Anúncio 

0,935 

0,756 

0,102 

3,348 

Menos  de  1  ano  e  de  1  a  5  anos 

X,2  Imagem  da  equipe  de  venda 

0,884 

0,765 

0,662 

3,342 

Menos  de  1  ano  e  de  1  a  5  anos 

X,3  Preços  competitivos 

0,794 

0,750 

0,989 

3,372 

Menos  de  1  ano  e  de  1  a  5  anos 

X,4  Garantia  e  reclamações 

0,868 

0,750 

2,733 

4,225 

Menos  de  1  ano  e  de  1  a  5  anos 

X,5  Novos  produtos 

0,963 

0,782 

0,504 

3,505 

Menos  de  1  ano  e  de  1  a  5  anos 

X,g  Encomenda  e  cobrança 

0,754 

0,645 

2,456 

3,323 

Menos  de  1  ano  e  de  1  a  5  anos 

X,g  Velocidade  de  entrega 

0,067 

0,067 

3,255 

3,598 

Menos  de  1  ano  e  de  1  a  5  anos 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  2’ 

X,  Tipo  de  cliente 

Menos  de  1  ano 

De  1  a  5  anos 

De  1  a  5  anos 

F 

21,054 

Sig. 

0,000 

Mais  de  5  anos 

F 

39,360 

13,958 

Sig. 

0,000 

0,000 

*2  e  56  graus  de  liberdade. 
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para  consideração.  Se  acrescentada,  o  mínimo  será 
agora  entre  os  grupos  1  e  2. 

Estimação  stepwise:  Adição  das  terceira  e  quarta  variá¬ 
veis,  Zg  e  Zjj.  Como  anteriormente  observado,  se 
torna  a  terceira  variável  adicionada  à  função  discrimi¬ 
nante.  Depois  que  Zg  foi  acrescentada,  apenas  Z^g  exibe 
uma  significância  estatística  nos  grupos  {Nota:  Os  deta¬ 
lhes  sobre  o  acréscimo  de  Zj  no  terceiro  passo  não  são 
mostrados  por  questão  de  espaço). 


A  variável  final  adicionada  no  passo  4  é  Zjg  (ver  Ta¬ 
bela  5-17),  com  a  função  discriminante  incluindo  agora 
quatro  variáveis  (Zjj,  Zj,,  Zg  e  Zjg).  O  modelo  geral  é 
significante,  com  o  lambda  de  Wilks  diminuindo  para 
0,127.  Além  disso,  existem  diferenças  significantes  entre 
todos  os  grupos  individuais. 

Com  essas  quatro  variáveis  na  função  discriminante, 
nenhuma  outra  variável  exibe  a  significância  estatísti¬ 
ca  necessária  para  inclusão,  e  o  processo  stepwise  está 

(Continua) 


TABELA  5-17  Resultados  do  passo  4  da  análise  discriminante  stepwise  de  três  grupos 

Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wilks 

0,127 

24,340 

8,  108 

0,000 

Variável  adicionada/removida  no  passo  4 

F 

Variável  adicionada 

[f  mínimo 

Valor 

Significância 

Entre  grupos 

X,8  Velocidade  de  entrega 

6,920 

13,393 

0,000 

Menos  de  1  ano  e  de  1  a  5  anos 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  4 

Variável 

Toierância 

Fpara  remover 

[f 

Entre  grupos 

X„  Linha  de  produto 

0,075 

0,918 

6,830 

Menos  de  1  ano  e  de  1  a  5  anos 

X„  Flexibilidade  de  preço 

0,070 

1,735 

6,916 

Menos  de  1  ano  e  de  1  a  5  anos 

Xg  Qualidade  do  produto 

0,680 

27,701 

3,598 

De  1  a  5  anos  e  mais  de  5  anos 

X,g  Velocidade  de  entrega 

0,063 

5,387 

6,071 

Menos  de  1  ano  e  de  1  a  5  anos 

Variáveis  fora  da  análise  após  o  passo  4 

Variável 

Toierância 

Tolerância  mínima 

Fpara  entrar  tf 

■  mínimo 

Entre  grupos 

Xj  Atividades  de  comércio  eletrônico 

0,870 

0,063 

0,226 

6,931 

Menos  de  1  ano  e  de  1 

a  5  anos 

Xg  Suporte  técnico 

0,940 

0,063 

0,793 

7,164 

Menos  de  1  ano  e  de  1 

a  5  anos 

Xg  Solução  de  reclamação 

0,453 

0,058 

0,292 

7,019 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,„  Anúncio 

0,932 

0,063 

0,006 

6,921 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,2  Imagem  da  equipe  de  venda 

0,843 

0,061 

0,315 

7,031 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,3  Preços  competitivos 

0,790 

0,063 

0,924 

7,193 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,4  Garantia  e  reclamações 

0,843 

0,063 

2,023 

7,696 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,5  Novos  produtos 

0,927 

0,062 

0,227 

7,028 

Menos  de  1  ano  e  de  1 

a  5  anos 

X,g  Encomenda  e  cobrança 

0,671 

0,062 

1,478 

7,210 

Menos  de  1  ano  e  de  1 

a  5  anos 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  4’ 

X,  Tipo  de  cliente 

Menos  de  1  ano 

De  1  a  5  anos 

De  1  a  5  anos 

F 

13,393 

Sig. 

0,000 

Mais  de  5  anos 

F 

56,164 

18,477 

Sig. 

0,000 

0,000 

*4  e  54  graus  de  liberdade. 
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concluído  em  termos  de  acréscimo  de  variáveis.  Porém, 
o  procedimento  inclui  também  um  exame  da  significân- 
cia  de  cada  variável  para  que  a  mesma  seja  mantida  na 
função  discriminante.  Neste  caso,  o  “F  para  remover” 
para  Ajj  e  Xy,  é  não-significante  (0,918  e  1,735,  respecti¬ 
vamente),  indicando  que  uma  ou  ambas  são  candidatas 
para  remoção  da  função  discriminante. 

Estimação  stepwise:  Remoção  de  Xyj  e  Quando 
Zjg  é  adicionada  ao  modelo  no  quarto  passo  (ver  a  dis¬ 
cussão  anterior),  Xy  tinha  o  menor  valor  “Epara  remo¬ 
ver”  (0,918),  fazendo  com  que  o  procedimento  stepwise 
eliminasse  aquela  variável  da  função  discriminante  no 
quinto  passo  (detalhes  sobre  este  passo  5  são  omitidos 
por  questões  de  espaço).  Agora  com  três  variáveis  na 
função  discriminante  (Zj^,  Zg  e  Z^g),  o  ajuste  geral  do 
modelo  ainda  é  significante  e  o  lambda  de  Wilks  aumen¬ 
tou  só  um  pouco  para  0,135.  Todos  os  grupos  são  signifi- 
cantemente  diferentes.  Nenhuma  variável  atinge  o  nível 
necessário  de  significância  estatística  para  ser  adicionada 
à  função  discriminante,  e  mais  uma  variável  (Zjj*)  tem 
um  valor  “F  para  remover”  de  2,552,  o  que  indica  que 
ela  também  pode  ser  eliminada  da  função. 

A  Tabela  5-18  contém  os  detalhes  do  passo  6  do 
procedimento  stepwise,  onde  Zjj  também  é  removi¬ 
da  da  função  discriminante,  restando  apenas  Zg  e  Zjg. 
Mesmo  com  a  remoção  da  segunda  variável  (Xjj),  o 
modelo  geral  ainda  é  significante  e  o  lambda  de  Wilks 
é  consideravelmente  pequeno  (0,148).  Devemos  obser¬ 
var  que  este  modelo  de  duas  variáveis,  Zj  e  Zjg,  é  um 
melhoramento  em  relação  ao  primeiro  modelo  de  duas 
variáveis,  X^  e  Zj^,  formado  no  passo  2  (lambda  de  Wi¬ 
lks  é  0,148  contra  o  valor  do  primeiro  modelo  de  0,288 
e  todas  as  diferenças  individuais  de  grupos  são  muito 
maiores).  Sem  variáveis  alcançando  o  nível  necessário 
de  significância  para  adição  ou  remoção,  o  procedimen¬ 
to  stepwise  é  encerrado. 


Resumo  do  processo  de  estimação  stepwise.  As  funções 
discriminantes  estimadas  são  composições  lineares  se¬ 
melhantes  a  uma  reta  de  regressão  (ou  seja,  elas  são  uma 
combinação  linear  de  variáveis).  Assim  como  uma  reta  de 
regressão  é  uma  tentativa  de  explicar  a  máxima  variação 
em  sua  variável  dependente,  essas  composições  lineares 
tentam  explicar  as  variações  ou  diferenças  na  variável  ca¬ 
tegórica  dependente.  A  primeira  função  discriminante  é 
desenvolvida  para  explicar  a  maior  variação  (diferença) 
nos  grupos  discriminantes.  A  segunda  função  discrimi¬ 
nante,  que  é  ortogonal  e  independente  da  primeira,  ex¬ 
plica  o  maior  percentual  da  variância  remanescente  (re¬ 
sidual)  depois  que  a  variância  para  a  primeira  função  é 
removida. 


*  N.  de  R.  T.:  Provavelmente  trata-se  de  Xy,  uma  vez  que  Zjjjá  fora 
removida. 


A  informação  fornecida  na  Tabela  5-19  resume  os  passos 
da  análise  discriminante  de  três  grupos,  com  os  seguintes 
resultados: 

•  Zg  e  Zjg  são  as  duas  variáveis  na  função  discriminante  fi¬ 
nal,  apesar  de  X^  e  X^  terem  sido  acrescentadas  nos  dois 
primeiros  passos  e  então  removidas  depois  que  Zg  e  Z^ 
foram  adicionadas.  Os  coeficientes  não-padronizados  e 
padronizados  (pesos)  da  função  discriminante  e  a  matriz 
estrutural  das  cargas  discriminantes,  rotacionadas  e  não- 
rotacionadas,  também  foram  fornecidos.  A  rotação  das 
cargas  discriminantes  facilita  a  interpretação  da  mesma 
maneira  que  fatores  foram  simplificados  para  interpreta¬ 
ção  via  rotação  (ver  Capítulo  3  para  uma  discussão  mais 
detalhada  sobre  rotação).  Examinamos  em  pormenores 
as  cargas  rotacionadas  e  não-rotacionadas  no  passo  5. 

•  A  discriminação  aumentou  com  a  adição  de  cada  variá¬ 
vel  (como  evidenciado  pela  diminuição  no  lambda  de 
Wilks),  mesmo  com  apenas  duas  variáveis  restando  no 
modelo  final.  Comparando  o  lambda  de  Wilks  final  para 
a  análise  discriminante  (0,148)  com  o  lambda  de  Wilks 
(0,414**)  para  o  melhor  resultado  de  uma  única  variável, 
Zg**,  vemos  que  uma  melhora  acentuada  é  obtida  ao  se 
usar  exatamente  duas  variáveis  nas  funções  discriminan¬ 
tes  no  lugar  de  uma  única  variável. 

•  A  qualidade  de  ajuste  geral  para  o  modelo  discriminante 
é  estatisticamente  significante  e  ambas  as  funções  são 
estatisticamente  significantes  também.  A  primeira  função 
explica  91,5%  da  variância  explicada  pelas  duas  funções, 
com  a  variância  remanescente  (8,5%)  devida  ã  segunda 
função.  A  variância  total  explicada  pela  primeira  função 
é  0,893^,  ou  79,7%.  A  próxima  função  explica  0,517^  ou 
26,7%  da  variância  remanescente  (20,3%).  Portanto, 

a  variância  total  explicada  por  ambas  as  funções  é  de 
85,1%  [79,7%  +  (26,7%  x  0,203)]  da  variação  total  na 
variável  dependente. 


Ainda  que  ambas  as  funções  sejam  estatisticamente 
significantes,  o  pesquisador  sempre  deve  garantir  que  as 
funções  discriminantes  forneçam  diferenças  entre  todos 
os  grupos.  É  possível  ter  funções  estatisticamente  signi¬ 
ficantes,  mas  ter  pelo  menos  um  par  de  grupos  que  não 
sejam  estatisticamente  distintos  (i.e.,  não  discriminados 
entre  eles).  Este  problema  se  torna  especialmente  predo¬ 
minante  quando  o  número  de  grupos  aumenta  ou  vários 
grupos  pequenos  são  incluídos  na  análise. 


A  última  seção  da  Tabela  5-18  fornece  os  testes  de  signi¬ 
ficância  para  diferenças  de  grupos  entre  cada  par  de  gru¬ 
pos  (p.ex.,  grupo  1  versus  grupo  2,  grupo  1  versus  grupo 
3  etc.).  Todos  os  pares  de  grupos  mostraram  diferenças 
estatisticamente  significantes,  denotando  que  as  funções 
discriminantes  criaram  separação  não  apenas  em  um 
sentido  geral,  mas  também  para  cada  grupo  também. 
Examinamos  os  centróides  de  grupos  graficamente  em 
uma  seção  posterior. 


*  N.  de  R.  T.:  Na  verdade,  seria  X^  com  lambda  de  Wilks  igual  a  0,467. 
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TABELA  5-18  Resultados  do  passo  6  da  análise  discriminante  stepwise  de  três  grupos 

Ajuste  geral  do  modelo 

Valor 

Valor  F 

Graus  de  liberdade 

Significância 

Lambda  de  Wiiks 

0,148 

44,774 

4, 

112 

0,000 

Variável  adicionada/removida  no  passo  6 

F 

Variável  removida 

[f  mínimo 

Valor 

Significância 

Entre  grupos 

X„  Linha  do  produto 

6,388 

25,642 

0,000 

Menos  de  1  ano  e  de  1  a  5  anos 

Nota:  Em  cada  passo,  a  variável  que  maximiza  a  distância  Mahalanobis  entre  os  dois  grupos  mais  próximos  é  adicionada. 

Variáveis  na  análise  após  o  passo  6 

Variável 

Tolerância 

Fpara  remover 

[f 

Entre  grupos 

Xg  Qualidade  do  produto 

0,754 

50,494 

0,007 

De  1  a  5  anos  e  mais  de  5  anos 

X,g  Velocidade  de  entrega 

0,754 

60,646 

0,121 

Menos  de  1  ano  e  de  1  a  5  anos 

Variáveis  fora  da  análise  após  o  passo  6 

Variável 

Tolerância 

Tolerância  mínima 

Fpara  entrar 

[f  mínimo 

Entre  grupos 

Xj  Atividades  de  comércio  eletrônico 

0,954 

0,728 

0,177 

6,474 

Menos  de  1  ano  e  de  1 

a5 

anos 

Xg  Suporte  técnico 

0,999 

0,753 

0,269 

6,495 

Menos  de  1  ano  e  de  1 

a5 

anos 

Xg  Solução  de  reclamação 

0,453 

0,349 

0,376 

6,490 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,„  Anúncio 

0,954 

0,742 

0,128 

6,402 

Menos  de  1  ano  e  de  1 

a5 

anos 

X„  Linha  do  produto 

0,701 

0,529 

2,552 

6,916 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,2  Imagem  da  equipe  de  venda 

0,957 

0,730 

0,641 

6,697 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,3  Preços  competitivos 

0,994 

0,749 

1,440 

6,408 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,4  Garantia  e  reclamações 

0,991 

0,751 

0,657 

6,694 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,5  Novos  produtos 

0,984 

0,744 

0,151 

6,428 

Menos  de  1  ano  e  de  1 

a5 

anos 

X,g  Encomenda  e  cobrança 

0,682 

0,514 

2,397 

6,750 

Menos  de  1  ano  e  de  1 

a5 

anos 

X„  Flexibilidade  de  preço 

0,652 

0,628 

3,431 

6,830 

Menos  de  1  ano  e  de  1 

a5 

anos 

Teste  de  significância  de  diferenças  de  grupos  após  o  passo  6° 

X^  Tipo  de  cliente 

Menos  de  1  ano 

De  1  a  5  anos 

De  1  a  5  anos 

F 

25,642 

Sig. 

0,000 

Mais  de  5  anos 

F 

110,261 

30,756 

Sig. 

0,000 

0,000 

“6  e  52  graus  de  liberdade. 


Avaliação  da  precisão  de  classificação 

Como  esse  é  um  modelo  de  análise  discriminante  de  três 
grupos,  duas  funções  discriminantes  são  calculadas  para 
discriminar  entre  os  três  grupos.  Valores  para  cada  caso 
são  inseridos  no  modelo  discriminante  e  composições  li¬ 
neares  (escores  Z  discriminantes)  são  calculadas.  As  fun¬ 
ções  discriminantes  são  baseadas  somente  nas  variáveis 
incluídas  no  modelo  discriminante. 


A  Tabela  5-19  fornece  os  pesos  discriminantes  de  am¬ 
bas  as  variáveis  (Ag  e  Ajg)  e  as  médias  de  cada  grupo  em 


ambas  as  funções  (parte  inferior  da  tabela).  Como  po¬ 
demos  ver  examinando  as  médias  de  grupos,  a  primeira 
função  distingue  o  grupo  1  (Menos  de  1  ano)  dos  outros 
dois  grupos  (apesar  de  uma  sensível  diferença  ocorrer 
entre  os  grupos  2  e  3  também),  enquanto  a  segunda  fun¬ 
ção  separa  o  grupo  3  (Mais  de  5  anos)  dos  outros  dois. 
Portanto,  a  primeira  função  fornece  a  maior  separação 
entre  todos  os  três  grupos,  mas  é  complementada  pela 
segunda  função,  a  qual  melhor  discrimina  (1  e  2  versus 
3)  onde  a  primeira  função  é  mais  fraca. 
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TABELA  5-1 9  Estatísticas  resumo  para  análise  discriminante  de  três  grupos 


Ajuste  geral  do  modelo:  funções  discriminantes  canônicas 

Percentual  de  variância 

Função  Autovalor 

Função 

(%) 

Percentual 

cumulativo 

Correlação 

canônica 

Lambda  de 
Wilks 

Qui-quadrado 

df 

Significãncia 

1  3,950 

91,5 

91,5 

0,893 

0,148 

107,932 

4 

0,000 

2  0,365 

8,5 

100,0 

0,517 

0,733 

17,569 

1 

0,000 

Coeficientes  da  função  discriminante  e  da  função  de  classificação 

FUNÇÃO  DISCRIMINANTE 

Função  discriminante 

Função  discriminante 

não-padronizada 

padronizada 

Funções  de  classificação 

Menos  de 

De  1  a  5 

Acima  de 

Variãveis  independentes 

Função  1 

Função  2 

Função  1 

Função  2 

1  ano 

anos 

5  anos 

X,5  Encomenda  e  cobrança* 

0,308 

1,159 

0,969 

0,622 

14,382 

15,510 

18,753 

X,g  Velocidade  de  entrega 

2,200 

0,584 

1,021 

-0,533 

25,487 

31,185 

34,401 

(Constante) 

-10,832 

-11,313 

-91,174 

-120,351 

-159,022 

Matriz  estrutural 

Cargas  discriminantes  não-rotacionadas" 

Cargas  discriminantes  rotacionadas'’ 

Variáveis  independentes 

Função  1 

Função  2 

Função  1 

Função  2 

Xg  Solução  de  reclamação* 

0,572 

-0,470 

0,739 

0,039 

Encomenda  e  cobrança 

0,499 

-0,263 

0,546 

0,143 

X,,  Linha  do  produto* 

0,483 

-0,256 

0,529 

0,137 

X,5  Novos  produtos* 

0,125 

-0,005 

0,096 

0,080 

Xg  Suporte  técnico* 

0,030 

-0,017 

0,033 

0,008 

Xg  Qualidade  do  produto* 

0,463 

0,886 

-0,257 

0,967 

X,g  Velocidade  de  entrega 

0,540 

-0,842 

0,967 

-0,257 

X,7  Flexibilidade  de  preço* 

0,106 

-0,580 

0,470 

-0,356 

X,g  Anúncio* 

0,028 

-0,213 

0,165 

-0,138 

Xj  Atividades  de  comércio  eletrônico* 

-0,095 

-0,193 

0,061 

-0,207 

X,2  Imagem  da  equipe  de  venda* 

-0,088 

-0,188 

0,061 

-0,198 

X,4  Garantia  e  reclamações* 

0,030 

-0,088 

0,081 

0,044 

X,3  Preços  competitivos* 

-0,055 

-0,059 

-0,001 

-0,080 

“Correlações  internas  de  grupos  entre  variáveis  discriminantes  e  variáveis  de  funções  discriminantes  canônicas  padronizadas  ordenadas  por  tamanho  abso¬ 
luto  da  correlação  dentro  da  função. 

"Correlações  infernas  de  grupos  entre  variáveis  discriminantes  e  funções  discriminanfes  canônicas  padronizadas  e  rotacionadas. 

*Esfa  variável  não  é  usada  na  análise. 


Médias  de  grupo  (centróides)  de  funções  discriminantes'^ 


X^Tipo  de  cliente 

Função  1 

Função** 

Menos  de  1  ano 

-1,911 

-1 ,274 

De  1  a  5  anos 

0,597 

-0,968 

Mais  de  5  anos 

1,371 

1,625 

‘Funções  discriminantes  canônicas  não-padronizadas  avaliadas  nas  médias  de  grupos. 


Avaliação  da  precisão  preditiva  de  pertinência  a  grnpo.  O 

passo  final  para  avaliar  o  ajuste  geral  do  modelo  é  deter¬ 
minar  o  nível  de  precisão  preditiva  da(s)  função(ões) 
discriminante(s).  Essa  determinação  é  conseguida  do 


*  N.  de  RT.:  Na  realidade,  foi  incluída  a  variável  Xg  (Qualidade  do 
produto). 

**  N.  de  RT.:  Neste  caso,  é  Função  2. 


mesmo  modo  que  se  faz  no  modelo  discriminante  de  dois 
grupos,  examinando-se  as  matrizes  de  classificação  e  o 
percentual  corretamente  classificado  (razão  de  sucesso) 
em  cada  amostra. 


A  classificação  de  casos  individuais  pode  ser  executada 
pelo  método  de  corte  descrito  no  caso  de  dois  grupos 
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ou  usando  as  funções  de  classificação  (ver  Tabela  5-19) 
onde  cada  caso  é  computado  em  cada  função  de  classifi¬ 
cação  e  classificado  no  grupo  de  maior  escore. 

A  Tabela  5-20  mostra  que  as  duas  funções  discri¬ 
minantes  em  combinação  atingem  um  grau  elevado  de 
precisão  de  classificação.  A  proporção  de  sucesso  para 
a  amostra  de  análise  é  de  86,7%.  No  entanto,  a  razão  de 
sucesso  para  a  amostra  de  teste  cai  para  55,0%.  Esses 
resultados  demonstram  o  viés  ascendente  que  é  típico 
quando  se  aplica  somente  à  amostra  de  análise,  mas  não 
a  uma  amostra  de  validação. 

Ambas  as  proporções  de  sucesso  devem  ser  compa¬ 
radas  com  os  critérios  de  chance  máxima  e  de  chance 
proporcional  para  se  avaliar  sua  verdadeira  efetividade. 
O  procedimento  de  validação  cruzada  é  discutido  no 
passo  6. 

•  O  critério  de  chance  máxima  é  simplesmente  a  pro¬ 
porção  de  sucesso  obtida  se  designarmos  todas  as  ob¬ 
servações  para  o  grupo  com  a  maior  probabilidade  de 
ocorrência.  Na  presente  amostra  de  100  observações,  32 
estavam  no  grupo  1,  35  no  grupo  2,  e  33  no  grupo  3.  A 
partir  dessa  informação,  podemos  ver  que  a  probabili¬ 
dade  mais  alta  seria  35%  (grupo  2).  O  valor  de  referên¬ 
cia  para  a  chance  máxima  (35%  x  1,25)  é  43,74%. 

•  O  critério  de  chance  proporcional  é  calculado  elevando- 
se  ao  quadrado  as  proporções  de  cada  grupo,  com  um 
valor  calculado  de  33,36%  (0,32^  -h  0,35^  -F  0,33^  = 


0,334)  e  um  valor  de  referência  de  41,7%  (33,4%  x  1.25 

=  41,7%). 

As  proporções  de  sucesso  para  as  amostras  de  aná¬ 
lise  e  de  teste  (86,7%  e  55,0%,  respectivamente)  exce¬ 
dem  ambos  os  valores  de  referência  de  43,74%  e  41,7%. 
Na  amostra  de  estimação,  todos  os  grupos  individuais 
ultrapassam  os  dois  valores  de  referência.  Na  amostra 
de  teste,  porém,  o  grupo  2  tem  uma  razão  de  sucesso  de 
somente  40,9%,  e  aumenta  apenas  para  53,8%  na  amos¬ 
tra  de  análise.  Tais  resultados  mostram  que  o  grupo  2 
deve  ser  o  foco  no  melhoramento  da  classificação,  pos¬ 
sivelmente  com  a  adição  de  variáveis  independentes  ou 
uma  revisão  da  classificação  de  firmas  neste  grupo  para 
identificar  as  características  do  mesmo  que  não  estão  re¬ 
presentadas  na  função  discriminante. 

A  medida  final  de  precisão  de  classificação  é  o  Q  de 
Press,  calculado  para  as  amostras  de  análise  e  de  valida¬ 
ção.  Ele  testa  a  significância  estatística  de  que  a  precisão 
de  classificação  é  melhor  do  que  o  acaso  (chance). 


Q  de  Press 


amostra  de  estimação 


[60 -(52x3)]^ 
60(3-1) 


76,8 


E  o  cálculo  para  a  amostra  de  teste  é 


Q  de  Press 


amostra  de  validação 


[40 -(22x3)]^ 
40(3-1) 


8,45 


(Continua) 


TABELA  5-20  Resultados  de  classificação  para  a  análise  discriminante  de  três  grupos 


Resultados  de  classificação’’ 

Grupo  real 

Pertinência  prevista  em  grupo 

Menos  do  que  1  ano  De  1  a  5  anos  Mais  de  5  anos 

Total 

Amostra  de  estimação 

Menos  de  1  ano 

21 

1 

0 

22 

95,5 

4,5 

0,0 

De  1  a  5  anos 

2 

7 

4 

13 

15,4 

53,8 

30,8 

Mais  de  5  anos 

0 

1 

24 

25 

0,0 

4,0 

96,0 

Validação  cruzada 

Menos  de  1  ano 

21 

1 

0 

22 

95,5 

4,5 

0,0 

De  1  a  5  anos 

2 

7 

4 

13 

15,4 

53,8 

30,8 

Mais  de  5  anos 

0 

1 

24 

25 

0,0 

4,0 

96,0 

Amostra  de  validação 

Menos  de  1  ano 

5 

3 

2 

10 

50,0 

30,0 

20,0 

De  1  a  5  anos 

1 

9 

12 

22 

4,5 

40,9 

54,5 

Mais  de  5  anos 

0 

0 

8 

8 

0,0 

0,0 

100,0 

“86,7%  dos  casos  agrupados  originais  selecionados  corretamente  classificados. 

‘‘55,0%  dos  casos  agrupados  originais  não-selecionados  corretamente  classificados. 

'86,7%  dos  casos  agrupados  selecionados  e  validados  por  cruzamento  corretamente  classificados. 
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Como  o  valor  crítico  em  um  nível  de  significância 
de  0,01  é  6,63,  a  análise  discriminante  pode  ser  descri¬ 
ta  como  prevendo  pertinência  a  grupo  melhor  do  que  o 
acaso. 


Quando  completado,  podemos  concluir  que  o  mode¬ 
lo  discriminante  é  válido  e  tem  níveis  adequados  de  sig¬ 
nificância  estatística  e  prática  para  todos  os  grupos.  Os 
valores  consideravelmente  menores  para  a  amostra  de 
validação  em  todos  os  padrões  de  comparação,  contudo, 
justificam  a  preocupação  levantada  anteriormente  sobre 
as  razões  de  sucesso  específicas  de  grupos  e  geral. 

Diagnósticos  por  casos 

Além  das  tabelas  de  classificação  mostrando  resultados 
agregados,  informação  específica  de  casos  também  está 
disponível  detalhando  a  classificação  de  cada  observação. 
Essa  informação  pode  detalhar  as  especificidades  do  pro¬ 
cesso  de  classificação  ou  representar  a  classificação  atra¬ 
vés  de  um  mapa  territorial. 

Informação  de  classificação  específica  de  caso.  Uma  sé¬ 
rie  de  medidas  específicas  de  casos  está  disponível  para 
identificação  dos  casos  mal  classificados,  bem  como  o 
diagnóstico  da  extensão  de  cada  classificação  ruim.  Usan¬ 
do  essa  informação,  padrões  entre  os  mal  classificados  po¬ 
dem  ser  identificados. 


A  Tabela  5-21  contém  dados  adicionais  de  classificação 
para  cada  caso  individual  que  foi  mal  classificado  (in¬ 
formação  similar  também  está  disponível  para  todos  os 
outros  casos,  mas  foi  omitida  por  problemas  de  espaço). 
Os  tipos  básicos  de  informação  de  classificação  incluem 
o  que  se  segue: 

•  Pertinência  a  grupo.  Tanto  os  grupos  reais  quanto  os 
previstos  são  exibidos  para  identificar  cada  tipo  de  má 
classificação  (p.ex.,  pertinência  real  ao  grupo  1,  mas  pre¬ 
vista  no  grupo  2).  Neste  caso,  vemos  os  8  casos  mal  clas¬ 
sificados  na  amostra  de  análise  (verifique  acrescentando 
os  valores  fora  da  diagonal  na  Tabela  5-20)  e  os  18  casos 
mal  classificados  na  amostra  de  validação. 

•  Distância  de  Mahalanobis  ao  centróide  de  grupo  previsto. 
Denota  a  proximidade  desses  casos  mal  classificados  em 
relação  ao  grupo  previsto.  Algumas  observações,  como  o 
caso  10,  obviamente  são  semelhantes  às  observações  do 
grupo  previsto  e  não  do  grupo  real.  Outras  observações, 
como  o  caso  57  (distância  de  Mahalanobis  de  6,041),  são 
possivelmente  observações  atípicas  no  grupo  previsto  e 
no  grupo  real.  O  mapa  territorial  discutido  na  próxima 
seção  retrata  graficamente  a  posição  de  cada  observação 
e  auxilia  na  interpretação  das  medidas  de  distância. 

•  Escores  discriminantes.  O  escore  Z  discriminante  para 
cada  caso  em  cada  função  discriminante  fornece  uma 
maneira  de  comparação  direta  entre  casos  e  um  posicio¬ 
namento  relativo  versus  as  médias  de  grupos. 


•  Probabilidade  de  classificação.  Derivada  do  emprego 
das  funções  discriminantes  de  classificação,  a  probabili¬ 
dade  de  pertinência  para  cada  grupo  é  dada.  Os  valores 
de  probabilidade  viabilizam  ao  pesquisador  avaliar  a 
extensão  da  má  classificação.  Por  exemplo,  dois  casos, 

85  e  89,  são  do  mesmo  tipo  de  má  classificação  (grupo 
real  2  e  grupo  previsto  3),  mas  muito  diferentes  em  suas 
classificações  quando  as  probabilidades  são  focadas.  O 
caso  85  representa  uma  classificação  ruim  marginal,  pois 
a  probabilidade  de  previsão  no  grupo  real  2  era  de  0,462, 
enquanto  no  grupo  3  incorretamente  previsto  ela  era 
um  pouco  maior  (0,529).  Esta  má  classificação  contrasta 
com  o  caso  89,  onde  a  probabilidade  do  grupo  real  era 
de  0,032,  e  a  probabilidade  prevista  para  o  grupo  3  (o 
mal  classificado)  era  0,966.  Em  ambas  as  situações  de  má 
classificação,  a  extensão  ou  magnitude  varia  muito. 


O  pesquisador  deve  avaliar  a  extensão  de  má  classifi¬ 
cação  para  cada  caso.  Casos  que  são  classificações  obvia¬ 
mente  ruins  devem  ser  escolhidos  para  análise  adicional 
(perfil,  exame  de  variáveis  adicionais  etc.),  discutida  na 
análise  de  dois  grupos. 

Mapa  territorial.  A  análise  de  más  classificações  pode 
ser  suplementada  pelo  exame  gráfico  das  observações  in¬ 
dividuais,  representando-as  com  base  em  seus  escores  Z 
discriminantes. 


A  Figura  5-9  mostra  cada  observação  baseada  em  seus 
dois  escores  Z  discriminantes  rotacionados  com  uma  co¬ 
bertura  do  mapa  territorial  que  representa  as  fronteiras 
dos  escores  de  corte  para  cada  função.  Ao  ver  a  disper¬ 
são  de  cada  grupo  em  torno  do  centróide,  podemos  ob¬ 
servar  várias  coisas: 

•  O  grupo  3  (Mais  de  5  anos)  é  mais  concentrado,  com 
pouca  sobreposição  com  os  outros  dois  grupos,  como  se 
mostra  na  matriz  de  classificação  onde  apenas  uma  ob¬ 
servação  foi  mal  classificada  (ver  Tabela  5-20). 

•  O  grupo  1  (Menos  de  1  ano)  é  o  menos  compacto,  mas  o 
domínio  de  casos  não  se  sobrepõe  em  grande  grau  com 
os  outros  grupos,  tornando  previsões  muito  melhores 
do  que  poderia  ser  esperado  para  um  grupo  tão  variado. 
Os  únicos  casos  mal  classificados  que  são  substancial¬ 
mente  distintos  são  o  caso  10,  que  é  próximo  ao  centrói¬ 
de  do  grupo  2,  e  o  caso  13,  que  é  próximo  ao  centróide 
do  grupo  3.  Ambos  os  casos  merecem  melhor  investiga¬ 
ção  quanto  às  suas  similaridades  com  outros  grupos. 

•  Estes  dois  grupos  fazem  contraste  com  o  grupo  2  (De 
1  a  5  anos),  que  pode  ser  visto  como  tendo  substancial 
sobreposição  com  o  grupo  3  e,  em  menor  extensão,  com 
o  grupo  1  (Menos  de  1  ano).  Essa  sobreposição  resulta 
nos  mais  baixos  níveis  de  precisão  de  classificação  nas 
amostras  de  análise  e  de  teste. 

•  A  sobreposição  que  ocorre  entre  os  grupos  2  e  3  no 
centro  e  à  direita  no  gráfico  sugere  a  possível  existência 
de  um  quarto  grupo.  Uma  análise  poderia  ser  levada 

(Continua) 


vista  no  grupo  2).  Neste  caso,  vemos  os  8  casos  mal  clas¬ 
sificados  na  amostra  de  análise  (verifique  acrescentando 
os  valores  fora  da  diagonal  na  Tabela  5-20)  e  os  18  casos 
mal  classificados  na  amostra  de  validação. 

Distância  de  Mahalanobis  ao  centróide  de  grupo  previsto. 
Denota  a  proximidade  desses  casos  mal  classificados  em 
relação  ao  grupo  previsto.  Algumas  observações,  como  o 
caso  10,  obviamente  são  semelhantes  às  observações  do 
grupo  previsto  e  não  do  grupo  real.  Outras  observações, 
como  o  caso  57  (distância  de  Mahalanobis  de  6,041),  são 
possivelmente  observações  atípicas  no  grupo  previsto  e 
no  grupo  real.  O  mapa  territorial  discutido  na  próxima 
seção  retrata  graficamente  a  posição  de  cada  observação 
e  auxilia  na  interpretação  das  medidas  de  distância. 
Escores  discriminantes.  O  escore  Z  discriminante  para 
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TABELA  5-21  Previsões  mal  classificadas  para  casos  individuais  na  análise  discriminante  de  três  grupos 

PERTINÊNCIA  A 

GRUPO  ESCORES  DISCRIMINANTES  PROBABILIDADE  DE  CLASSIFICAÇÃO 

Distância  de 

identificação  Mahalanobis 


do  caso 

(XJ  Real  Previsto 

ao  centróide” 

Função  1 

Função  2 

Grupo  1 

Grupo  2 

Grupo  3 

Amostra  de  análise/estimação 

10 

1 

2 

0,175 

0,81755 

-1 ,32387 

0,04173 

0,93645 

0,02182 

8 

2 

1 

1,747 

-0,78395 

-1 ,96454 

0,75064 

0,24904 

0,00032 

100 

2 

1 

2,820 

-0,70077 

-0,11060 

0,54280 

0,39170 

0,06550 

1 

2 

3 

2,947 

-0,07613 

0,70175 

0,06527 

0,28958 

0,64515 

5 

2 

3 

3,217 

-0,36224 

1,16458 

0,05471 

0,13646 

0,80884 

37 

2 

3 

3,217 

-0,36224 

1,16458 

0,05471 

0,13646 

0,80884 

88 

2 

3 

2,390 

0,99763 

0,12476 

0,00841 

0,46212 

0,52947 

58 

3 

2 

0,727 

0,30687 

-0,16637 

0,07879 

0,70022 

0,22099 

Amostra  de  teste/validação 

25 

1 

2 

1,723 

-0,18552 

-2,02118 

0,40554 

0,59341 

0,00104 

77 

1 

2 

0,813 

0,08688 

-0,22477 

0,13933 

0,70042 

0,16025 

97 

1 

2 

1,180 

-0,41466 

-0,57343 

0,42296 

0,54291 

0,03412 

13 

1 

3 

0,576 

1,77156 

2,26982 

0,00000 

0,00184 

0,99816 

96 

1 

3 

3,428 

-0,26535 

0,75928 

0,09917 

0,27855 

0,62228 

83 

2 

1 

2,940 

-1 ,58531 

0,40887 

0,89141 

0,08200 

0,02659 

23 

2 

3 

0,972 

0,61462 

0,99288 

0,00399 

0,10959 

0,88641 

34 

2 

3 

1,717 

0,86996 

0,41413 

0,00712 

0,31048 

0,68240 

39 

2 

3 

0,694 

1,59148 

0,82119 

0,00028 

0,08306 

0,91667 

41 

2 

3 

2,220 

0,30230 

0,58670 

0,02733 

0,30246 

0,67021 

42 

2 

3 

0,210 

1 ,08081 

1 ,97869 

0,00006 

0,00665 

0,99330 

55 

2 

3 

1,717 

0,86996 

0,41413 

0,00712 

0,31048 

0,68240 

57 

2 

3 

6,041 

3,54521 

0,47780 

0,00000 

0,04641 

0,95359 

62 

2 

3 

4,088 

-0,32690 

0,52743 

0,17066 

0,38259 

0,44675 

75 

2 

3 

2,947 

-0,07613 

0,70175 

0,06527 

0,28958 

0,64515 

78 

2 

3 

0,210 

1 ,08081 

1 ,97869 

0,00006 

0,00665 

0,99330 

85 

2 

3 

2,390 

0,99763 

0,12476 

0,00841 

0,46212 

0,52947 

89 

2 

3 

0,689 

0,54850 

1,51411 

0,00119 

0,03255 

0,96625 

“Distância  de  Mahalanobis  ao  centróide  do  grupo  previsto 


(Continuação) 

a  cabo  para  determinar  o  real  intervalo  de  tempo  de 
clientes,  talvez  com  clientes  com  mais  de  1  ano  divididos 
em  três  grupos  ao  invés  de  dois. 


A  representação  gráfica  é  útil  não  apenas  para  identi¬ 
ficar  esses  casos  mal  classificados  que  podem  formar  um 
novo  grupo,  mas  também  para  identificar  observações  atí¬ 
picas.  A  discussão  anterior  indica  possíveis  opções  para 
identificar  observações  atípicas  (caso  57),  bem  como  a 
possibilidade  de  redefinição  de  grupos  entre  os  grupos  2 
e3. 

Estágio  5:  Interpretação  dos  resultados 
da  análise  discriminante  de  três  grupos 

O  próximo  estágio  da  análise  discriminante  envolve  uma  sé¬ 
rie  de  passos  na  interpretação  das  funções  discriminantes. 


•  Calcular  as  cargas  para  cada  função  e  rever  a  rotação  das 
funções  para  fins  de  simplificação  da  interpretação. 

•  Examinar  as  contribuições  das  variáveis  preditoras:  (a)  a 
cada  função  separadamente  (ou  seja,  cargas  discriminan¬ 
tes),  (b)  cumulativamente  sobre  múltiplas  funções  discri¬ 
minantes  com  o  índice  de  potência,  e  (c)  graficamente  em 
uma  solução  bidimensional  para  entender  a  posição  relativa 
de  cada  grupo  e  a  interpretação  das  variáveis  relevantes  na 
determinação  dessa  posição. 

Cargas  discriminantes  e  suas  rotações 

Uma  vez  que  as  funções  discriminantes  são  calculadas, 
elas  são  correlacionadas  com  todas  as  variáveis  indepen¬ 
dentes,  mesmo  aquelas  não  usadas  na  função  discriminan¬ 
te,  para  desenvolver  uma  matriz  estrutural  (de  cargas). 
Tal  procedimento  nos  permite  ver  onde  a  discriminação 
ocorreria  se  todas  as  variáveis  independentes  fossem  in¬ 
cluídas  no  modelo  (ou  seja,  se  nenhuma  fosse  excluída  por 
multicolinearidade  ou  falta  de  significância  estatística). 
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X,  -  Tipo  de  cliente 

^  Centróides  de  grupo 
■  Mais  de  5  anos 
9  De  1  a  5  anos 
▲  Menos  de  1  ano 


Função  1 

FIGURA  5-9  Mapa  territorial  para  a  análise  discriminante  de  três  grupos. 


Cargas  discriminantes.  As  cargas  não-rotacionadas  re¬ 
presentam  a  associação  de  cada  variável  independente 
com  cada  função,  mesmo  que  não  esteja  incluída  na  fun¬ 
ção  discriminante.  Cargas  discriminantes,  semelhantes  às 
cargas  fatoriais  descritas  no  Capítulo  3,  são  as  correla¬ 
ções  entre  cada  variável  independente  e  o  escore  discri¬ 
minante. 


A  Tabela  5-19  contém  a  matriz  estrutural  de  cargas  não- 
rotacionadas  para  ambas  as  funções  discriminantes.  Se¬ 
lecionando  variáveis  com  cargas  de  0,40  ou  acima  como 
descritivas  das  funções,  percebemos  que  a  função  1  tem 
cinco  variáveis  excedendo  0,40  {Xg,  Ajg,  Ajj  e  X^), 
enquanto  quatro  variáveis  são  descritivas  da  função  2 
(Ag,  Ajg,  e  Xg).  Ainda  que  pudéssemos  usar  essas 
variáveis  para  descrever  cada  função,  enfrentaríamos  o 
problema  de  que  três  variáveis  {Xg,  X^  e  A^g)  têm  car¬ 
gas  duplas  (variáveis  selecionadas  como  descritivas  de 
ambas  as  funções).  Se  fôssemos  proceder  com  as  cargas 
não-rotacionadas,  cada  função  compartilharia  mais  va¬ 
riáveis  com  a  outra  do  que  teria  feito  se  fosse  única. 


A  falta  de  distinção  das  cargas  com  cada  variável  des¬ 
critiva  de  uma  só  função  pode  ser  abordada  com  rotação 
da  matriz  estrutural,  exatamente  como  foi  feito  com  car¬ 
gas  fatoriais.  Para  uma  descrição  mais  detalhada  do  pro¬ 
cesso  de  rotação,  ver  Capítulo  3. 

Rotação  Depois  que  as  cargas  da  função  discriminante 
são  calculadas,  elas  podem  ser  rotacionadas  para  redis¬ 
tribuir  a  variância  (esse  conceito  é  melhor  explicado  no 
Capítulo  3).  Basicamente,  a  rotação  preserva  a  estrutura 


original  e  a  confiabilidade  dos  modelos  discriminantes  e 
facilita  consideravelmente  a  sua  interpretação. 


Na  presente  aplicação,  escolhemos  o  procedimento  mais 
amplamente  usado  de  rotação  VARIMAX.  A  rotação 
afeta  os  coeficientes  da  função  e  as  cargas  discriminan¬ 
tes,  bem  como  o  cálculo  dos  escores  Z  discriminantes  e 
dos  centróides  de  grupo  (ver  Tabela  5-19).  Examinar  os 
coeficientes  ou  as  cargas  rotacionados  versus  não-rota- 
cionados  revela  um  conjunto  de  resultados  um  pouco 
mais  simples  (ou  seja,  as  cargas  tendem  a  se  separar  em 
valores  altos  versus  baixos,  em  vez  de  se  limitarem  a  um 
domínio  intermediário).  As  cargas  rotacionadas  permi¬ 
tem  interpretações  muito  mais  distintas  de  cada  função: 

•  A  função  1  é  agora  descrita  por  três  variáveis  (Ajg,  A, 
e  Ajg)  que  formam  o  fator  Serviço  ao  Cliente  de  Pós- 
Venda  durante  a  análise  fatorial  (ver  Capítulo  3  para 
mais  detalhes),  mais  A^  e  Aj,.  Assim,  o  serviço  a  clien¬ 
te,  mais  linha  de  produto  e  flexibilidade  de  preço  são 
descritores  da  função  1. 

•  A  função  2  mostra  apenas  uma  variável,  Ag  (Qualidade 
do  produto),  que  tem  uma  carga  acima  de  0,40  para  a 
segunda  função.  Apesar  de  Aj,  ter  um  valor  abaixo  da 
referência  (-0,356),  esta  variável  tem  uma  carga  maior 
na  primeira  função,  o  que  a  torna  um  descritor  daquela 
função.  Logo,  a  segunda  função  pode  ser  descrita  pela 
variável  de  Qualidade  do  produto. 


Com  duas  ou  mais  funções  estimadas,  a  rotação  pode 
ser  uma  poderosa  ferramenta  que  sempre  deve  ser  consi¬ 
derada  para  aumentar  a  interpretabilidade  dos  resultados. 
Em  nosso  exemplo,  cada  uma  das  variáveis  que  entrou  no 
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processo  stepwise  era  descritiva  de  uma  das  funções  discri¬ 
minantes.  O  que  devemos  fazer  agora  é  avaliar  o  impacto 
de  cada  variável  em  termos  da  análise  discriminante  geral 
(i.e.,  em  ambas  as  funções). 

Avaliação  da  contribuição  de  variáveis preditoras 

Tendo  descrito  as  funções  discriminantes  em  termos  das 
variáveis  independentes  -  tanto  aquelas  que  foram  usa¬ 
das  nas  funções  discriminantes  quanto  as  que  não  foram 
incluídas  -  voltamos  nossa  atenção  para  conseguir  uma 
melhor  compreensão  do  impacto  das  próprias  funções,  e 
então  das  variáveis  individuais. 

Impacto  das  funções  individuais.  A  primeira  tarefa  é 
examinar  as  funções  discriminantes  em  termos  de  como 
elas  diferenciam  entre  os  grupos. 


Começamos  examinando  os  centróides  de  grupos  quan¬ 
to  às  duas  funções  como  mostrado  na  Tabela  5-19.  Uma 
abordagem  mais  fácil  é  através  do  mapa  territorial  (Fi¬ 
gura  5-9): 

•  Examinando  os  centróides  de  grupos  e  a  distribuição 
de  casos  em  cada  grupo,  percebemos  que  a  função  1 
prioritariamente  diferencia  entre  o  grupo  1  e  os  grupos 
2  e  3,  enquanto  a  função  2  distingue  entre  o  grupo  3  e  os 
grupos  1  e  2. 

•  A  sobreposição  e  a  má  classificação  dos  casos  dos 
grupos  2  e  3  pode  ser  tratada  via  o  exame  da  força  das 
funções  discriminantes  e  dos  grupos  diferenciados  por 
conta  de  cada  uma.  Retomando  a  Tabela  5-19,  a  função 
1  era,  de  longe,  o  discriminador  mais  potente,  e  ela  prio¬ 
ritariamente  separava  o  grupo  1  dos  demais.  A  função  2, 
que  separava  o  grupo  3  dos  outros,  era  muito  mais  fraca 
em  termos  de  poder  discriminante.  Não  é  surpresa  que 

a  maior  sobreposição  e  má  classificação  ocorreriam  en¬ 
tre  os  grupos  2  e  3,  que  são  distinguidos  principalmente 
pela  função  2. 


Essa  abordagem  gráfica  ilustra  as  diferenças  nos  gru¬ 
pos  devido  às  funções  discriminantes,  mas  não  fornece 
uma  base  para  explicar  essas  diferenças  em  termos  das 
variáveis  independentes. 

Para  avaliar  as  contribuições  das  variáveis  individuais, 
o  pesquisador  conta  com  várias  medidas  -  cargas  discri¬ 
minantes,  razões  F  univariadas  e  o  índice  de  potência.  As 
técnicas  envolvidas  no  uso  de  cargas  discriminantes  e  de 
razões  F  univariadas  foram  discutidas  no  exemplo  de  dois 
grupos.  Examinaremos  mais  detalhadamente  o  índice  de 
potência,  um  método  de  avaliação  da  contribuição  de  uma 
variável  em  múltiplas  funções  discriminantes. 

índice  de  potência.  O  índice  de  potência  é  uma  técnica 
adicional  de  interpretação  muito  útil  em  situações  com 
mais  de  uma  função  discriminante.  Ele  retrata  a  contribui¬ 
ção  de  cada  variável  individual  em  todas  as  funções  discri¬ 
minantes  em  termos  de  uma  única  medida  comparável. 


O  índice  de  potência  reflete  tanto  as  cargas  de  cada 
variável  quanto  o  poder  discriminatório  relativo  de  cada 
função.  As  cargas  rotacionadas  representam  a  correlação 
entre  a  variável  independente  e  o  escore  Z  discriminan¬ 
te.  Assim,  a  carga  ao  quadrado  é  a  variância  na  variável 
independente  associada  com  a  função  discriminante.  Pon¬ 
derando  a  variância  explicada  de  cada  função  via  poder 
discriminatório  relativo  da  função  e  somando  nas  funções, 
o  índice  de  potência  representa  o  efeito  discriminante  to¬ 
tal  de  cada  variável  ao  longo  de  todas  as  funções  discrimi¬ 
nantes. 


A  Tabela  5-22  fornece  os  detalhes  do  cálculo  do  índice 
de  potência  para  cada  variável  independente.  A  com¬ 
paração  das  variáveis  quanto  a  seus  índices  de  potência 
revela  o  seguinte: 

•  Ajg  (Velocidade  de  entrega)  é  a  variável  independente 
responsável  pela  maior  discriminação  entre  os  três  tipos 
de  grupos  de  clientes. 

•  Ela  é  seguida  em  termos  de  impacto  por  quatro  variá¬ 
veis  não  incluídas  na  função  discriminante  (Xg,  Xjg,  Xjj 
eXJ. 

•  A  segunda  variável  na  função  discriminante  (X^)  tem 
apenas  o  sexto  maior  valor  de  potência. 

Por  que  tem  somente  o  sexto  maior  valor  de  po¬ 
tência  mesmo  sendo  uma  das  duas  variáveis  incluídas  na 
função  discriminante? 

•  Primeiro,  lembre-se  que  multicolinearidade  afeta  solu¬ 
ções  stepwise  devido  à  redundância  entre  variáveis  alta¬ 
mente  multicolineares.  Xg  e  eram  as  duas  variáveis 
altamente  associadas  com  X^g  (formando  o  fator  Serviço 
a  Clientes),  e  assim  seu  impacto  em  um  sentido  univa- 
riado,  refletido  no  índice  de  potência,  não  era  neces¬ 
sário  na  função  discriminante  devido  à  presença  de  Xjg. 

•  As  outras  duas  variáveis,  X^j  e  Xj,,  entraram  através 
do  procedimento  stepwise,  mas  foram  removidas  uma 
vez  que  Xg  foi  adicionada,  novamente  devido  à  multi¬ 
colinearidade.  Assim,  seu  maior  poder  discriminante 
está  refletido  em  seus  valores  de  potência  ainda  que 
elas  não  fossem  necessárias  na  função  discriminante, 
uma  vez  que  Xg  foi  acrescentada  com  Xjg  na  função 
discriminante. 

•  Finalmente,  Xg,  a  segunda  variável  na  função  discrimi¬ 
nante,  tem  um  baixo  valor  de  potência  por  ser  associada 
com  a  segunda  função  discriminante,  que  tem  relativa¬ 
mente  pouco  impacto  discriminante  quando  comparada 
com  a  primeira  função.  Logo,  a  despeito  de  Xg  ser  um 
elemento  necessário  na  discriminação  entre  os  três  gru¬ 
pos,  seu  impacto  geral  é  menor  do  que  aquelas  variáveis 
associadas  com  a  primeira  função. 


Lembre-se  que  os  valores  de  potência  podem  ser  cal¬ 
culados  para  todas  as  variáveis  independentes,  mesmo 
que  não  estejam  nas  funções  discriminantes,  pois  eles  são 
baseados  em  cargas  discriminantes.  A  meta  do  índice  de 
potência  é  fornecer  interpretação  naqueles  casos  onde 
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multicolinearidade  ou  outros  fatores  possam  ter  evitado  a 
inclusão  de  uma  variável  na  função  discriminante. 

Uma  visão  geral  das  medidas  empíricas  de  impacto. 

Como  visto  nas  discussões  anteriores,  o  poder  discrimi¬ 
natório  de  variáveis  em  análise  discriminante  é  refletido 
em  muitas  medidas  diferentes,  cada  uma  desempenhando 
um  papel  único  na  interpretação  dos  resultados  discrimi¬ 
nantes.  Combinando  todas  essas  medidas  em  nossa  ava¬ 
liação  das  variáveis,  podemos  conquistar  uma  perspectiva 
bastante  eclética  sobre  como  cada  variável  se  ajusta  nos 
resultados  discriminantes. 


A  Tabela  5-23  apresenta  as  três  medidas  interpretativas 
preferidas  (cargas  rotacionadas,  razão  F  univariada  e  ín¬ 
dice  de  potência)  para  cada  variável  independente.  Os 
resultados  apoiam  a  análise  stepwise,  apesar  de  ilustra¬ 
rem  em  diversos  casos  o  impacto  de  multicolinearidade 
sobre  os  procedimentos  e  os  resultados. 

•  Duas  variáveis  (X,  e  Xjg)  têm  os  maiores  impactos  indi¬ 
viduais  como  evidenciado  por  seus  valores  F  univaria- 
dos.  No  entanto,  como  ambas  são  altamente  associadas 
(como  evidenciado  por  suas  inclusões  no  fator  Serviço 
ao  cliente  do  Capítulo  3),  apenas  uma  será  incluída  em 
uma  solução  stepwise.  Ainda  que  X,  tenha  um  valor  F 
univariado  marginalmente  maior,  a  habilidade  de  Xjg 
fornecer  uma  melhor  discriminação  entre  todos  os  gru¬ 
pos  (como  evidenciado  por  seu  maior  valor  mínimo 

de  Mahalanobis  descrito  anteriormente)  fez  dela  a  me¬ 
lhor  candidata  para  inclusão.  Portanto,  X,,  em  uma  base 
individual,  tem  um  poder  discriminante  comparável,  mas 
Xjg  será  vista  funcionando  melhor  com  outras  variáveis. 

•  Três  variáveis  adicionais  (X^,  Xjj  e  Xj^)  são  as  próximas 
com  maior  impacto,  mas  apenas  uma,  X^,  é  mantida  na 
função  discriminante.  Note  que  Xj^  é  altamente  correla¬ 
cionada  com  Xjg  (ambas  parte  do  fator  Serviço  ao  clien¬ 


te)  e  não  incluída  na  função  discriminante,  enquanto  Xjj 
entrou  na  mesma,  mas  foi  uma  daquelas  variáveis  remo¬ 
vidas  depois  que  Xg  foi  adicionada. 

•  Finalmente,  duas  variáveis  (Xj,  e  Xj,)  tinham  quase  os 
mesmos  efeitos  univariados,  mas  somente  Xjy  tinha  uma 
associação  substancial  com  uma  das  funções  discrimi¬ 
nantes  (uma  carga  de  0,470  sobre  a  primeira  função).  O 
resultado  é  que  mesmo  que  Xj,  possa  ser  considerada 
descritiva  da  primeira  função  e  tendo  um  impacto  na 
discriminação  baseado  nessas  funções,  Xjj  não  tem 
qualquer  impacto,  seja  em  associação  com  essas  duas 
funções,  seja  em  adição  uma  vez  que  estas  funções  sejam 
explicadas. 

•  Todas  as  variáveis  remanescentes  tinham  pequenos 
valores  F  univariados  e  pequenos  valores  de  potência,  o 
que  indica  pouco  ou  nenhum  impacto  tanto  no  sentido 
univariado  quanto  multivariado. 


De  particular  interesse  é  a  interpretação  das  duas  di¬ 
mensões  de  discriminação.  Essa  interpretação  pode  ser 
feita  somente  através  do  exame  das  cargas,  mas  é  comple¬ 
mentada  por  uma  representação  gráfica  das  cargas  discri¬ 
minantes,  como  descrito  na  próxima  seção. 

Representação  gráfica  de  cargas  discriminantes.  Para 
representar  as  diferenças  em  termos  das  variáveis  pre- 
ditoras,  as  cargas  e  os  centróides  de  grupos  podem  ser 
representados  graficamente  em  espaço  discriminante  re¬ 
duzido.  Como  observado  anteriormente,  a  representação 
mais  válida  é  o  uso  de  vetores  de  atribuição  e  centróides 
de  grupos  expandidos. 


A  Tabela  5-24  mostra  os  cálculos  para  a  expansão  das 
cargas  discriminantes  (usadas  para  vetores  de  atribui¬ 
ção)  e  de  centróides  de  grupos.  O  processo  de  represen- 

(Continua) 


TABELA  5-23  Resumo  de  medidas  interpretativas  para  análise  discriminante  de  três  grupos 


Cargas  rotacionadas  de 
função  discriminante 

Função  1  Função  2 

Razão  F 
univariada 

índice  de 
potência 

Xg  Qualidade  do  produto 

-0,257 

0,967 

32,311 

0,139 

Xj  Atividades  de  comércio  eletrônico 

0,061 

-0,207 

1,221 

0,060 

Xg  Suporte  técnico 

0,033 

0,008 

0,782 

0,001 

Xg  Solução  de  reclamação 

0,739 

0,039 

40,292 

0,500 

X,g  Anúncio 

0,165 

-0,138 

1,147 

0,027 

X,,  Linha  do  produto 

0,529 

0,137 

32,583 

0,258 

X,2  Imagem  da  equipe  de  venda 

0,061 

-0,198 

1,708 

0,007 

X,3  Preços  competitivos 

-0,001 

-0,080 

9,432 

0,001 

X,4  Garantia  e  reclamações 

0,081 

0,044 

2,619 

0,006 

X,5  Novos  produtos 

0,096 

0,080 

0,216 

0,009 

X,g  Encomenda  e  cobrança 

0,546 

0,143 

25,048 

0,275 

X„  Flexibilidade  de  preço 

0,470 

-0,356 

12,551 

0,213 

X,g  Velocidade  de  entrega 

0,967 

-0,257 

40,176 

0,861 
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{Conlimmção) 

tação  gráfica  sempre  envolve  todas  as  variáveis  incluídas 
no  modelo  pelo  procedimento  stepwise  (em  nosso  exem¬ 
plo,  Xj  e  Xjg).  No  entanto,  também  faremos  o  gráfico 
das  variáveis  não  incluídas  na  função  discriminante  se 
suas  respectivas  razões  F  univariadas  forem  significan- 
tes,  o  que  adiciona  Xg,  Xjj  e  ao  espaço  discriminante 
reduzido.  Esse  procedimento  mostra  a  importância  de 
variáveis  colineares  que  não  foram  incluídas  no  modelo 
stepwise  final,  semelhante  ao  índice  de  potência. 

Os  gráficos  dos  vetores  de  atribuição  expandidos 
para  as  cargas  discriminantes  rotacionadas  são  exibidos 
na  Figura  5-10.  Os  vetores  do  gráfico  nos  quais  esse  pro¬ 
cedimento  foi  usado  apontam  para  os  grupos  que  têm  a 
mais  alta  média  na  respectiva  variável  independente  e 
para  a  direção  oposta  dos  grupos  que  têm  os  mais  baixos 
escores  médios.  Assim,  a  interpretação  do  gráfico  na  Fi¬ 
gura  5-10  indica  o  seguinte: 

•  Como  observado  no  mapa  territorial  e  na  análise  dos 
centróides  de  grupos,  a  primeira  função  discriminante 
distingue  entre  grupo  1  e  grupos  2  e  3,  enquanto  a  se¬ 
gunda  diferencia  o  grupo  3  dos  grupos  1  e  2. 

•  A  correspondência  de  Xjj,  X^^,  Xg  e  X^g  com  o  eixo  X 
reflete  a  associação  delas  com  a  primeira  função  discri¬ 
minante,  enquanto  vemos  que  somente  X^  é  associada 
com  a  segunda  função  discriminante.  A  figura  ilustra 
graficamente  as  cargas  rotacionadas  para  cada  função  e 
distingue  as  variáveis  descritivas  de  cada  função. 


Estágio  6:  Validação  dos 
resultados  discriminantes 

As  razões  de  sucesso  para  as  matrizes  de  classificação  cru¬ 
zada  e  de  teste  podem  ser  usadas  para  avaliar  a  validade 
interna  e  externa,  respectivamente,  da  análise  discrimi¬ 
nante.  Se  as  razões  de  sucesso  excederem  os  valores  de 
referência  nos  padrões  de  comparação,  então  validade  é 
estabelecida.  Como  anteriormente  descrito,  os  valores  de 
referência  são  41,7%  para  o  critério  de  chance  proporcio¬ 
nal  e  43,7%  para  o  critério  de  chance  máxima.  Os  resulta¬ 
dos  de  classificação  mostrados  na  Tabela  5-20  fornecem  o 
seguinte  suporte  para  validade: 

Validade  interna  é  avaliada  pelo  método  de  classifica¬ 
ção  cruzada,  onde  o  modelo  discriminante  é  estimado  dei¬ 
xando  um  caso  de  fora  e  então  prevendo  aquele  caso  com 
o  modelo  estimado.  Este  processo  é  feito  em  turnos  para 
cada  observação,  de  modo  que  uma  observação  jamais  in¬ 
fluencia  o  modelo  discriminante  que  prevê  sua  classifica¬ 
ção  em  algum  grupo. 


Como  visto  na  Tabela  5-20,  a  razão  de  sucesso  geral  para 
o  método  de  classificação  cruzada  de  86,7  substancialmen¬ 
te  excede  ambos  os  padrões,  tanto  geral  quanto  para  cada 
grupo.  Contudo,  ainda  que  todos  os  três  grupos  também 
tenham  razões  individuais  de  sucesso  acima  dos  padrões, 
a  razão  de  sucesso  do  grupo  2  (53,8)  é  consideravelmente 
menor  do  que  aquela  sobre  os  outros  dois  grupos. 


TABELA  5-24  Cálculo  dos  vetores  de  atribuição  e  dos  centróides  de  grupos  expandidos  no  espaço  discriminante  reduzido 


Variáveis  independentes 

Cargas  da  função  discrimi¬ 
nante  rotacionada 

Coordenadas  no 
espaço  reduzido 

Função  1 

Função  2 

Razão  F 
univariada 

Função  1 

Função  2 

Xg  Qualidade  do  produto 

-0,257 

0,967 

32,311 

-8,303 

31 ,244 

Xj  Atividades  de  comércio  eletrônico® 

0,061 

-0,207 

1,221 

Xg  Suporte  técnico® 

0,033 

0,008 

0,782 

Xg  Solução  de  reclamação 

0,739 

0,039 

40,292 

29,776 

1,571 

X,o  Anúncio® 

0,165 

-0,138 

1,147 

X,,  Linha  do  produto 

0,529 

0,137 

32,583 

17,236 

4,464 

X,2  Imagem  da  equipe  de  venda® 

0,061 

-0,198 

1,708 

X,3  Preços  competitivos® 

-0,001 

-0,080 

9,432 

X„  Garantia  e  reclamações® 

0,081 

0,044 

2,619 

X,5  Novos  produtos® 

0,096 

0,080 

0,216 

X,g  Encomenda  e  cobrança 

0,546 

0,143 

25,048 

13,676 

3,581 

X„  Flexibilidade  de  preço® 

0,470 

-0,356 

12,551 

X,g  Velocidade  de  entrega 

0,967 

-0,257 

40,176 

38,850 

-10,325 

‘Variáveis  com  razões  univariadas  não-significantes  não  são  representadas  no  espaço  reduzido. 

Coordenadas  no 

Centróides  de  grupo 

Vaior  F  aproximado 

espaço  reduzido 

Função  1  Função  2 

Função  1 

Função  2 

Função  1 

Função  2 

Grupo  1 :  Menos  de  1  ano 

1,911  -1,274 

66,011 

56,954 

-126,147 

-72,559 

Grupo  2:  De  1  a  5  anos  0,597  -0,968 

66,011 

56,954 

39,408 

-55,131 

Grupo  3:  Mais  de  5  anos 

1 ,371  1 ,625 

66,011 

56,954 

90,501 

92,550 
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FIGURA  5-10  Gráfico  de  vetores  de  atribuição  expandidos  (variáveis)  no  espaço  discriminante  reduzido. 


Validade  externa  é  tratada  através  da  amostra  de  tes¬ 
te,  a  qual  é  uma  amostra  completamente  separada  que 
utiliza  as  funções  discriminantes  estimadas  com  a  amostra 
de  análise  para  previsão  de  grupos. 


Em  nosso  exemplo,  a  amostra  de  teste  tem  uma  ra¬ 
zão  geral  de  sucesso  de  55,0%,  o  que  excede  ambos 
os  valores  de  referência,  apesar  de  isso  não  ocorrer  na 
magnitude  encontrada  na  abordagem  de  classificação 
cruzada.  O  grupo  2,  contudo,  não  excedeu  qualquer 
valor  de  referência.  Quando  as  classificações  ruins  são 
analisadas,  percebemos  que  mais  casos  são  mal  classi¬ 
ficados  no  grupo  3  do  que  corretamente  classificados 
no  grupo  2,  o  que  sugere  que  esses  casos  mal  classi¬ 
ficados  sejam  examinados  diante  da  possibilidade  de 
uma  redefinição  dos  grupos  2  e  3  para  que  se  crie  um 
novo  grupo. 


O  pesquisador  também  é  encorajado  a  estender  o 
processo  de  validação  por  meio  do  perfil  dos  grupos 
quanto  a  conjuntos  adicionais  de  variáveis  ou  apli¬ 
cando  a  função  discriminante  em  outra(s)  amostra(s) 
representativa(s)  da  população  geral  ou  de  segmentos 
da  mesma.  Além  disso,  a  análise  de  casos  mal  classifi¬ 
cados  ajudará  a  estabelecer  se  são  necessárias  variáveis 
adicionais  ou  se  a  classificação  de  grupos  dependentes 
precisa  de  revisão. 

Uma  visão  gerencial 

A  análise  discriminante  teve  por  meta  entender  as  dife¬ 
renças  perceptuais  de  clientes  com  base  nos  intervalos  de 
tempo  como  clientes  da  HBAT.  Espera-se  que  o  exame 
de  diferenças  em  percepções  HBAT  baseadas  na  constân¬ 
cia  como  clientes  identifique  percepções  que  são  críticas 


ao  desenvolvimento  de  uma  relação  de  clientela,  o  que  é 
tipificado  por  aqueles  clientes  de  longo  prazo.  Três  grupos 
de  clientela  foram  formados  -  menos  de  1  ano,  de  1  a  5 
anos,  e  mais  de  5  anos  -  e  as  percepções  quanto  à  HBAT 
foram  medidas  sobre  13  variáveis.  A  análise  produziu  di¬ 
versas  descobertas  importantes,  tanto  em  termos  dos  tipos 
de  variáveis  que  distinguiam  entre  os  grupos  quanto  nos 
padrões  de  mudanças  ao  longo  do  tempo: 


•  Primeiro,  há  duas  dimensões  de  discriminação  entre  os 
três  grupos  de  clientes.  A  primeira  dimensão  é  tipificada 
por  elevadas  percepções  de  serviço  aos  clientes  (Solu¬ 
ção  de  reclamação.  Velocidade  de  entrega  e  Encomen¬ 
da  e  cobrança),  juntamente  com  Linha  do  produto  e 
Flexibilidade  de  preço.  Em  contraste,  a  segunda  dimen¬ 
são  é  caracterizada  somente  em  termos  de  Qualidade 
do  produto. 

•  O  perfil  dos  três  grupos  quanto  a  essas  duas  dimensões 
e  variáveis  associadas  com  cada  dimensão  permite  à 
gerência  compreender  as  diferenças  perceptuais  entre 
eles. 

•  O  grupo  1,  clientes  há  menos  de  1  ano,  geralmente 
tem  as  menores  percepções  da  HBAT.  Para  as 
três  variáveis  de  serviço  à  clientela  (Solução  de 
reclamação.  Encomenda  e  cobrança,  e  Velocidade 
de  entrega),  esses  clientes  têm  percepções  menores 
do  que  em  qualquer  outro  grupo.  Para  Qualidade 
de  produto.  Linha  de  produto  e  Preço  competitivo, 
este  grupo  é  comparável  com  o  2  (de  1  a  5  anos),  mas 
ainda  tem  percepções  menores  do  que  clientes  há 
mais  de  5  anos.  Somente  para  Flexibilidade  de  preço 
este  grupo  é  comparável  com  os  clientes  mais  antigos 
e  ambos  têm  valores  menores  do  que  os  clientes  de 
1  a  5  anos.  No  geral,  as  percepções  desses  clientes 
mais  recentes  seguem  o  padrão  esperado  de  serem 
menores  do  que  outros  da  clientela,  mas  é  esperado 
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que  melhorem  à  medida  que  permanecerem  clientes 
ao  longo  do  tempo. 

•  O  grupo  2,  clientes  de  1  a  5  anos,  tem  semelhanças 
com  os  clientes  mais  novos  e  os  mais  antigos. 

Quanto  às  três  variáveis  de  serviço  à  clientela,  eles 
são  comparáveis  ao  grupo  3  (mais  de  5  anos).  Para 
Qualidade  de  produto.  Linha  de  produto  e  Preço 
competitivo,  suas  percepções  são  mais  comparáveis 
com  as  dos  clientes  mais  novos  (e  menores  do  que 
as  dos  clientes  mais  antigos).  Eles  mantêm  as  mais 
elevadas  percepções,  dos  três  grupos,  quanto  à 
Flexibilidade  de  preço. 

•  Q  grupo  3,  representando  os  clientes  há  mais  de  5 
anos,  tem  as  mais  favoráveis  percepções  da  HBAT, 
como  o  esperado.  Apesar  de  serem  comparáveis 
aos  clientes  do  grupo  2  quanto  às  três  variáveis  de 
serviço  à  clientela  (com  ambos  os  grupos  maiores  do 
que  o  grupo  1),  eles  são  significantemente  maiores 
que  os  clientes  nos  outros  dois  grupos  em  termos 

de  Qualidade  de  produto.  Linha  de  produto  e 
Preço  competitivo.  Assim,  este  grupo  representa 
aqueles  clientes  que  têm  percepções  positivas  e 
têm  progredido  no  estabelecimento  de  uma  relação 
cliente/HBAT  através  de  um  fortalecimento  de  suas 
percepções. 

•  Usando  os  três  grupos  como  indicadores  no  desenvolvi¬ 
mento  de  relações  de  clientela,  podemos  identificar  dois 
estágios  nos  quais  as  percepções  HBAT  mudam  nesse 
processo  de  desenvolvimento: 

•  Estágio  1:  O  primeiro  conjunto  de  percepções  a 
mudar  é  aquele  relacionado  a  serviços  a  clientes 
(visto  nas  diferenças  entre  os  grupos  1  e  2).  Este 
estágio  refiete  a  habilidade  da  HBAT  de  afetar 
positivamente  percepções  com  operações  relativas  a 
serviços. 

•  Estágio  2:  Um  desenvolvimento  de  maior  prazo  é 
necessário  para  promover  melhoras  em  elementos 
mais  centrais  (Qualidade  de  produto.  Linha  de 
produto  e  Preço  competitivo).  Quando  ocorrem 
essas  mudanças,  o  cliente  deve  se  tornar  mais 
comprometido  com  a  relação,  como  se  evidencia  por 
uma  longa  permanência  com  a  HBAT. 

•  Deve  ser  observado  que  existe  evidência  de  que  vários 
clientes  fazem  a  transição  através  do  estágio  2  mais  ra¬ 
pidamente  do  que  os  cinco  anos,  como  mostrado  pelo 
considerável  número  de  clientes  que  têm  sido  do  grupo 
entre  1  e  5  anos,  ainda  que  mantenham  as  mesmas  per¬ 
cepções  da  clientela  mais  antiga.  Assim,  HBAT  pode 
esperar  que  certos  clientes  possam  se  deslocar  através 
desse  processo  muito  rapidamente,  e  uma  análise  mais 
detalhada  sobre  tais  clientes  pode  identificar  caracte¬ 
rísticas  que  facilitam  o  desenvolvimento  de  relações 
com  a  clientela. 


Assim,  o  gerenciamento  leva  em  conta  um  input  para 
planejamento  estratégico  e  tático  não  apenas  dos  resul¬ 
tados  diretos  da  análise  discriminante,  mas  também  dos 
erros  de  classificação. 


REGRESSÃO  LOGÍSTICA: 

REGRESSÃO  COM  UMA  VARIÃVEL 
DEPENDENTE  BINÃRIA 

Como  discutimos,  a  análise  discriminante  é  apropriada 
quando  a  variável  dependente  é  não-métrica.  No  entanto, 
quando  a  variável  dependente  tem  apenas  dois  grupos,  a 
regressão  logística  pode  ser  preferida  por  duas  razões: 

•  A  análise  discriminante  depende  estritamente  de  se  atende¬ 
rem  as  suposições  de  normalidade  multivariada  e  de  igual¬ 
dade  entre  as  matrizes  de  variância-covariância  nos  grupos 
-  suposições  que  não  são  atendidas  em  muitas  situações.  A 
regressão  logística  não  depende  dessas  suposições  rígidas  e 
é  muito  mais  robusta  quando  tais  pressupostos  não  são  sa¬ 
tisfeitos,  o  que  torna  sua  aplicação  apropriada  em  muitas 
situações. 

•  Mesmo  quando  os  pressupostos  são  satisfeitos,  muitos  pes¬ 
quisadores  preferem  a  regressão  logística  por  ser  similar  à 
regressão  múltipla.  Ela  tem  testes  estatísticos  diretos,  tra¬ 
tamentos  similares  para  incorporar  variáveis  métricas  e 
não-métricas  e  efeitos  não-lineares,  e  uma  vasta  gama  de 
diagnósticos. 

Por  essas  e  outras  razões  mais  técnicas,  a  regressão  lo¬ 
gística  é  equivalente  à  análise  discriminante  de  dois  gru¬ 
pos  e  pode  ser  mais  adequada  em  muitas  situações. 

Nossa  discussão  de  regressão  logística  não  cobre  cada 
um  dos  seis  passos  do  processo  de  decisão,  mas  destaca  as 
diferenças  e  semelhanças  entre  a  regressão  logística  e  a 
análise  discriminante  ou  a  regressão  múltipla.  Para  uma 
revisão  completa  de  regressão  múltipla,  ver  o  Capítulo  4. 

Representação  da  variável  dependente  binária 

Em  análise  discriminante,  o  caráter  não-métrico  de  uma 
variável  dependente  dicotômica  é  acomodado  fazendo-se 
previsões  de  pertinência  a  grupo  baseadas  em  escores  Z 
discriminantes.  Isso  requer  o  cálculo  de  escores  de  corte  e 
a  designação  de  observações  a  grupos. 

A  regressão  logística  aborda  essa  tarefa  de  uma  ma¬ 
neira  mais  semelhante  à  encontrada  em  regressão  múlti¬ 
pla.  Regressão  logística  representa  os  dois  grupos  de  inte¬ 
resse  como  uma  variável  binária  com  valores  de  0  e  1.  Não 
importa  qual  grupo  é  designado  com  o  valor  de  1  versus 
0,  mas  tal  designação  deve  ser  observada  para  a  interpre¬ 
tação  dos  coeficientes. 

•  Se  os  grupos  representam  características  (p.ex.,  sexo),  então 
um  grupo  pode  ser  designado  com  o  valor  1  (p.ex.,  femini¬ 
no)  e  o  outro  grupo  com  o  valor  0  (p.ex.,  masculino).  Em  tal 
situação,  os  coeficientes  refletiriam  o  impacto  das  variáveis 
independentes  sobre  a  probabilidade  da  pessoa  ser  do  sexo 
feminino  (ou  seja,  o  grupo  codificado  como  1). 

•  Se  os  grupos  representam  resultados  ou  eventos  (p.ex.,  su¬ 
cesso  ou  fracasso,  compra  ou  não-compra),  a  designação  dos 
códigos  de  grupos  causa  impacto  na  interpretação  também. 
Considere  que  o  grupo  com  sucesso  é  codificado  como  1,  e 
aquele  com  fracasso,  como  0.  Então,  os  coeficientes  repre- 
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sentam  os  impactos  sobre  a  probabilidade  de  sucesso.  De 
maneira  igualmente  fácil,  os  códigos  poderiam  ser  inverti¬ 
dos  (1  agora  denota  fracasso)  e  os  coeficientes  representa¬ 
riam  as  forças  que  aumentam  a  probabilidade  de  fracasso. 

A  regressão  logística  difere  da  regressão  múltipla,  con¬ 
tudo,  no  sentido  de  que  ela  foi  especificamente  elaborada 
para  prever  a  probabilidade  de  um  evento  ocorrer  (ou  seja,  a 
probabilidade  de  uma  observação  estar  no  grupo  codificado 
como  1).  Apesar  de  os  valores  de  probabilidade  serem  me¬ 
didas  métricas,  há  diferenças  fundamentais  entre  regressão 
múltipla  e  logística. 

Uso  da  curva  logística 

Como  a  variável  dependente  tem  apenas  os  valores  0  e  1,  o 
valor  previsto  (probabilidade)  deve  ser  limitado  para  cair 
dentro  do  mesmo  domínio.  Para  definir  uma  relação  limi¬ 
tada  por  0  e  1,  a  regressão  logística  usa  a  curva  logística 
para  representar  a  relação  entre  as  variáveis  independen¬ 
tes  e  dependente  (ver  Figura  5-11).  Em  níveis  muito  bai¬ 
xos  da  variável  independente,  a  probabilidade  se  aproxima 
de  0,  mas  nunca  alcança  tal  valor.  Analogamente,  quan¬ 
do  a  variável  independente  aumenta,  os  valores  previstos 
crescem  para  acima  da  curva,  mas  em  seguida  a  inclina¬ 
ção  começa  a  diminuir  de  modo  que  em  qualquer  nível  da 
variável  independente  a  probabilidade  se  aproximará  de 
1,0,  mas  jamais  excederá  tal  valor.  Como  vimos  em  nos¬ 
sas  discussões  sobre  regressão,  no  Capítulo  4,  os  modelos 
lineares  de  regressão  não  podem  acomodar  tal  relação,  já 
que  ela  é  inerentemente  não-linear.  A  relação  linear  de  re¬ 
gressão,  mesmo  com  termos  adicionais  de  transformações 
para  efeitos  não-lineares,  não  pode  garantir  que  os  valores 
previstos  permaneçam  no  intervalo  de  0  a  1. 

Natureza  única  da  variável  dependente 

A  natureza  binária  da  variável  dependente  (0  ou  1)  tem 
propriedades  que  violam  as  suposições  da  regressão  múl¬ 
tipla.  Primeiro,  o  termo  de  erro  de  uma  variável  discreta 
segue  a  distribuição  binomial  ao  invés  da  normal,  invali¬ 
dando  assim  todos  os  testes  estatísticos  que  se  sustentam 


nas  suposições  de  normalidade.  Segundo,  a  variância  de 
uma  variável  dicotômica  não  é  constante,  criando  casos 
de  heteroscedasticidade  também.  Além  disso,  nenhuma 
violação  pode  ser  remediada  por  meio  de  transformações 
das  variáveis  dependente  ou  independentes. 

A  regressão  logística  foi  desenvolvida  para  lidar  espe¬ 
cificamente  com  essas  questões.  Não  obstante,  sua  relação 
única  entre  variáveis  dependente  e  independentes  exige 
uma  abordagem  um  tanto  diferente  para  estimar  a  variá¬ 
vel  estatística,  avaliar  adequação  de  ajuste  e  interpretar  os 
coeficientes,  quando  comparada  com  regressão  múltipla. 

Estimação  do  modelo  de  regressão  logística 

A  regressão  logística  tem  uma  única  variável  estatística 
composta  de  coeficientes  estimados  para  cada  variável 
independente  -  como  na  regressão  múltipla.  Tal  variável 
estatística  é  estimada  de  uma  maneira  diferente.  A  regres¬ 
são  logística  deriva  seu  nome  da  transformação  logit  usa¬ 
da  com  a  variável  dependente,  criando  diversas  diferenças 
no  processo  de  estimação  (bem  como  o  processo  de  inter¬ 
pretação  discutido  na  próxima  seção). 

Transformação  da  variável  dependente 

Como  mostrado  anteriormente,  o  modelo  logit  usa  a  for¬ 
ma  específica  da  curva  logística,  que  é  em  forma  de  S  para 
ficar  no  domínio  de  0  a  1.  Para  estimar  um  modelo  de  re¬ 
gressão  logística,  essa  curva  de  valores  previstos  é  ajustada 
aos  dados  reais,  exatamente  como  foi  feito  com  uma  rela¬ 
ção  linear  em  regressão  múltipla.  No  entanto,  como  os  va¬ 
lores  reais  dos  dados  das  variáveis  dependentes  podem  ser 
somente  0  ou  1,  o  processo  é  de  algum  modo  diferente. 


A  Figura  5-12  retrata  dois  exemplos  hipotéticos  de  ajus¬ 
te  de  uma  relação  logística  aos  dados  da  amostra.  Os 
dados  reais  representam  se  um  evento  acontece  ou  não 
designando  valores  1  ou  0  aos  resultados  (neste  caso  1  é 
designado  quando  o  evento  ocorreu,  0  no  caso  contrário, 
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FIGURA  5-1 1  Forma  da  relação  logística  entre  variáveis  dependente  e  independentes. 
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mas  tal  atribuição  poderia  facilmente  ser  invertida).  Ob¬ 
servações  são  representadas  pelos  pontos  no  topo  ou  na 
base  do  gráfico.  Esses  resultados  (que  aconteceram  ou 
não)  ocorrem  em  cada  valor  da  variável  independente  (o 
eixo  X).  Na  parte  (a),  a  curva  logística  não  pode  ajustar 
bem  os  dados  porque  há  diversos  valores  da  variável  in¬ 
dependente  que  têm  ambos  os  resultados  (1  e  0).  Neste 
caso,  a  variável  independente  não  distingue  entre  os  dois 
resultados,  como  se  mostra  na  considerável  sobreposi¬ 
ção  dos  dois  grupos. 

No  entanto,  na  parte  (b),  uma  relação  muito  melhor 
definida  está  baseada  na  variável  independente.  Valores 
menores  da  variável  independente  correspondem  às  ob¬ 
servações  com  0  para  a  variável  dependente,  enquanto 
valores  maiores  correspondem  bem  àquelas  observações 
com  um  valor  1  sobre  a  variável  dependente.  Assim,  a 
curva  logística  deve  ser  capaz  de  ajustar  bem  os  dados. 


Mas  como  prevemos  pertinência  a  grupo  a  partir  da 
curva  logística?  Para  cada  observação,  a  técnica  de  regres¬ 
são  logística  prevê  um  valor  de  probabilidade  entre  0  e 
1.  O  gráfico  dos  valores  previstos  para  todos  os  valores 
da  variável  independente  gera  a  curva  exibida  na  Figura 
5-12.  Tal  probabilidade  prevista  é  baseada  nos  valores  das 
variáveis  independentes  e  nos  coeficientes  estimados.  Se  a 
probabilidade  prevista  é  maior  do  que  0,50,  então  a  pre¬ 
visão  é  de  que  o  resultado  seja  1  (o  evento  ocorreu);  caso 
contrário,  o  resultado  é  previsto  como  sendo  0  (o  even¬ 
to  não  ocorreu).  Retornemos  ao  nosso  exemplo  para  ver 
como  isso  funciona. 


Nas  partes  (a)  e  (b)  da  Figura  5-12,  um  valor  de  6,0  para 
X  (a  variável  independente)  corresponde  a  uma  proba¬ 
bilidade  de  0,50.  Na  parte  (a),  podemos  ver  que  diversas 
observações  de  ambos  os  grupos  recaem  em  ambos  os 
lados  deste  valor,  resultando  em  diversas  classificações 

(Continua) 


FIGURA  5-12  Exemplos  de  ajuste  da  curva  logística  aos  dados  da  amostra. 
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{Conlimmção) 

ruins.  As  classificações  ruins  são  mais  perceptíveis  para 
o  grupo  com  valores  1,0,  ainda  que  diversas  observações 
no  outro  grupo  (variável  dependente  =  0,0)  também  se¬ 
jam  mal  classificadas.  Na  parte  (b),  fazemos  classificação 
perfeita  dos  dois  grupos  quando  usamos  o  valor  de  pro¬ 
babilidade  de  0,50  como  valor  de  corte. 


Logo,  com  uma  curva  logística  estimada,  podemos  es¬ 
timar  a  probabilidade  para  qualquer  observação  com  base 
em  seus  valores  para  as  variáveis  independentes  e  então 
prever  a  pertinência  a  grupo  usando  0,50  como  valor  de 
corte.  Uma  vez  que  temos  a  pertinência  prevista,  podemos 
criar  uma  matriz  de  classificação  exatamente  como  foi  fei¬ 
to  em  análise  discriminante  e  avaliar  a  precisão  preditiva. 

Estimação  dos  coeficientes 

De  onde  vem  a  curva?  Em  regressão  múltipla,  estimamos 
uma  relação  linear  que  melhor  ajusta  os  dados.  Em  re¬ 
gressão  logística,  seguimos  o  mesmo  processo  de  previ¬ 
são  da  variável  dependente  por  uma  variável  estatística 
composta  dos  coeficientes  logísticos  e  as  correspondentes 
variáveis  independentes.  No  entanto,  o  que  difere  é  que 
em  regressão  logística  os  valores  previstos  jamais  podem 
estar  fora  do  domínio  de  0  a  1.  Apesar  de  uma  discussão 
completa  sobre  os  aspectos  conceituais  e  estatísticos  en¬ 
volvidos  no  processo  de  estimação  estar  além  do  escopo 
deste  texto,  diversas  fontes  excelentes  com  tratamentos 
completos  sobre  tais  aspectos  estão  disponíveis  [3,15,17]. 
Podemos  descrever  o  processo  de  estimação  em  dois  pas¬ 
sos  básicos  à  medida  que  introduzimos  alguns  termos  co¬ 
muns  e  fornecemos  uma  breve  visão  geral  do  processo. 

Transformação  de  nma  probabilidade  em  razão  de  desi- 
gnaldade  e  valores  logit.  Como  na  regressão  múltipla,  a 
regressão  logística  prevê  uma  variável  dependente  métri¬ 
ca,  neste  caso  valores  de  probabilidade  restritos  ao  domí¬ 
nio  entre  0  e  1.  Mas  como  podemos  garantir  que  valores 
estimados  não  recaiam  fora  desse  domínio?  A  transfor¬ 
mação  logística  perfaz  este  processo  em  dois  passos. 

Reestabelecimento  de  uma  probabilidade  como  ra¬ 
zão  de  desigualdades.  Em  sua  forma  original,  probabi¬ 
lidades  não  são  restritas  a  valores  entre  0  e  1.  Portanto,  o 
que  aconteceria  se  reestabelecêssemos  a  probabilidade  de 
uma  maneira  que  a  nova  variável  sempre  ficasse  entre  0 
e  1?  Fazemos  isso  expressando  uma  probabilidade  como 
razão  de  desigualdades  -  a  razão  entre  as  probabilidades 
dos  dois  resultados  ou  eventos,  Prob,  /(i  -  Prob,).  Desta 
forma,  qualquer  valor  de  probabilidade  é  agora  dado  em 
uma  variável  métrica  que  pode  ser  diretamente  estima¬ 
da.  Qualquer  razão  de  desigualdade  pode  ser  convertida 
reciprocamente  em  uma  probabilidade  que  fica  entre  0  e 
1.  Resolvemos  nosso  problema  de  restrição  dos  valores 
previstos  entre  0  e  1  prevendo  a  razão  de  desigualdades  e 
então  convertendo  a  mesma  em  uma  probabilidade. 


Usemos  alguns  exemplos  da  probabilidade  de  sucesso 
ou  fracasso  para  ilustrar  como  a  razão  de  desigualdades 
é  calculada.  Se  a  probabilidade  de  sucesso  é  0,80,  então 
sabemos  também  que  a  probabilidade  do  resultado  alter¬ 
nativo  (ou  seja,  o  fracasso)  é  0,20  (0,20  =  f  ,0  -  0,80).  Esta 
probabilidade  significa  que  as  desigualdades  de  sucesso 
são  4,0  (0,80/0,20),  ou  que  o  sucesso  é  quatro  vezes  mais 
provável  de  acontecer  do  que  o  fracasso.  Reciprocamen¬ 
te,  podemos  estabelecer  as  desigualdades  de  fracasso 
como  0,25  (0,20/0,80),  ou,  em  outras  palavras,  o  fracasso 
acontece  a  um  quarto  da  taxa  de  sucesso.  Assim,  qual¬ 
quer  que  seja  o  resultado  que  busquemos  (sucesso  ou 
fracasso),  podemos  estabelecer  a  probabilidade  como 
uma  chance  ou  uma  razão  de  desigualdades. 


Como  você  provavelmente  já  desconfiou,  uma  proba¬ 
bilidade  de  0,50  resulta  em  razão  de  desigualdades  de  1,0 
(ambos  os  resultados  têm  iguais  chances  de  ocorrerem). 
Razão  de  desigualdades  inferior  a  1,0  representa  proba¬ 
bilidades  menores  do  que  0,50,  e  razão  de  desigualdades 
maior  do  que  1,0  corresponde  a  uma  probabilidade  maior 
do  que  0,50.  Agora  temos  uma  variável  métrica  que  sem¬ 
pre  pode  ser  convertida  de  volta  a  uma  probabilidade  en¬ 
tre  0  e  1. 

Cálculo  do  valor  logit.  A  variável  de  razão  de  desi¬ 
gualdades  resolve  o  problema  de  fazer  estimativas  de  pro¬ 
babilidade  entre  0  e  1,  mas  temos  outro  problema:  como 
fazemos  com  que  as  razões  de  desigualdades  fiquem  abai¬ 
xo  de  0,  que  é  o  limite  inferior  (não  há  limite  superior). 
A  solução  é  computar  aquilo  que  é  chamado  de  valor  lo¬ 
git  -  calculado  via  logaritmo  das  razões  de  desigualdades. 
Razões  menores  que  1,0  têm  um  logit  negativo,  razões 
maiores  que  1,0  têm  valores  logit  positivos,  e  a  razão  de 
desigualdades  igual  a  1,0  (correspondente  a  uma  proba¬ 
bilidade  de  0,5)  tem  um  valor  logit  de  0.  Além  disso,  não 
importa  o  quão  baixo  o  valor  negativo  fique,  ele  ainda 
pode  ser  transformado  tomando-se  o  anti-logaritmo  em 
uma  razão  de  desigualdades  maior  que  0.  O  que  se  segue 
mostra  alguns  valores  típicos  de  probabilidade  e  as  razões 
de  desigualdades  correspondentes,  bem  como  valores  lo¬ 
garítmicos. 


Probabilidade 

Razão  de 
desigualdades 

Logaritmo 

(Logit) 

0,00 

0,00 

NC 

0,10 

0,111 

-2,197 

0,30 

0,428 

-0,847 

0,50 

1,000 

0,000 

0,70 

2,333 

0,847 

0,90 

9,000 

2,197 

1,00 

NC 

NC 

NC  =  Não  pode  ser  calculado 
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Com  o  valor  logit,  agora  temos  uma  variável  métrica 
que  pode  ter  valores  positivos  e  negativos,  mas  que  sem¬ 
pre  pode  ser  transformada  de  volta  em  um  valor  de  pro¬ 
babilidade  entre  0  e  1.  Observe,  no  entanto,  que  o  logit 
jamais  pode  realmente  alcançar  0  ou  1.  Esse  valor  agora 
se  torna  a  variável  dependente  do  modelo  de  regressão 
logística. 

Estimação  do  modelo.  Uma  vez  que  compreendemos 
como  interpretar  os  valores  das  razões  de  desigualdades 
ou  das  medidas  logit,  podemos  proceder  com  o  uso  delas 
como  medida  dependente  em  nossa  regressão  logística. 
O  processo  de  estimação  dos  coeficientes  logísticos  é  se¬ 
melhante  àquele  usado  em  regressão,  apesar  de  que  nes¬ 
te  caso  somente  dois  valores  reais  são  empregados  para 
a  variável  dependente  (0  e  1).  Além  do  mais,  em  vez  de 
usar  os  mínimos  quadrados  ordinários  como  meio  para 
estimar  o  modelo,  o  método  de  verossimilhança  máxima 
é  utilizado. 


Estimação  dos  coeficientes.  Os  coeficientes  esti¬ 
mados  para  as  variáveis  independentes  são  estimados 
usando-se  o  valor  logit  ou  a  razão  de  desigualdades  como 
medida  dependente.  Cada  uma  dessas  formulações  de 
modelo  é  exibida  aqui: 


Logit  =  In 


^  prob  .  ^ 

-í  evento 


=  b  +bX  +...  +  b  X 

0  11  n  n 


OU 


Razão  de  desigualdades.  = 


P^04ven.o 
.l-PÍ^O&evcnto  , 


=  e 


+b^X^+---+b^X^ 


Ambas  as  formulações  de  modelo  são  equivalentes, 
mas  aquela  que  for  escolhida  afetará  a  estimação  dos  co¬ 
eficientes.  Muitos  programas  de  computador  fornecem 
os  coeficientes  logísticos  em  ambas  as  formas,  de  modo 
que  o  pesquisador  deve  entender  como  interpretar  cada 
forma.  Discutimos  aspectos  interpretativos  em  uma  seção 
posterior. 

Este  processo  pode  acomodar  uma  ou  mais  variáveis 
independentes,  e  estas  podem  ser  métricas  ou  não-métri- 
cas  (binárias).  Como  vemos  adiante  em  nossa  discussão 
sobre  interpretação  dos  coeficientes,  ambas  as  formas  dos 
mesmos  refletem  a  direção  e  a  magnitude  da  relação,  mas 
são  interpretadas  de  maneiras  distintas. 


Uso  da  máxima  verossimilhança  para  estima¬ 
ção.  Regressão  múltipla  emprega  o  método  de  mínimos 
quadrados,  que  minimiza  a  soma  das  diferenças  quadradas 
entre  os  valores  reais  e  previstos  da  variável  dependente. 
A  natureza  não-linear  da  transformação  logística  requer 
que  outro  procedimento,  o  da  máxima  verossimilhança. 


seja  usado  de  maneira  iterativa  para  que  se  encontrem  as 
estimativas  mais  prováveis  para  os  coeficientes.  No  lugar 
de  minimizar  os  desvios  quadrados  (mínimos  quadrados), 
a  regressão  logística  maximiza  a  probabilidade  de  que 
um  evento  ocorra.  O  valor  de  probabilidade,  ao  invés  da 
soma  de  quadrados,  é  em  seguida  usado  quando  se  calcula 
uma  medida  de  ajuste  geral  do  modelo.  Usar  esta  técnica 
alternativa  de  estimação  também  demanda  que  avaliemos 
o  ajuste  do  modelo  de  diferentes  maneiras. 

Avaliação  da  qualidade  do  ajuste 
do  modelo  de  estimação 

A  qualidade  de  ajuste  para  um  modelo  de  regressão  lo¬ 
gística  pode  ser  avaliada  de  duas  maneiras.  Uma  é  a  ava¬ 
liação  de  ajuste  usando  valores  “pseudo”  R^,  semelhantes 
àqueles  encontrados  em  regressão  múltipla.  A  segunda 
abordagem  é  examinar  precisão  preditiva  (como  a  matriz 
de  classificação  em  análise  discriminante).  As  duas  técni¬ 
cas  examinam  ajuste  de  modelo  sob  diferentes  perspecti¬ 
vas,  mas  devem  conduzir  a  conclusões  semelhantes. 

Ajuste  de  estimação  do  modelo 

A  medida  básica  do  quão  bem  o  procedimento  de  esti¬ 
mação  de  máxima  verossimilhança  se  ajusta  é  o  valor  de 
verossimilhança,  semelhante  aos  valores  das  somas  de 
quadrados  usadas  em  regressão  múltipla.  Regressão  logís¬ 
tica  mede  o  ajuste  da  estimação  do  modelo  com  o  valor  -2 
vezes  o  logaritmo  do  valor  da  verossimilhança,  chamado 
de  -2LL  ou  -21og  verossimilhança.  O  valor  mínimo  para 
-2LL  é  0,  o  que  corresponde  a  um  ajuste  perfeito  (veros¬ 
similhança  =  1  e  -2LL  é  então  0).  Assim,  quanto  menor 
o  valor  -2LL,  melhor  o  ajuste  do  modelo.  Como  será  dis¬ 
cutido  na  próxima  seção,  o  valor  -2LL  pode  ser  usado 
para  comparar  equações  quanto  à  variação  no  ajuste  ou 
ser  utilizado  para  calcular  medidas  comparáveis  ao  em 
regressão  múltipla. 

Entre  comparações  de  modelos.  O  valor  de  verossimi¬ 
lhança  pode  ser  comparado  entre  equações  para  avaliar  a 
diferença  em  ajuste  preditivo  de  uma  equação  para  outra, 
com  testes  estatísticos  para  a  significância  dessas  diferen¬ 
ças.  O  método  básico  segue  três  passos: 

1.  Estimar  um  modelo  nulo.  O  primeiro  passo  é  calcular  um 
modelo  nulo,  que  atua  como  a  referência  para  fazer  com¬ 
parações  de  melhoramento  no  ajuste  do  modelo.  O  modelo 
nulo  mais  comum  é  um  sem  variáveis  independentes,  que 
é  semelhante  a  calcular  a  soma  total  de  quadrados  usando 
somente  a  média  em  regressão  múltipla.  A  lógica  por  trás 
desta  forma  de  modelo  nulo  é  que  ele  pode  atuar  como  uma 
referência  em  relação  à  qual  qualquer  modelo  contendo  va¬ 
riáveis  independentes  pode  ser  comparado. 

2.  Estimar  o  modelo  proposto.  Este  modelo  contém  as  variá¬ 
veis  independentes  a  serem  incluídas  no  modelo  de  regres¬ 
são  logística.  Espera-se  que  o  ajuste  melhorará  em  relação 
ao  modelo  nulo  e  que  resulte  em  um  valor  menor  de  -2LL. 
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Qualquer  número  de  modelos  propostos  pode  ser  estimado 
(p.ex.,  modelos  com  uma,  duas  e  três  variáveis  independen¬ 
tes  podem  ser  propostas  distintas). 

3.  Avaliar  a  diferença  -2LL.  O  passo  final  é  avaliar  a  signifi- 
cância  estatística  do  valor  -2LL  entre  os  dois  modelos  (nulo 
versus  proposto).  Se  os  testes  estatísticos  suportam  diferen¬ 
ças  significantes,  então  podemos  estabelecer  que  o  conjunto 
de  variáveis  independentes  no  modelo  proposto  é  signifi- 
cante  na  melhora  do  ajuste  da  estimação  do  mesmo. 

De  maneira  semelhante,  comparações  também  po¬ 
dem  ser  feitas  entre  dois  modelos  propostos  quaisquer. 
Em  tais  casos,  a  diferença  -2LL  reflete  a  diferença  em 
ajuste  de  modelo  devido  a  distinções  de  especificações. 
Por  exemplo,  um  modelo  com  duas  variáveis  indepen¬ 
dentes  pode  ser  comparado  com  um  modelo  de  três  va¬ 
riáveis  independentes  para  que  se  avalie  a  melhora  pelo 
acréscimo  de  uma  variável.  Nesses  casos,  um  modelo  é 
escolhido  para  atuar  como  nulo  e  então  é  comparado 
com  outro. 


Por  exemplo,  considere  que  queremos  testar  a  signifi- 
cância  de  um  conjunto  de  variáveis  independentes  cole¬ 
tivamente  para  ver  se  elas  melhoram  o  ajuste  do  modelo. 
O  modelo  nulo  seria  especificado  como  um  modelo  sem 
essas  variáveis,  e  o  modelo  proposto  incluiria  as  variá¬ 
veis  a  serem  avaliadas.  A  diferença  em  -2LL  significaria 
a  melhora  a  partir  do  conjunto  de  variáveis  independen¬ 
tes.  Poderíamos  fazer  testes  similares  das  diferenças  em 
-ILL  entre  outros  pares  de  modelos  variando  o  número 
de  variáveis  independentes  incluídas  em  cada  um. 


O  teste  do  qui-quadrado  e  o  teste  associado  para  sig- 
nificância  estatística  são  usados  para  se  avaliar  a  redução 
no  logaritmo  do  valor  de  verossimilhança.  No  entanto, 
esses  testes  estatísticos  são  particularmente  sensíveis  a  ta¬ 
manho  de  amostra  (para  amostras  pequenas  é  mais  difícil 
mostrar  significância  estatística,  e  vice-versa  para  grandes 
amostras).  Portanto,  pesquisadores  devem  ser  particular¬ 
mente  cuidadosos  ao  tirarem  conclusões  com  base  apenas 
na  significância  do  teste  do  qui-quadrado  em  regressão 
logística. 


Exatamente  como  na  contraparte  da  regressão  múl¬ 
tipla,  o  valor  logit  varia  de  0,0  a  1,0.  À  medida  que  o 
modelo  proposto  aumenta  o  ajuste,  o  -2LL  diminui.  Um 
ajuste  perfeito  tem  um  valor  de  -2LL  igual  a  0,0  e  um 

^  LOGIT 

Duas  outras  medidas  são  semelhantes  ao  valor  pseudo 

e  são  geralmente  categorizadas  também  como  medidas 
pseudo  A  medida  de  Cox  e  Snell  opera  do  mes¬ 
mo  modo,  com  valores  maiores  indicando  maior  ajuste  do 
modelo.  No  entanto,  esta  medida  é  limitada  no  sentido  de 
que  não  pode  atingir  o  valor  máximo  de  1,  de  forma  que 
Nagelkerke  propôs  uma  modificação  que  tinha  o  domínio 
de  0  a  1.  Essas  duas  medidas  adicionais  são  interpretadas 
como  refletindo  a  quantia  de  variação  explicada  pelo  mo¬ 
delo  logístico,  com  1,0  indicando  ajuste  perfeito. 

Uma  comparação  com  regressão  múltipla.  Ao  discutir 
os  procedimentos  para  avaliação  de  ajuste  de  modelo  em 
regressão  logística,  fazemos  várias  referências  a  similari¬ 
dades  com  regressão  múltipla  em  termos  de  diversas  me¬ 
didas  de  ajuste.  Na  tabela  a  seguir,  mostramos  a  corres¬ 
pondência  entre  conceitos  usados  em  regressão  múltipla  e 
suas  contrapartes  em  regressão  logística. 


Correspondência  de  elementos  primários  de 
ajuste  de  modelo 


Regressão  múltipla 
Soma  total  de  quadrados 
Soma  de  quadrados  do  erro 
Soma  de  quadrados  da 
regressão 

Teste  f  de  ajuste  de  mo¬ 
delo 

Coeficiente  de  determina¬ 
ção  (R^) 


Regressão  logística 
-2LL  do  modelo  base 
-2LL  do  modelo  proposto 
Diferença  de  -LL*  para 
modelos  base  e  proposto 
Teste  de  qui-quadrado  da 
diferença  -2LL 
Medidas  pseudo 


Como  podemos  ver,  os  conceitos  de  regressão  múltipla 
e  regressão  logística  são  semelhantes.  Os  métodos  básicos 
para  testar  ajuste  geral  do  modelo  são  comparáveis,  com 
as  diferenças  surgindo  dos  métodos  de  estimação  nas  duas 
técnicas. 


Medidas  pseudo  R^  Além  dos  testes  qui-quadrado, 
diversas  medidas  do  tipo  R^  foram  desenvolvidas  e  são 
apresentadas  em  vários  programas  estatísticos  para  repre¬ 
sentarem  ajuste  geral  do  modelo.  Essas  medidas  pseudo 
R^  são  interpretadas  de  uma  maneira  parecida  com  o  co¬ 
eficiente  de  determinação  em  regressão  múltipla.  Um  va¬ 
lor  pseudo  pode  ser  facilmente  obtido  para  regressão 
logística  semelhante  ao  valor  R^  em  análise  de  regressão 
[6].  O  pseudo  B}  para  um  modelo  logit  (R^iogit)  pode  ser 
calculado  como 

,  -2LL  ,  -(-2LL  ^,  ) 

_ _ nulo  ^ _ modelo  ^ 

LOGIT- 

nulo 


Precisão  preditiva 

Assim  como  emprestamos  o  conceito  de  R^  da  regressão 
como  uma  medida  de  ajuste  geral  de  modelo,  podemos  pro¬ 
curar  na  análise  discriminante  a  medida  de  precisão  prediti¬ 
va  geral.  As  duas  técnicas  mais  comuns  são  a  matriz  de  clas¬ 
sificação  e  as  medidas  de  ajuste  baseadas  no  qui-quadrado. 

Matriz  de  classificação.  Esta  técnica  de  matriz  de  classi¬ 
ficação  é  idêntica  àquela  usada  em  análise  discriminante, 
ou  seja,  medir  o  quão  bem  a  pertinência  a  grupo  é  prevista 
e  desenvolver  uma  razão  de  sucesso.  O  caso  da  regressão 


*  N.  de  R.  T.:  A  frase  correta  seria  “Diferença  de  -2LL”. 
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logística  sempre  incluirá  somente  dois  grupos,  mas  todas 
as  medidas  relacionadas  a  chances  (p.ex.,  chance  máxima, 
chance  proporcional  ou  Q  de  Press)  usadas  anteriormente 
são  aplicáveis  aqui  também. 

Medida  baseada  no  quí-quadrado.  Hosmer  e  Lemeshow 
[11]  desenvolveram  um  teste  de  classificação  no  qual  os 
casos  são  primeiramente  divididos  em  aproximadamen¬ 
te  10  classes  iguais.  Em  seguida,  os  números  de  eventos 
reais  e  previstos  são  comparados  em  cada  classe  com  a 
estatística  qui-quadrado.  Esse  teste  fornece  uma  medida 
ampla  de  precisão  preditiva  que  é  baseada  não  no  valor 
de  verossimilhança,  mas  sim  na  real  previsão  da  variável 
dependente.  O  uso  apropriado  desse  teste  requer  um  ta¬ 
manho  de  amostra  de  pelo  menos  50  casos  para  garantir 
que  cada  classe  tenha  pelo  menos  cinco  observações  e  ge¬ 
ralmente  até  mesmo  uma  amostra  maior,  uma  vez  que  o 
número  de  eventos  previstos  nunca  fica  abaixo  de  1.  Além 
disso,  a  estatística  qui-quadrado  é  sensível  a  tamanho  da 
amostra,  permitindo  assim  que  essa  medida  encontre  di¬ 
ferenças  muito  pequenas,  estatisticamente  significantes, 
quando  o  tamanho  da  amostra  se  torna  grande. 

Tipicamente  examinamos  tantas  dessas  medidas  de 
ajuste  de  modelo  quanto  possível.  Espera-se  que  uma  con¬ 
vergência  de  indicações  dessas  medidas  forneça  o  suporte 
necessário  ao  pesquisador  para  a  avaliação  do  ajuste  geral 
do  modelo. 

Teste  da  significância  dos  coeficientes 

A  regressão  logística  testa  hipóteses  sobre  coeficientes  in¬ 
dividuais,  como  se  faz  na  regressão  múltipla.  Em  regressão 
múltipla,  o  teste  estatístico  era  para  ver  se  o  coeficiente  era 
significantemente  diferente  de  0.  Um  coeficiente  nulo  indi¬ 
ca  que  o  mesmo  não  tem  impacto  sobre  a  variável  depen¬ 
dente.  Em  regressão  logística,  usamos  também  um  teste 
estatístico  para  ver  se  o  coeficiente  logístico  é  diferente  de 
0.  Lembre,  contudo,  que  em  regressão  logística  usando  o 
logit  como  medida  dependente,  um  valor  de  0  corresponde 
à  razão  de  desigualdade  de  1,00  ou  uma  probabilidade  de 
0,50  -  valores  que  indicam  que  a  probabilidade  é  igual  para 
cada  grupo  (i.e.,  novamente  nenhum  efeito  da  variável  in¬ 
dependente  sobre  a  previsão  de  pertinência  ao  grupo). 

Em  regressão  múltipla,  o  valor  t  é  utilizado  para  ava¬ 
liar  a  significância  de  cada  coeficiente.  Regressão  logística 
usa  uma  estatística  diferente,  a  estatística  Wald.  Ela  provê 
a  significância  estatística  para  cada  coeficiente  estimado  de 
forma  que  testes  de  hipóteses  podem  ocorrer  exatamente 
como  se  faz  em  regressão  múltipla.  Se  o  coeficiente  logísti¬ 
co  é  estatisticamente  significante,  podemos  interpretá-lo  em 
termos  de  como  o  mesmo  impacta  a  probabilidade  estimada 
e  conseqüentemente  a  previsão  de  pertinência  a  grupo. 

Interpretação  dos  coeficientes 

Uma  das  vantagens  da  regressão  logística  é  que  precisa¬ 
mos  saber  apenas  se  um  evento  (compra  ou  não,  risco  de 


crédito  ou  não,  falência  de  empresa  ou  sucesso)  ocorreu 
ou  não  para  definir  um  valor  dicotômico  como  nossa  va¬ 
riável  dependente.  No  entanto,  quando  analisamos  es¬ 
ses  dados  usando  transformação  logística,  a  regressão  e 
seus  coeficientes  assumem  um  significado  algo  diferente 
daqueles  encontrados  na  regressão  com  uma  variável  de¬ 
pendente  métrica.  Analogamente,  cargas  discriminantes 
de  uma  análise  discriminante  de  dois  grupos  são  interpre¬ 
tadas  diferentemente  a  partir  de  um  coeficiente  logístico. 

A  partir  do  processo  de  estimação  descrito  anterior¬ 
mente,  sabemos  que  os  coeficientes  (Bq,  Sj,  ...,  B^) 
são  na  verdade  medidas  das  variações  na  proporção  das 
probabilidades  (as  razões  de  desigualdades).  No  entanto, 
coeficientes  logísticos  são  difíceis  de  interpretar  em  sua 
forma  original,  pois  eles  são  expressos  em  termos  de  lo¬ 
garitmos  quando  usamos  o  logit  como  a  medida  depen¬ 
dente.  Assim,  a  maioria  dos  programas  de  computador 
fornece  também  um  coeficiente  logístico  exponenciado, 
que  é  apenas  uma  transformação  (anti-logaritmo)  do  co¬ 
eficiente  logístico  original.  Desse  modo,  podemos  usar  os 
coeficientes  logísticos  originais  ou  exponenciados  para  a 
interpretação.  Os  dois  tipos  de  coeficientes  logísticos  dife¬ 
rem  no  sentido  da  relação  da  variável  independente  com 
as  duas  formas  da  dependente,  como  mostrado  aqui: 


Coeficiente  logístico 

Refiete  mudanças  em... 

Original 

Exponenciado 

Logit  (logaritmo  da  razão 
de  desigualdades) 

Razão  de  desigualdades 

Discutimos  na  próxima  seção  como  cada  forma  do 
coeficiente  refiete  direção  e  magnitude  da  relação  da  va¬ 
riável  independente,  mas  requer  diferentes  métodos  de 
interpretação. 

Direção  da  relação 

A  direção  da  relação  (positiva  ou  negativa)  refiete  as  mu¬ 
danças  na  variável  dependente  associadas  com  mudanças 
na  independente.  Uma  relação  positiva  significa  que  um 
aumento  na  variável  independente  é  associado  com  um 
aumento  na  probabilidade  prevista,  e  vice-versa  para  uma 
relação  negativa.  Veremos  que  a  direção  da  relação  é  re- 
fietida  diferentemente  nos  coeficientes  logísticos  original 
e  exponenciado. 

Interpretação  da  direção  de  coeficientes  originais.  O  si¬ 
nal  dos  coeficientes  originais  (positivo  ou  negativo)  indica 
a  direção  da  relação,  como  foi  visto  nos  coeficientes  de 
regressão.  Um  valor  positivo  aumenta  a  probabilidade, 
enquanto  um  negativo  diminui  a  mesma,  pois  os  coefi¬ 
cientes  originais  são  expressos  em  termos  de  valores  logit, 
onde  um  valor  de  0,0  corresponde  a  um  valor  de  razão  de 
desigualdade  de  1,0  e  uma  probabilidade  de  0,50.  Assim, 
números  negativos  são  relativos  a  razões  de  desigualdades 
menores  que  1,0  e  probabilidades  menores  que  0,50. 
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Interpretação  da  direção  de  coeficientes  exponenciados. 

Coeficientes  exponenciados  devem  ser  interpretados  di¬ 
ferentemente,  pois  eles  são  os  logaritmos  dos  coeficientes 
originais.  Considerando  o  logaritmo,  estamos  na  verdade 
estabelecendo  o  coeficiente  exponenciado  em  termos  de 
razões  de  desigualdades,  o  que  significa  que  exponencia¬ 
dos  não  terão  valores  negativos.  Como  o  logaritmo  de  0 
(sem  efeito)  é  1,0,  um  coeficiente  exponenciado  igual  a 
1,0  na  verdade  corresponde  a  uma  relação  sem  direção. 
Assim,  coeficientes  exponenciados  acima  de  1,0  refletem 
uma  relação  positiva,  e  valores  menores  que  1,0  represen¬ 
tam  relações  negativas. 

Um  exemplo  de  interpretação.  Examinemos  um  exem¬ 
plo  simples  para  ver  o  que  queremos  dizer  em  termos  de 
diferenças  entre  as  duas  formas  de  coeficientes  logísticos. 


Se  5,  (o  coeficiente  original)  é  positivo,  sua  transforma¬ 
ção  (exponencial  do  coeficiente)  será  maior  que  1,  o  que 
significa  que  a  razão  de  desigualdade  aumentará  para 
qualquer  variação  positiva  da  variável  independente.  As¬ 
sim,  o  modelo  tem  uma  maior  probabilidade  prevista  de 
ocorrência.  De  modo  semelhante,  se  é  negativo,  o  coe¬ 
ficiente  exponenciado  é  menor  que  um  e  a  razão  de  desi¬ 
gualdades  diminui.  Um  coeficiente  de  zero  se  iguala  a  um 
valor  de  1,0  no  coeficiente  exponenciado,  o  que  resulta 
em  nenhuma  mudança  na  razão  de  desigualdades. 


Uma  discussão  mais  detalhada  da  interpretação  de 
coeficientes,  transformação  logística  e  procedimentos  de 
estimação  pode  ser  encontrada  em  diversos  textos  [11]. 

Magnitude  da  relação 

Para  determinar  quanto  da  probabilidade  mudará  dada 
uma  variação  de  uma  unidade  na  variável  independente, 
o  valor  numérico  do  coeficiente  deve  ser  avaliado.  Exa¬ 
tamente  como  na  regressão  múltipla,  os  coeficientes  para 
variáveis  métricas  e  não-métricas  devem  ser  interpretados 
de  forma  diferenciada,  pois  cada  um  reflete  diferentes  im¬ 
pactos  sobre  a  variável  dependente. 

Interpretação  da  magnitude  de  variáveis  independentes 
métricas.  Para  variáveis  métricas,  a  questão  é:  quanto 
a  probabilidade  estimada  varia  por  conta  de  uma  varia¬ 
ção  unitária  na  variável  independente?  Em  regressão 
múltipla,  sabíamos  que  o  coeficiente  de  regressão  era 
o  coeficiente  angular  da  relação  linear  entre  a  medida 
independente  e  a  dependente.  Um  coeficiente  de  1,35 
indicava  que  a  variável  dependente  aumentava  1,35  uni¬ 
dades  cada  vez  que  a  variável  independente  aumentava 
uma  unidade.  Em  regressão  logística,  sabemos  que  te¬ 
mos  uma  relação  não-linear  limitada  entre  0  e  1,  e  assim 
os  coeficientes  devem  ser  interpretados  de  forma  dife¬ 
rente.  Além  disso,  temos  os  dois  coeficientes  original  e 
exponenciado  para  considerar. 


Coeficientes  logísticos  originais.  Apesar  de  mais 
apropriados  para  determinarem  a  direção  da  relação,  os 
coeficientes  logísticos  originais  são  menos  úteis  na  deter¬ 
minação  da  magnitude  da  relação.  Eles  refletem  a  varia¬ 
ção  no  valor  logit  (logaritmo  da  razão  de  desigualdades), 
uma  unidade  de  medida  particularmente  não  compreen¬ 
sível  na  representação  do  quanto  as  probabilidades  real¬ 
mente  variam. 

Coeficientes  logísticos  exponenciados.  Coeficien¬ 
tes  exponenciados  refletem  diretamente  a  magnitude  da 
variação  no  valor  da  razão  de  desigualdades.  Por  serem 
expoentes,  eles  são  interpretados  de  maneira  ligeiramen¬ 
te  diferente.  Seu  impacto  é  multiplicativo,  o  que  significa 
que  o  efeito  do  coeficiente  não  é  adicionado  à  variável 
dependente  (a  razão  de  desigualdades),  mas  multiplica¬ 
do  para  cada  variação  unitária  na  variável  independente. 
Como  tal,  um  coeficiente  exponenciado  de  1,0  denota 
mudança  nenhuma  (1,0  x  variável  independente  =  mu¬ 
dança  nenhuma).  Este  resultado  corresponde  à  nossa 
discussão  anterior,  onde  coeficientes  exponenciados  me¬ 
nores  que  1,0  refletem  relações  negativas,  enquanto  va¬ 
lores  acima  de  1,0  denotam  relações  positivas. 

Um  exemplo  de  avaliação  da  magnitude  de  variação. 

Talvez  uma  abordagem  mais  fácil  para  determinar  a 
quantia  de  variação  na  probabilidade  a  partir  desses  va¬ 
lores  seja  como  se  segue: 

Mudança  percentual  na  razão  de  desigualdades  = 
(coeficiente  exponenciado^  -  1,0)  x  100 

Os  exemplos  a  seguir  ilustram  como  calcular  a  varia¬ 
ção  de  probabilidade  devido  a  uma  variação  unitária  na 
variável  independente  para  um  domínio  de  coeficientes 
exponenciados: 


Valor 

Coeficiente  expo¬ 
nenciado  (e*, ) 

0,20 

0,50 

1,0 

1,5 

1,7 

e-lfi 

-0,80 

-0,50 

0,0 

0,50 

0,70 

Variação  percentu¬ 
al  na  razão  de  desi¬ 
gualdades 

-80% 

-50% 

0% 

50% 

70% 

Se  o  coeficiente  exponenciado  é  0,20,  uma  mudança 
de  uma  unidade  na  variável  independente  reduzirá  a 
razão  de  desigualdades  em  80%  (o  mesmo  se  a  razão 
de  desigualdades  fosse  multiplicada  por  0,20).  Analo¬ 
gamente,  um  coeficiente  exponenciado  de  1,5  denota 
um  aumento  de  50%  na  razão  de  desigualdades. 


Um  pesquisador  que  conhece  a  razão  de  desigualda¬ 
des  existente  e  deseja  calcular  o  novo  valor  dessa  razão 
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para  uma  mudança  na  variável  independente  pode  fazê-lo 
diretamente  através  do  coeficiente  exponenciado,  como 
se  segue: 

Novo  valor  de  razão  de  desigualdade  =  Valor  antigo 
X  Coeficiente  exponenciado  x  Variação  na  variável 
independente 

Usemos  um  exemplo  simples  para  ilustrar  a  maneira 
como  o  coeficiente  exponenciado  afeta  o  valor  da  razão 
de  desigualdades. 


Considere  que  a  razão  de  desigualdade  é  1,0  (ou  seja, 
50-50)  quando  a  variável  independente  tem  um  valor  de 
5,5  e  o  coeficiente  exponenciado  é  2,35.  Sabemos  que  se 
este  coeficiente  for  maior  do  que  1,0,  então  a  relação  é 
positiva,  mas  gostaríamos  de  saber  o  quanto  a  razão  de 
desigualdades  mudaria.  Se  esperamos  que  o  valor  da  va¬ 
riável  independente  aumente  1,5  pontos  para  7,0,  pode¬ 
mos  calcular  o  seguinte: 

Nova  razão  de  desigualdades  =  1,0  x  2,35 
X  (7,0 -5,5)  =  3,525 

Razões  de  desigualdades  podem  ser  traduzidas  em 
termos  de  valores  de  probabilidade  pela  fórmula  simples 
de  Probabilidade  =  Razão  de  desigualdades/(l-HRazão 
de  desigualdades).  Logo,  a  razão  de  3,525  se  traduz  em 
uma  probabilidade  de  77,9%  (3, 25/(1  -r  3,25)=  0,779),  in¬ 
dicando  que  um  aumento  na  variável  independente  de 
um  ponto  e  meio  aumenta  a  probabilidade  de  50%  para 
78%,  um  aumento  de  28%. 

A  natureza  não-linear  da  curva  logística  é  demons¬ 
trada,  porém,  quando  novamente  aplicamos  o  mesmo 
aumento  à  razão  de  desigualdades.  Dessa  vez,  considere 
que  a  variável  independente  aumenta  mais  1,5  pontos, 
para  8,5.  Podemos  esperar  que  a  probabilidade  aumente 
outros  28%?  Não,  pois  isso  faria  a  probabilidade  ultra¬ 
passar  os  100%  (78%  +  28%  =  106%).  Assim,  o  aumen¬ 
to  ou  diminuição  da  probabilidade  diminui  à  medida  que 
a  curva  se  aproxima,  mas  jamais  alcança,  os  dois  pontos 
extremos  (0  e  1).  Neste  exemplo,  outro  aumento  de  1,5 
cria  um  novo  valor  de  razão  de  desigualdades  de  12,426, 
traduzindo-se  como  uma  razão  de  desigualdades  de 
92,6%,  um  aumento  de  14%.  Observe  que  neste  caso  de 
aumento  de  probabilidade  a  partir  de  78%,  o  aumento 
na  mesma  para  a  variação  de  1,5  na  variável  indepen¬ 
dente  é  metade  (14%)  daquilo  que  foi  para  o  mesmo  au¬ 
mento  quando  a  probabilidade  era  de  50%. 


O  pesquisador  pode  descobrir  que  coeficientes  expo- 
nenciados  são  bastante  úteis  não  apenas  na  avaliação  do 
impacto  de  uma  variável  independente,  mas  no  cálculo  da 
magnitude  dos  efeitos. 

Interpretação  da  magnitude  para  variáveis  independentes 
não-métricas  (dicotômicas).  Como  discutimos  em  re¬ 


gressão  múltipla,  variáveis  dicotômicas  representam  uma 
única  categoria  de  uma  variável  não-métrica  (ver  Capítulo 
4  para  uma  discussão  mais  detalhada  sobre  o  tema).  Como 
tais,  elas  não  são  como  variáveis  métricas  que  variam  em 
um  intervalo  de  valores,  mas  assumem  apenas  os  valores 
de  1  ou  0,  indicando  a  presença  ou  ausência  de  uma  carac¬ 
terística.  Como  vimos  na  discussão  anterior  para  variáveis 
métricas,  os  coeficientes  exponenciados  são  a  melhor  ma¬ 
neira  de  interpretar  o  impacto  da  variável  dicotômica,  mas 
são  interpretados  diferentemente  das  variáveis  métricas. 

Sempre  que  uma  variável  dicotômica  é  usada,  é  essen¬ 
cial  notar  a  categoria  de  referência  ou  omitida.  Em  uma 
maneira  semelhante  à  interpretação  em  regressão,  o  co¬ 
eficiente  exponenciado  representa  o  nível  relativo  da  va¬ 
riável  dependente  para  o  grupo  representado  versus  o 
grupo  omitido.  Podemos  estabelecer  essa  relação  como  se 
segue: 

Razão  de  Coeficiente  exponenciado 

desigualdades^^, x  Razão  de  desigualdades^^, 

representada  referência 

Usemos  um  exemplo  simples  de  dois  grupos  para  ilus¬ 
trar  esses  pontos. 

Se  a  variável  não-métrica  é  sexo,  as  duas  possibilidades 
são  masculino  e  feminino.  A  variável  dicotômica  pode 
ser  definida  como  representando  homens  (i.e.,  valor  1  se 
for  homem  e  0  se  for  mulher)  ou  mulheres  (i.e.,  valor 
1  se  for  mulher  e  0  se  for  homem).  Qualquer  que  seja 
o  caminho  escolhido,  porém,  ele  se  determina  como  o 
coeficiente  é  interpretado.  Consideremos  que  um  valor 
1  é  dado  às  mulheres,  fazendo  com  que  o  coeficiente 
exponenciado  represente  o  percentual  da  razão  de  de¬ 
sigualdades  de  mulheres  comparada  com  homens.  Se  o 
coeficiente  é  1,25,  então  as  mulheres  têm  uma  razão  de 
desigualdades  25%  maior  do  que  os  homens  (1,25  - 1,0  = 
0,25).  Analogamente,  se  o  coeficiente  é  0,80,  então  a  ra¬ 
zão  de  desigualdades  para  mulheres  é  20%  menor  (0,80 
- 1,0  =  -0,20)  do  que  para  os  homens. 


Cálculo  de  probabilidades  para  um  valor 
especifico  da  variável  independente 

Na  discussão  anterior  da  distribuição  assumida  de  possí¬ 
veis  variáveis  dependentes,  descrevemos  uma  curva  em 
forma  de  S,  ou  logística.  Para  representar  a  relação  entre 
as  variáveis  dependente  e  independentes,  os  coeficientes 
devem,  na  verdade,  representar  relações  não-lineares 
entre  as  variáveis  dependente  e  independentes.  Apesar 
de  o  processo  de  transformação  que  envolve  logaritmos 
fornecer  uma  linearização  da  relação,  o  pesquisador  deve 
lembrar  que  os  coeficientes  na  verdade  correspondem  a 
diferentes  coeficientes  angulares  na  relação  ao  longo  dos 
valores  da  variável  independente.  Desse  modo,  a  distri¬ 
buição  em  forma  de  S  pode  ser  estimada.  Se  o  pesquisa- 
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dor  estiver  interessado  no  coeficiente  angular  da  relação 
em  vários  valores  da  variável  independente,  os  coeficien¬ 
tes  podem  ser  calculados  e  a  relação,  avaliada  [6]. 

Visão  geral  da  interpretação  dos  coeficientes 

A  similaridade  dos  coeficientes  com  aqueles  encontrados 
em  regressão  múltipla  tem  sido  uma  razão  prioritária  para 
a  popularidade  da  regressão  logística.  Como  vimos  na  dis¬ 
cussão  anterior,  muitos  aspectos  são  bastante  semelhan¬ 
tes,  mas  o  caráter  único  da  variável  dependente  (a  razão 
de  desigualdades)  e  a  forma  logarítmica  da  variável  esta¬ 
tística  (necessitando  uso  dos  coeficientes  exponenciados) 
requer  uma  abordagem  de  algum  modo  de  interpretação 
diferente.  O  pesquisador,  contudo,  ainda  tem  a  habilidade 
para  avaliar  a  direção  e  a  magnitude  do  impacto  de  cada 
variável  independente  sobre  a  medida  dependente  e,  em 
última  instância,  a  precisão  de  classificação  do  modelo  lo¬ 
gístico. 

Resumo 

O  pesquisador  que  se  defronta  com  uma  variável  depen¬ 
dente  dicotômica  não  precisa  apelar  para  métodos  elabo¬ 
rados  para  acomodar  as  limitações  da  regressão  múltipla, 
e  nem  precisa  ser  forçado  a  empregar  a  análise  discrimi¬ 
nante,  especialmente  se  suas  suposições  estatísticas  são 
violadas.  A  regressão  logística  aborda  esses  problemas  e 
fornece  um  método  desenvolvido  para  lidar  diretamente 
com  essa  situação  da  maneira  mais  eficiente  possível. 


UM  EXEMPLO  ILUSTRATIVO 
DE  REGRESSÃO  LOGÍSTICA 

A  regressão  logística  é  uma  alternativa  atraente  à  análise 
discriminante  sempre  que  a  variável  dependente  tem  ape¬ 
nas  duas  categorias.  Suas  vantagens  em  relação  à  análise 
discriminante  incluem  as  seguintes: 

1.  É  menos  afetada  do  que  a  análise  discriminante  pelas  de¬ 
sigualdades  de  variância-covariância  ao  longo  dos  grupos, 
uma  suposição  básica  da  análise  discriminante. 

2.  Lida  facilmente  com  variáveis  independentes  categóricas, 
enquanto  na  análise  discriminante  o  uso  de  variáveis  dico¬ 
tômicas  cria  problemas  com  igualdades  de  variância-cova¬ 
riância. 

3.  Os  resultados  empíricos  acompanham  paralelamente  os  da 
regressão  múltipla  em  termos  de  sua  interpretação  e  das 
medidas  diagnósticas  de  casos  disponíveis  para  exame  de 
resíduos. 

O  exemplo  a  seguir,  idêntico  ao  da  análise  discrimi¬ 
nante  de  dois  grupos  discutido  anteriormente,  ilustra  essas 
vantagens  e  a  similaridade  da  regressão  logística  com  os 
resultados  obtidos  da  regressão  múltipla.  Como  veremos, 
ainda  que  a  regressão  logística  tenha  muitas  vantagens 
como  alternativa  à  análise  discriminante,  o  pesquisador 
deve  interpretar  cuidadosamente  os  resultados  devido  aos 


-  REGRAS  PRÁTICAS  5-5  - 

Regressão  logística 

•  Regressão  logística  é  o  método  preferido  para  variáveis 
dependentes  de  dois  grupos  (binárias)  devido  à  sua 
robustez,  facilidade  de  interpretação  e  diagnóstico 

•  Testes  de  significância  de  modelo  são  feitos  com  um 
teste  de  qui-quadrado  sobre  as  diferenças  no  logaritmo 
da  verossimilhança  (-2LL)  entre  dois  modelos 

•  Coeficientes  são  expressos  em  duas  formas:  original  e 
exponenciado,  para  auxiliar  na  interpretação 

•  A  interpretação  dos  coeficientes  quanto  a  direção  e 
magnitude  é: 

•  Direção  pode  ser  avaliada  diretamente  nos 
coeficientes  originais  (sinais  positivos  ou  negativos) 
ou  indiretamente  nos  exponenciados  (menor  que  1  é 
negativa  e  maior  que  1  é  positiva) 

•  Magnitude  é  avaliada  melhor  pelo  coeficiente 
exponenciado,  com  a  variação  percentual  na  variável 
dependente  mostrada  por: 

Variação  percentual  =  (Coeficiente  exponenciado  - 
1,0)  X  100 


aspectos  ímpares  de  como  a  regressão  logística  lida  com  a 
previsão  de  probabilidades  e  de  pertinência  a  grupos. 

Estágios  1, 2  e  3:  Objetivos  da 
pesquisa,  planejamento  de  pesquisa 
e  suposições  estatísticas 

As  questões  abordadas  nos  primeiros  três  estágios  do  pro¬ 
cesso  de  decisão  são  idênticas  para  a  análise  discriminante 
de  dois  grupos  e  para  a  regressão  logística. 


O  problema  de  pesquisa  ainda  é  determinar  se  as  dife¬ 
renças  de  percepções  de  HBAT  {X^  a  X^g)  existem  entre 
os  clientes  dos  EU  A/ América  do  Norte  e  aqueles  do  res¬ 
to  do  mundo  (At).  A  amostra  de  100  clientes  é  dividida 
em  uma  amostra  de  análise  de  60  observações,  com  as 
40  observações  restantes  constituindo  a  amostra  de  va¬ 
lidação. 


Agora  nos  concentramos  sobre  os  resultados  obtidos 
a  partir  do  uso  de  regressão  logística  para  estimar  e  com¬ 
preender  as  diferenças  entre  esses  dois  tipos  de  clientes. 

Estágio  4:  Estimação  do  modelo  de  regressão 
logística  e  avaliação  do  ajuste  geral 

Antes  que  comece  o  processo  de  estimação,  é  possível 
rever  as  variáveis  individuais  e  avaliar  seus  resultados 
univariados  em  termos  de  diferenciação  entre  grupos. 
Sabendo-se  que  os  objetivos  da  análise  discriminante  e  da 
regressão  logística  são  os  mesmos,  podemos  usar  as  mes- 
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mas  medidas  de  discriminação  para  avaliar  efeitos  univa-  o  modelo  base  e  calcular  a  soma  total  de  quadrados.  Em 
riados,  como  foi  feito  para  a  análise  discriminante.  regressão  logística,  o  mesmo  processo  é  empregado,  com 

a  média  usada  no  modelo  estimado  não  para  estabelecer  a 
soma  de  quadrados,  mas  para  estabelecer  o  valor  do  loga¬ 
ritmo  da  verossimilhança.  A  partir  desse  modelo,  podem 
ser  estabelecidas  as  correlações  parciais  para  cada  variá¬ 
vel  e  a  variável  mais  discriminante  pode  ser  escolhida  de 
acordo  com  os  critérios  de  seleção. 


Exatamente  como  em  análise  discriminante,  essas 
cinco  variáveis  seriam  as  candidatas  lógicas  para  inclu¬ 
são  na  variável  estatística  de  regressão  logística,  pois  elas 
demonstram  as  maiores  diferenças  entre  grupos.  Regres¬ 
são  logística  pode  incluir  uma  ou  mais  dessas  variáveis  no 
modelo,  bem  como  outras  variáveis  que  não  apresentam 
diferenças  significantes  neste  estágio  se  elas  operam  em 
combinação  com  outras  variáveis  para  significativamente 
melhorar  a  previsão. 

Estimação  do  modelo 

A  regressão  logística  é  estimada  de  maneira  análoga  à  re¬ 
gressão  múltipla,  no  sentido  de  que  um  modelo  base  é  pri¬ 
meiramente  estimado  para  fornecer  um  padrão  para  com¬ 
paração  (ver  discussão  anterior  para  maiores  detalhes). 
Em  regressão  múltipla,  a  média  é  usada  para  estabelecer 


TABELA  5-25  Resultados  do  modelo  base  da  regressão  logística 


Ajuste  geral  do  modelo:  medidas  da  qualidade  do  ajuste 

Valor 

-2  Logaritmo  de  verossimilhança  (-2LL) 

82,108 

Variáveis  fora  da  equação 

Variáveis  independentes 

Estatística  de  escore 

Significância 

><■6 

Qualidade  do  produto 

1 1 ,925 

0,001 

Atividades  de  comércio  eletrônico 

2,052 

0,152 

^8 

Suporte  técnico 

1,609 

0,205 

Solução  de  reclamação 

0,866 

0,352 

Anúncio 

0,791 

0,374 

Linha  do  produto 

18,323 

0,000 

Imagem  da  equipe  de  venda 

8,622 

0,003 

Vs 

Preços  competitivos 

21 ,330 

0,000 

Garantia  e  reclamações 

0,465 

0,495 

Vs 

Novos  produtos 

0,614 

0,433 

Encomenda  e  cobrança 

0,090 

0,764 

Flexibilidade  de  preço 

21 ,204 

0,000 

>^18 

Velocidade  de  entrega 

0,157 

0,692 

Estimação  do  modelo  base.  A  Tabela  5-25  contém  os 
resultados  do  modelo  base  para  a  análise  de  regressão  lo¬ 
gística.  O  valor  do  logaritmo  da  verossimilhança  (-2LL) 
aqui  é  82,108.  A  estatística  escore,  uma  medida  de  asso¬ 
ciação  usada  em  regressão  logística,  é  a  medida  usada 
para  selecionar  variáveis  no  procedimento  stepwise.  Di¬ 
versos  critérios  podem  ser  empregados  para  orientar  a 
entrada:  maior  redução  no  valor  -2LL,  maior  coeficiente 
de  Wald,  ou  maior  probabilidade  condicional.  Em  nosso 
exemplo,  empregamos  o  critério  da  redução  da  razão  do 
logaritmo  da  verossimilhança. 

Ao  revermos  a  estatística  de  escores  de  variáveis  não 
presentes  no  modelo  neste  momento,  percebemos  que  as 
mesmas  cinco  variáveis  com  diferenças  estatisticamente 
significantes  {X^,  e  Ajy)  também  são  s  únicas 

variáveis  com  estatística  de  escore  significante  na  Tabela 
5-25.  Como  o  procedimento  stepwise  seleciona  a  variável 
com  a  maior  estatística  de  escore,  A^  deve  ser  a  variável 
adicionada  no  primeiro  passo. 

Estimação  stepwise:  adição  da  primeira  variável, 
Ajj.  Como  esperado,  A^  foi  escolhida  para  entrada 
no  primeiro  passo  do  processo  de  estimação  (ver  Tabela 

{Continua) 


Se  revisarmos  nossa  discussão  a  respeito  das  diferenças 
dos  grupos  quanto  às  13  variáveis  independentes  (olhar 
a  Tabela  5-5),  lembraremos  que  cinco  variáveis  (A^,  Ajj, 
Ajj,  Aj3,  e  Ajy)  tinham  diferenças  estatisticamente  signi¬ 
ficantes  entre  os  dois  grupos.  Se  você  olhar  novamente  a 
discussão  no  exemplo  de  dois  grupos,  lembre  de  uma  in¬ 
dicação  de  multicolinearidade  entre  essas  variáveis,  pois 
ambas  Ag  e  A^  eram  parte  do  fator  Valor  do  produto 
derivado  pela  análise  fatorial  (ver  Capítulo  3).  A  regres¬ 
são  logística  é  afetada  por  multicolinearidade  entre  as 
variáveis  independentes  de  uma  maneira  semelhante  à 
análise  discriminante  e  análise  de  regressão. 


294  Análise  Multivariada  de  Dados 


TABELA  5-26  Estimação  stepwise  da  regressão  logística:  Adição  de  X,3  (Preços  competitivos) 


Ajuste  geral  do  modelo:  medidas  da  qualidade  de  ajuste 

VARIAÇÃO  EM  -2LL 

Do  modelo  base 

Do  passo  anterior 

Valor 

Variação  Significância 

Variação 

Significância 

-2  Logaritmo  de  verossimilhança  {-2LL) 

56,971 

25,136  0,000 

25,136 

0,000 

de  Cox  e  Snell 

0,342 

de  Nagelkerke 

0,459 

Pseudo  F^ 

0,306 

Valor  Significância 

de  Hosmer  e  Lemeshow 

17,329  0,027 

Variáveis  na  equação 

Variável  independente 

B 

Erro  padrão  Wald 

df 

Sig. 

Exp(B) 

Xi3  Preços  competitivos 

1,129 

0,287  15,471 

1 

0,000 

3,092 

Constante 

-7,008 

1,836  14,570 

1 

0,000 

0,001 

B  =  coeficiente  iogístico,  Exp(B)  =  coeficiente  exponenciado 

Variáveis  fora  da  equação 

Variáveis  independentes 

Estatística  de  escore 

Significância 

Xg  Qualidade  do  produto 

4,859 

0,028 

X7  Atividades  de  comércio  eletrônico 

0,132 

0,716 

Xg  Suporte  técnico 

0,007 

0,932 

Xg  Solução  de  reclamação 

1,379 

0,240 

X,g  Anúncio 

0,129 

0,719 

X|,  Linha  do  produto 

6,154 

0,013 

X,2  Imagem  da  equipe  de  venda 

2,745 

0,098 

X,4  Garantia  e  reclamações 

0,640 

0,424 

X,5  Novos  produtos 

0,344 

0,557 

X|g  Encomenda  e  cobrança 

2,529 

0,112 

X^-,  Flexibilidade  de  preço 

13,723 

0,000 

X,g  Velocidade  de  entrega 

1,206 

0,272 

Matriz  de  classificação 

Pertinência  prevista  em  grupo" 

AMOSTRA  DE  ANÁLISE" 

AMOSTRA  DE  TESTE** 

Xg  Região 

Xg  Região 

EUA/América 

Fora  da  Amé- 

EUA/América 

Fora  da  Amé- 

Pertinência  real  em  grupo 

do  Norte 

rica  do  Norte  Total 

do  Norte 

rica  do  Norte 

Total 

EUA/América  do  Norte 

19 

7  26 

4 

9 

13 

(73,1) 

(30,8) 

Fora  da  América  do  Norte 

9 

25  34 

1 

26 

27 

(73,5) 

(96,3) 

“73,3%  de  amostra  de  análise  corretamente  classificada. 

"75,0%  da  amostra  de  teste  corretamente  ciassificada. 

‘Valores  entre  parênteses  são  percentuais  corretamente  classificados  (razão  de  sucesso). 
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(Continuação) 

5-26).  Ela  corresponde  à  maior  estatística  de  escore  em 
todas  as  13  variáveis  de  percepções.  A  entrada  de 
no  modelo  de  regressão  logística  conseguiu  um  razoável 
ajuste,  com  valores  pseudo  variando  de  0,306  a  0,459 
e  as  razões  de  sucesso  de  73,3%  e  75%  para  as  amostras 
de  análise  e  de  teste,  respectivamente. 

O  exame  dos  resultados,  porém,  identifica  duas  razões 
para  se  considerar  um  estágio  extra  para  adicionar  variá¬ 
veis  ao  modelo  de  regressão  logística: 

•  Três  variáveis  não  presentes  no  modelo  logístico  cor¬ 
rente  (Aj,,  Ajj  e  Ag)  têm  estatísticas  de  escore  estatis¬ 
ticamente  significantes,  indicando  que  a  inclusão  das 
mesmas  melhoraria  consideravelmente  o  ajuste  geral  do 
modelo. 

•  A  razão  de  sucesso  geral  para  a  amostra  de  teste  é  boa 
(75,0%),  mas  um  dos  grupos  (Clientes  dos  EU  A/ Améri¬ 
ca  do  Norte)  tem  uma  razão  de  sucesso  inaceitavelmen- 
te  baixa  de  30,8%. 


Estimação  stepwise:  Adição  da  segunda  variável,  X„.  Es- 

pera-se  que  um  ou  mais  passos  no  procedimento  stepwise 
resulte  na  inclusão  de  todas  as  variáveis  independentes 
com  estatística  de  escore  significante,  bem  como  sejam 
atingidas  razões  aceitáveis  de  sucesso  (geral  e  específicas 
de  grupos)  tanto  para  a  amostra  de  análise  quanto  para  a 
de  teste. 


Aj7,  com  a  maior  estatística  de  escore  depois  de  adicionar 
Aj3,  foi  escolhida  para  entrada  no  passo  2  (Tabela  5-27). 
Melhoras  em  todas  as  medidas  de  ajuste  de  modelo  varia¬ 
ram  de  uma  queda  no  valor  -2LL  até  as  várias  medidas 
Mais  importante  sob  uma  perspectiva  de  estimação 
de  modelo,  nenhuma  das  variáveis  fora  da  equação  tinha 
variações  estatisticamente  significantes  de  escores. 


Assim,  o  modelo  logístico  de  duas  variáveis  incluindo 
Aj3  e  Aj7  será  o  modelo  final  a  ser  usado  para  fins  de  ava¬ 
liação  de  ajuste  do  mesmo,  de  precisão  preditiva  e  de  in¬ 
terpretação  dos  coeficientes. 

Avaliação  do  ajuste  geral  do  modelo 

Ao  se  fazer  uma  avaliação  do  ajuste  geral  de  um  mode¬ 
lo  logístico  de  regressão,  podemos  empregar  três  abor¬ 
dagens:  medidas  estatísticas  de  ajuste  geral  do  modelo, 
medidas  pseudo  Rr,  e  precisão  de  classificação  expressada 
na  razão  de  sucesso.  Cada  uma  dessas  abordagens  será 
examinada  para  os  modelos  de  regressão  logística  de  uma 
variável  e  de  duas  variáveis  que  resultaram  do  procedi¬ 
mento  stepwise. 

Medidas  estatísticas.  A  primeira  medida  estatística  é  o 
teste  qui-quadrado  para  a  variação  no  valor  -2LL  do  mo¬ 
delo  base,  que  é  comparável  com  o  teste  F  geral  em  regres¬ 
são  múltipla.  Valores  menores  da  medida  -2LL  indicam  um 


melhor  ajuste  de  modelo,  e  o  teste  estatístico  está  disponí¬ 
vel  para  avaliar  a  diferença  entre  o  modelo  base  e  os  demais 
modelos  propostos  (em  um  procedimento  stepwise,  este  tes¬ 
te  está  sempre  baseado  na  melhora  do  passo  anterior). 


•  No  modelo  de  uma  só  variável  (ver  Tabela  5-26),  o  va¬ 
lor  -2LL  é  reduzido  a  partir  do  valor  do  modelo  base  de 
82,108  para  59,971*,  uma  queda  de  25,136.  Este  aumen¬ 
to  em  ajuste  de  modelo  foi  estatisticamente  significante 
no  nível  0,000. 

•  No  modelo  de  duas  variáveis,  o  valor  -2LL  diminuiu 
mais  para  39,960,  resultando  em  quedas  significantes  não 
apenas  do  modelo  base  (42,148),  mas  também  uma  queda 
significante  do  modelo  de  uma  variável  (17,011).  Ambas 
as  melhoras  de  ajuste  foram  significantes  no  nível  0,000. 


A  segunda  medida  estatística  é  a  de  Hosmer  e  Le- 
meshow  de  ajuste  geral  [11].  Este  teste  estatístico  mede  a 
correspondência  dos  valores  reais  e  previstos  da  variável 
dependente.  Neste  caso,  um  ajuste  melhor  de  modelo  é 
indicado  por  uma  diferença  menor  na  classificação  obser¬ 
vada  e  prevista. 


O  teste  de  Hosmer  e  Lemeshow  mostra  significância 
para  o  modelo  logístico  de  uma  variável  (0,027  da  Ta¬ 
bela  5-26),  indicando  que  diferenças  significantes  ainda 
permanecem  entre  valores  reais  e  esperados.  O  modelo 
de  duas  variáveis,  contudo,  reduz  o  nível  de  significância 
para  0,722  (ver  Tabela  5-27),  um  valor  não-significante 
que  aponta  para  um  ajuste  aceitável. 


Para  o  modelo  logístico  de  duas  variáveis,  ambas  as 
medidas  estatísticas  de  ajuste  geral  do  modelo  indicam 
que  o  mesmo  é  aceitável  e  em  um  nível  estatisticamente 
significante.  No  entanto,  é  necessário  examinar  as  outras 
medidas  de  ajuste  geral  do  modelo  para  avaliar  se  os  re¬ 
sultados  alcançam  os  níveis  necessários  de  significância 
prática  também. 

Medidas  de  pseudo  Três  medidas  disponíveis  são 
comparáveis  com  a  medida  R^  em  regressão  múltipla:  R^ 
de  Cox  e  Snell,  R^  de  Nagelkerke,  e  a  medida  pseudo  R^ 
baseada  na  redução  no  valor  -2LL. 


Para  o  modelo  de  regressão  logística  de  uma  variável, 
esses  valores  eram  0,342,  0,459  e  0,306,  respectivamen¬ 
te.  Combinados,  eles  indicam  que  o  modelo  de  regressão 
de  uma  variável  explica  aproximadamente  um  terço  da 
variação  na  medida  dependente.  Apesar  de  o  modelo  de 
uma  variável  ser  considerado  estatisticamente  significan¬ 
te  em  diversas  medidas  de  ajuste  geral,  esses  valores  de 
R^  são  um  pouco  baixos  para  fins  de  significância  prática. 

{Continua) 


*  N.  de  R.  T.:  O  número  correto  é  56,971. 
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TABELA  5-27  Estimação  stepwise  da  regressão  logística:  adição  de  X„  (Flexibilidade  de  preços) 


Ajuste  geral  do  modelo:  medidas  da  qualidade  de  ajuste 

VARIAÇÃO  EM  -2LL 

Do  modelo  base 

Do  passo  anterior 

Valor 

Variação  Significância 

Variação 

Significância 

-2  Logaritmo  de  verossimilhança  (-2LL) 

39,960 

42,148  0,000 

17,011 

0,000 

F?  de  Cox  e  Snell 

0,505 

ít  de  Nagelkerke 

0,677 

Pseudo 

0,513 

Valor  Significância 

de  Hosmer  e  Lemeshow 

5,326  0,722 

Variáveis  na  equação 

Variável  independente 

B 

Erro  padrão  Wald 

df 

Sig. 

Exp(B) 

X,3  Preços  competitivos 

1,079 

0,357  9,115 

1 

0,003 

2,942 

X,7  Flexibilidade  de  preços 

1,844 

0,639  8,331 

1 

0,004 

6,321 

Constante 

-14,192 

3,712  14,614 

1 

0,000 

0,000 

B  =  coeficiente  logístico,  Exp(B)  =  coeficiente  exponenciado 

Variáveis  fora  da  equação 

Variáveis  independentes 

Estatística  de  escore 

Significância 

Xg  Qualidade  do  produto 

0,656 

0,418 

X-,  Atividades  de  comércio  eletrônico 

3,501 

0,061 

Xg  Suporte  técnico 

0,006 

0,937 

Xg  Solução  de  reclamação 

0,693 

0,405 

X,o  Anúncio 

0,091 

0,762 

X,,  Linha  do  produto 

3,409 

0,065 

X,2  Imagem  da  equipe  de  venda 

0,849 

0,357 

X,4  Garantia  e  reclamações 

2,327 

0,127 

X,5  Novos  produtos 

0,026 

0,873 

X,s  Encomenda  e  cobrança 

0,010 

0,919 

X,8  Velocidade  de  entrega 

2,907 

0,088 

Matriz  de  classificação 

Pertinência  prevista  em  grupo" 

AMOSTRA  DE  ANÁLISE" 

AMOSTRA  DE  TESTE" 

X4  Região 

X4  Região 

EUA/América 

Fora  da  Amé- 

EUA/América 

Fora  da  Amé- 

Pertinência  real  em  grupo 

do  Norte 

rica  do  Norte  Total 

do  Norte 

rica  do  Norte 

Total 

EUA/América  do  Norte 

25 

1  26 

9 

4 

13 

(96,2) 

(69,2) 

Fora  da  América  do  Norte 

6 

28  34 

2 

25 

27 

(82,4) 

(92,6) 

“88,3%  de  amostra  de  análise  corretamente  classificada. 

“85,0%  da  amostra  de  teste  corretamente  classificada. 

“Valores  entre  parênteses  sâo  percentuais  corretamente  classificados  (razão  de  sucesso). 
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{Continuação) 

O  modelo  de  duas  variáveis  (ver  Tabela  5-27)  tem 
valores  que  são  ambos  maiores  que  0,50,  apontando 
para  um  modelo  de  regressão  logística  que  explica  pelo 
menos  metade  da  variação  entre  os  dois  grupos  de  clien¬ 
tes.  Sempre  se  deseja  melhorar  tais  valores,  mas  tal  nível 
é  considerado  praticamente  significante  nesta  situação. 


Os  valores  do  modelo  de  duas  variáveis  exibiram 
considerável  melhora  sobre  o  modelo  de  uma  variável  e 
indicam  bom  ajuste  quando  comparados  aos  valores  R^ 
geralmente  encontrados  em  regressão  múltipla.  De  acor¬ 
do  com  as  medidas  de  ajuste  de  caráter  estatístico,  o  mo¬ 
delo  é  considerado  aceitável  em  termos  de  significância 
estatística  e  prática. 

Precisão  de  classificação.  O  terceiro  exame  de  ajuste  ge¬ 
ral  do  modelo  será  para  avaliar  a  precisão  de  classificação 
do  modelo  em  uma  medida  final  de  significância  prática. 
As  matrizes  de  classificação,  idênticas  em  natureza  àque¬ 
las  empregadas  em  análise  discriminante,  representam  os 
níveis  de  precisão  preditiva  atingidos  pelo  modelo  logís¬ 
tico.  A  medida  de  precisão  preditiva  usada  é  a  razão  de 
sucesso,  o  percentual  de  casos  corretamente  classificados. 
Esses  valores  serão  calculados  tanto  para  a  amostra  de 
análise  quanto  a  de  teste,  e  medidas  específicas  de  grupos 
serão  examinadas  além  das  medidas  gerais.  Além  disso, 
comparações  podem  ser  feitas,  como  ocorreu  em  análise 
discriminante,  com  padrões  de  comparação  representan¬ 
do  os  níveis  de  precisão  preditiva  conseguidos  por  chan¬ 
ces  (ver  discussão  mais  detalhada  na  seção  sobre  análise 
discriminante). 


Os  padrões  de  comparação  para  as  razões  de  sucesso 
da  matriz  de  classificação  serão  os  mesmos  que  foram 
calculados  para  a  análise  discriminante  de  dois  grupos. 
Os  valores  são  65,5%  para  o  critério  de  chance  propor¬ 
cional  (a  medida  preferida)  e  76,3%  para  o  critério  de 
chance  máxima.  Se  você  não  estiver  familiarizado  com 
os  métodos  de  cálculo  de  tais  medidas,  veja  a  discussão 
anterior  no  capítulo  que  trata  de  avaliação  da  precisão 
de  classificação. 

•  As  razões  de  sucesso  geral  para  o  modelo  logístico  de 
uma  variável  são  73,3%  e  75,0%  para  as  amostras  de 
análise  e  de  teste,  respectivamente.  Mesmo  que  as  ra¬ 
zões  de  sucesso  geral  sejam  maiores  do  que  o  critério 
de  chance  proporcional  e  comparáveis  com  o  critério 
de  chance  máxima,  um  problema  considerável  surge 
na  amostra  de  teste  para  os  clientes  dos  EU  A/ América 
do  Norte,  onde  a  razão  de  sucesso  é  de  somente  30,8%. 
Este  nível  está  abaixo  de  ambos  os  padrões  e  demanda 
que  o  modelo  logístico  seja  expandido  até  o  ponto  em 
que,  espera-se,  esta  razão  de  sucesso  específica  de  grupo 
exceda  os  padrões. 

•  O  modelo  de  duas  variáveis  exibe  melhora  substancial 
na  razão  de  sucesso  geral  e  nos  valores  específicos  de 


grupos.  As  razões  de  sucesso  geral  subiram  para  88,3% 
e  85,0%  para  as  amostras  de  análise  e  de  teste,  respec¬ 
tivamente.  Além  disso,  a  problemática  razão  de  suces¬ 
so  na  amostra  de  teste  aumenta  para  69,2%,  acima  do 
valor  padrão  para  o  critério  de  chance  proporcional. 
Com  essas  melhoras  nos  níveis  geral  e  específicos, 
o  modelo  de  regressão  logística  de  duas  variáveis  é 
considerado  aceitável  em  termos  de  precisão  de  classi¬ 
ficação. 


Em  todos  os  três  dos  tipos  básicos  de  medida  de 
ajuste  geral,  o  modelo  de  duas  variáveis  (com  e  Xj,) 
demonstra  níveis  aceitáveis  de  significância  estatística  e 
prática.  Com  ajuste  de  modelo  geral  aceitável,  voltamos 
nossa  atenção  para  a  avaliação  dos  testes  estatísticos  dos 
coeficientes  logísticos  a  fim  de  identificar  os  coeficien¬ 
tes  que  têm  relações  significantes  afetando  pertinência 
a  grupo. 

Significância  estatística  dos  coeficientes 

Os  coeficientes  estimados  para  as  duas  variáveis  indepen¬ 
dentes  e  a  constante  também  podem  ser  avaliados  quanto 
à  significância  estatística.  A  estatística  Wald  é  usada  para 
avaliar  significância  de  um  modo  semelhante  ao  teste  t  uti¬ 
lizado  em  regressão  múltipla. 


Os  coeficientes  logísticos  para  Xjj  (1,079)  e  (1,844)  e  a 
constante  (-14,190*)  são  todos  significantes  no  nível  0,01 
com  base  no  teste  estatístico  de  Wald.  Nenhuma  outra 
variável  consegue  entrar  no  modelo  e  atingir  pelo  menos 
um  nível  de  significância  de  0,05. 


Assim,  as  variáveis  individuais  são  significantes  e  po¬ 
dem  ser  interpretadas  para  identificar  as  relações  que 
afetam  as  probabilidades  previstas  e  subseqüentemente  a 
pertinência  a  grupo. 

Diagnósticos  por  casos 

A  análise  da  má  classificação  de  observações  individuais 
pode  fornecer  uma  melhor  visão  sobre  possíveis  melhora¬ 
mentos  do  modelo.  Diagnósticos  por  casos,  como  resídu¬ 
os  e  medidas  de  influências,  estão  disponíveis,  bem  como 
a  análise  de  perfil  discutida  anteriormente  para  a  análise 
discriminante. 


Neste  caso,  apenas  13  casos  foram  mal  classificados  (7 
na  amostra  de  análise  e  6  na  de  teste).  Dado  o  elevado 
grau  de  correspondência  entre  esses  casos  e  aqueles  mal 
classificados  estudados  na  análise  discriminante  de  dois 
grupos,  o  processo  de  estabelecimento  de  perfil  não  será 
novamente  levado  adiante  (leitores  interessados  podem 
rever  o  exemplo  de  dois  grupos).  Diagnóstico  por  casos. 


*  N.  de  R.  T.:  O  número  correto  é  -14,192. 
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como  resíduos  e  medidas  de  influência  estão  disponí¬ 
veis.  Dados  os  baixos  níveis  de  má  classificação,  porém, 
nenhuma  análise  complementar  de  classificação  ruim  é 
executada. 


Estágio  5:  Interpretação  dos  resultados 

O  procedimento  de  regressão  logística  stepwise  produziu 
uma  variável  estatística  muito  semelhante  àquela  da  aná¬ 
lise  discriminante  de  dois  grupos,  apesar  de  ter  uma  variá¬ 
vel  independente  a  menos.  Examinaremos  os  coeficientes 
logísticos  para  avaliarmos  a  direção  e  o  impacto  que  cada 
variável  tem  sobre  a  probabilidade  prevista  e  a  pertinên¬ 
cia  a  grupo. 

Interpretação  dos  coeficientes  logísticos 


O  modelo  final  de  regressão  logística  inclui  duas  variá¬ 
veis  (Aj3  e  Xyj)  com  coeficientes  de  regressão  de  1,079 
e  1,844,  respectivamente,  e  uma  constante  de  -14,190* 
(ver  Tabela  5-27).  A  comparação  desses  resultados  com 
a  análise  discriminante  de  dois  grupos  revela  resultados 
quase  idênticos,  uma  vez  que  a  análise  discriminante  in¬ 
cluiu  três  variáveis  no  modelo  de  dois  grupos  -  e  Xy, 
juntamente  com  X^y 


Direção  das  relações.  Para  avaliar  a  direção  da  relação 
de  cada  variável,  podemos  examinar  ou  os  coeficientes 
logísticos  originais,  ou  os  coeficientes  exponenciados.  Co¬ 
mecemos  com  os  originais. 


Se  você  recordar  de  nossa  discussão  anterior,  podemos 
interpretar  a  direção  da  relação  diretamente  a  partir  do 
sinal  dos  coeficientes  logísticos  originais.  Neste  caso,  am¬ 
bas  as  variáveis  têm  sinais  positivos,  o  que  aponta  para 
uma  relação  positiva  entre  ambas  as  variáveis  indepen¬ 
dentes  e  a  probabilidade  prevista.  A  medida  que  os  va¬ 
lores  de  Xy  ou  X^i  aumentam,  a  probabilidade  prevista 
aumenta,  fazendo  crescer  assim  a  possibilidade  de  que 
um  cliente  seja  categorizado  como  residindo  fora  da 
América  do  Norte. 

Voltando  nossa  atenção  para  os  coeficientes  expoen- 
ciados,  devemos  recordar  que  valores  acima  de  1,0  indi¬ 
cam  uma  relação  positiva  e  valores  abaixo  de  1,0  apontam 
para  uma  relação  negativa.  Em  nosso  caso,  os  valores  de 
2,942  e  6,319  também  refletem  relações  positivas. 


Magnitude  das  relações.  O  método  mais  direto  para 
avaliar  a  magnitude  da  variação  na  probabilidade  devido 
a  cada  variável  independente  é  examinar  os  coeficientes 
exponenciados.  Como  você  deve  lembrar,  o  coeficiente 
exponenciado  menos  um  é  igual  à  variação  percentual  da 
razão  de  desigualdades. 


Em  nosso  caso,  isso  significa  que  um  aumento  de  um 
ponto  aumenta  a  razão  de  desigualdades  em  194%  para 
2Íj3  e  531%  para  Esses  números  podem  exceder 
100%  de  variação  porque  eles  estão  aumentando  a  razão 
de  desigualdades  e  não  as  probabilidades  propriamente 
ditas.  Os  impactos  são  grandes  porque  o  termo  constan¬ 
te  (-14,190*)  define  um  ponto  inicial  de  quase  zero  para 
os  valores  de  probabilidade.  Logo,  grandes  aumentos  na 
razão  de  desigualdades  são  necessários  para  se  conseguir 
valores  maiores  de  probabilidades. 


Outra  abordagem  na  compreensão  sobre  como  os  coefi¬ 
cientes  logísticos  definem  probabilidade  é  calcular  a  proba¬ 
bilidade  prevista  para  qualquer  conjunto  de  valores  para  as 
variáveis  independentes. 


Para  as  variáveis  independentes  e  X^-j,  usemos  as 
médias  para  os  dois  grupos.  Dessa  maneira  podemos  ver 
qual  seria  a  probabilidade  prevista  para  um  membro  mé¬ 
dio  de  cada  grupo. 

A  Tabela  5-28  mostra  os  cálculos  para  a  previsão  da 
probabilidade  para  os  dois  centróides  de  grupo.  Como 
podemos  perceber,  o  centróide  para  o  grupo  0  (clientes 
na  América  do  Norte)  tem  uma  probabilidade  prevista 
de  18,9%,  enquanto  o  centróide  para  o  grupo  1  (fora  da 
América  do  Norte)  tem  uma  probabilidade  prevista  de 
94,8%.  Este  exemplo  demonstra  que  o  modelo  logístico 
cria  de  fato  uma  separação  entre  os  dois  centróides  de 
grupo  em  termos  de  probabilidade  prevista,  gerando  ex¬ 
celentes  resultados  de  classificação  conquistados  para  as 
amostras  de  análise  e  de  teste. 


Os  coeficientes  logísticos  definem  relações  positivas 
para  ambas  as  variáveis  independentes  e  fornecem  uma 
maneira  de  avaliar  o  impacto  de  uma  variação  em  uma  ou 
ambas  as  variáveis  sobre  a  razão  de  desigualdades  e  conse- 
qüentemente  sobre  a  probabilidade  prevista.  Fica  evidente 
por  que  muitos  pesquisadores  preferem  regressão  logística 
à  análise  discriminante  quando  comparações  são  feitas  so¬ 
bre  a  informação  mais  útil  disponível  nos  coeficientes  logís¬ 
ticos  em  contrapartida  com  as  cargas  discriminantes. 

Estágio  6:  Validação  dos  resultados 

A  validação  do  modelo  de  regressão  logística  é  consegui¬ 
da  neste  exemplo  através  do  mesmo  método  usado  em 
análise  discriminante:  criação  de  amostras  de  análises  e 
de  teste.  Examinando  a  razão  de  sucesso  para  a  amostra 
de  teste,  o  pesquisador  pode  avaliar  a  validade  externa  e  a 
significância  prática  do  modelo  de  regressão  logística. 


Para  o  modelo  final  de  regressão  logística  de  duas  va¬ 
riáveis,  as  razões  de  sucesso  para  as  amostras  de  análi- 

{Continua) 

*  N.  de  R.  T.:  O  número  correto  é  -14,192. 
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TABELA  5-28  Cálculo  de  valores  de  probabilidade  estimada  para  os  centróides 
de  grupos  da  região  


Xf  (Região) 

Grupo  0:  EUA/América 
do  Norte 

Grupo  1 :  Fora  da 
América  do  Norte 

Centróide:  X,3 

5,60 

7,42 

Centróide:  X„ 

3,63 

4,93 

Valor  loglf 

-1 ,452 

2,909 

Razão  de  desigualdades" 

0,234 

18,332 

Probabilidade" 

0,189 

0,948 

“Calculado  como:  Logit=  -14,190  +  1,079X,3  +  1,844X„ 

"Calculada  como:  Razão  de  desigualdades  =  e""®* 

"Calculada  como:  Probabilidade  =  Razão  de  desigualdades/(1+Razão  de  desigualdades) 


(Continuação) 

se  e  de  teste  excedem  todos  os  padrões  de  comparação 
(critérios  de  chance  proporcional  e  de  chance  máxima). 
Além  disso,  todas  as  razões  de  sucesso  específicas  de 
grupos  são  suficientemente  grandes  para  a  aceitação. 
Esse  aspecto  é  especialmente  importante  para  a  amos¬ 
tra  de  teste,  que  é  o  principal  indicador  de  validade  ex¬ 
terna. 


Esses  resultados  levam  à  conclusão  de  que  o  modelo 
de  regressão  logística,  como  também  descoberto  com  o 
modelo  de  análise  discriminante,  demonstrou  validade 
externa  suficiente  para  a  completa  aceitação  dos  resul¬ 
tados. 

Uma  visão  gerencial 

A  regressão  logística  apresenta  uma  alternativa  à  analise 
discriminante  que  pode  ser  mais  confortável  para  muitos 
pesquisadores  devido  à  sua  similaridade  com  regressão 
múltipla.  Dada  a  sua  robustez  diante  das  condições  de 
dados  que  podem  afetar  negativamente  a  análise  discri¬ 
minante  (p.ex.,  matrizes  diferentes  de  variância-covariân- 
cia),  a  regressão  logística  é  também  a  técnica  preferida  de 
estimação  em  muitas  aplicações. 


Quando  comparada  com  análise  discriminante,  a  re¬ 
gressão  logística  fornece  precisão  preditiva  compa¬ 
rável  com  uma  variável  estatística  mais  simples  que 
usava  a  mesma  interpretação  substancial,  apenas 
com  uma  variável  a  menos.  A  partir  dos  resultados 
da  regressão  logística,  o  pesquisador  pode  se  concen¬ 
trar  na  competitividade  e  na  flexibilidade  de  preços 
como  as  principais  variáveis  de  diferenciação  entre 
os  dois  grupos  de  clientes.  A  meta  nesta  análise  não 
é  aumentar  probabilidade  (como  poderia  ser  o  caso 
de  se  analisar  sucesso  versus  fracasso),  ainda  que  a 
regressão  logística  forneça  uma  técnica  direta  para  a 
HBAT  compreender  o  impacto  relativo  de  cada  va¬ 
riável  independente  na  criação  de  diferenças  entre  os 
dois  grupos  de  clientes. 


Resumo 

A  natureza  intrínseca,  os  conceitos  e  a  abordagem  para  a 
análise  discriminante  múltipla  e  a  regressão  logística  fo¬ 
ram  apresentadas.  Orientações  básicas  para  sua  aplicação 
e  interpretação  foram  incluídas  para  melhor  esclarecer  os 
conceitos  metodológicos.  Este  capítulo  ajuda  você  a  fazer 
o  seguinte: 

Estabelecer  as  circunstâncias  sob  as  quais  a  análise  discri¬ 
minante  linear  ou  a  regressão  logística  devem  ser  usadas 
ao  invés  da  regressão  múltipla.  Ao  se  escolher  uma  téc¬ 
nica  analítica  apropriada,  às  vezes  encontramos  um  pro¬ 
blema  que  envolve  uma  variável  dependente  categórica 
e  diversas  variáveis  independentes  métricas.  Lembre-se 
que  a  variável  dependente  em  regressão  foi  medida  me- 
tricamente.  Análise  discriminante  múltipla  e  regressão 
logística  são  as  técnicas  estatísticas  apropriadas  quando  o 
problema  de  pesquisa  envolve  uma  única  variável  depen¬ 
dente  categórica  e  diversas  variáveis  independentes  mé¬ 
tricas.  Em  muitos  casos,  a  variável  dependente  consiste  de 
dois  grupos  ou  classificações,  por  exemplo,  masculino  ver¬ 
sus  feminino,  alto  versus  baixo,  ou  bom  versus  ruim.  Em 
outros  casos,  mais  de  dois  grupos  estão  envolvidos,  como 
classificações  baixas,  médias  e  altas.  A  análise  discrimi¬ 
nante  e  a  regressão  logística  são  capazes  de  lidar  com  dois 
ou  múltiplos  (três  ou  mais)  grupos.  Os  resultados  de  uma 
análise  discriminante  e  de  uma  regressão  logística  podem 
auxiliar  no  perfil  das  características  entre-grupos  dos  indi¬ 
víduos  e  na  correspondência  dos  mesmos  com  seus  grupos 
adequados. 

Identificar  os  principais  problemas  relacionados  aos  tipos 
de  variáveis  nsados  e  os  tamanhos  de  amostras  exigidos  na 
aplicação  de  análise  discriminante.  Para  aplicar  análise 
discriminante,  o  pesquisador  deve  primeiramente  especi¬ 
ficar  quais  variáveis  devem  ser  medidas  independentes  e 
qual  é  a  dependente.  O  pesquisador  deve  se  concentrar 
primeiro  na  variável  dependente.  O  número  de  grupos  da 
variável  dependente  (categorias)  pode  ser  dois  ou  mais, 
mas  tais  grupos  devem  ser  mutuamente  excludentes  e 
exaustivos.  Depois  que  uma  decisão  foi  tomada  sobre  a 
variável  dependente,  o  pesquisador  deve  decidir  quais 
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variáveis  independentes  devem  ser  incluídas  na  análise. 
Variáveis  independentes  são  escolhidas  de  duas  manei¬ 
ras:  (1)  identificando  variáveis  de  pesquisa  anterior  ou  do 
modelo  teórico  inerente  à  questão  de  pesquisa,  e  (2)  uti¬ 
lizando  o  conhecimento  e  a  intuição  do  pesquisador  para 
selecionar  variáveis  para  as  quais  nenhuma  pesquisa  ou 
teoria  anterior  existem  mas  que  logicamente  podem  estar 
relacionadas  com  a  previsão  de  grupos  da  variável  depen¬ 
dente. 

A  análise  discriminante,  como  as  demais  técnicas  mul- 
tivariadas,  é  afetada  pelo  tamanho  da  amostra  sob  análi¬ 
se.  Uma  proporção  de  20  observações  para  cada  variável 
preditora  é  recomendada.  Como  os  resultados  se  tornam 
instáveis  à  medida  que  o  tamanho  da  amostra  diminui 
relativamente  ao  número  de  variáveis  independentes,  o 
tamanho  mínimo  recomendado  é  de  cinco  observações 
por  variável  independente.  O  tamanho  amostrai  de  cada 
grupo  também  deve  ser  considerado.  No  mínimo,  o  ta¬ 
manho  do  menor  grupo  de  uma  categoria  deve  exceder 
o  número  de  variáveis  independentes.  Como  orientação 
prática,  cada  categoria  deve  ter  pelo  menos  20  observa¬ 
ções.  Mesmo  que  todas  as  categorias  ultrapassem  20  ob¬ 
servações,  porém,  o  pesquisador  também  deve  considerar 
os  tamanhos  relativos  dos  grupos.  Variações  grandes  nos 
tamanhos  dos  grupos  afetam  a  estimação  da  função  discri¬ 
minante  e  a  classificação  de  observações. 

Compreender  as  suposições  subjacentes  à  análise  discri¬ 
minante  na  avaliação  de  sua  adequação  a  um  problema 

em  particular.  As  suposições  da  análise  discriminante  se 
relacionam  aos  processos  estatísticos  envolvidos  nos  pro¬ 
cedimentos  de  estimação  e  classificação,  bem  como  aos 
problemas  que  afetam  a  interpretação  dos  resultados.  As 
suposições-chave  para  se  obter  a  função  discriminante  são 
normalidade  multivariada  das  variáveis  independentes,  e 
estruturas  (matrizes)  desconhecidas  (mas  iguais)  de  dis¬ 
persão  e  covariância  para  os  grupos  como  definidos  pela 
variável  dependente.  Se  as  suposições  são  violadas,  o  pes¬ 
quisador  deve  entender  o  impacto  sobre  os  resultados  que 
podem  ser  esperados  e  considerar  métodos  alternativos 
para  análise  (p.ex.,  regressão  logística). 

Descrever  as  duas  abordagens  computacionais  para  análi¬ 
se  discriminante  e  o  método  para  avaliação  de  ajuste  geral 

do  modelo.  As  duas  técnicas  para  análise  discriminante 
são  os  métodos  simultâneo  (direto)  e  stepwise.  A  estima¬ 
ção  simultânea  envolve  a  computação  da  função  discrimi¬ 
nante  considerando  todas  as  variáveis  independentes  ao 
mesmo  tempo.  Portanto,  a  função  discriminante  é  com¬ 
putada  com  base  no  conjunto  inteiro  de  variáveis  inde¬ 
pendentes,  independentemente  do  poder  discriminante 
de  cada  variável  independente.  A  estimação  stepwise  é 
uma  alternativa  ao  método  simultâneo.  Ela  envolve  a  en¬ 
trada  de  variáveis  independentes  uma  por  vez  com  base 
no  poder  discriminante  das  mesmas.  O  método  stepwise 
segue  um  processo  seqüencial  de  adição  ou  eliminação  de 


variáveis  da  função  discriminante.  Depois  que  esta  é  esti¬ 
mada,  o  pesquisador  deve  avaliar  a  significância  ou  ajuste 
da  mesma.  Quando  um  método  simultâneo  é  empregado, 
o  lambda  de  Wilks,  o  traço  de  Hotelling  e  o  critério  de 
Pillai  calculam  a  significância  estatística  do  poder  discri¬ 
minatório  da  função  estimada.  Se  um  método  stepwise  é 
usado  para  estimar  a  função  discriminante,  o  de  Maha- 
lanobis  e  a  medida  V  de  Rao  são  os  mais  adequados  para 
avaliar  ajuste. 

Explicar  o  que  é  uma  matriz  de  classificação  e  como  de¬ 
senvolver  uma,  e  descrever  as  maneiras  de  se  avaliar  a 
precisão  preditiva  da  função  discriminante.  Os  testes 
estatísticos  para  avaliar  a  significância  das  funções  discri¬ 
minantes  avaliam  apenas  o  grau  de  diferença  entre  grupos 
com  base  nos  escores  Z  discriminantes,  mas  não  indicam 
o  quão  bem  as  funções  prevêem.  Para  determinar  a  habi¬ 
lidade  preditiva  de  uma  função  discriminante,  o  pesqui¬ 
sador  deve  construir  matrizes  de  classificação.  O  procedi¬ 
mento  da  matriz  de  classificação  fornece  uma  perspectiva 
sobre  significância  prática  no  lugar  de  significância  esta¬ 
tística.  Antes  que  uma  matriz  de  classificação  possa  ser 
construída,  no  entanto,  o  pesquisador  deve  determinar  o 
escore  de  corte  para  cada  função  discriminante.  O  escore 
de  corte  representa  o  ponto  de  divisão  utilizado  para  clas¬ 
sificar  observações  em  cada  um  dos  grupos,  baseado  no 
escore  da  função  discriminante.  O  cálculo  de  um  escore 
de  corte  entre  dois  grupos  quaisquer  é  sustentado  pelos 
dois  centróides  de  grupo  (média  dos  escores  discriminan¬ 
tes)  e  pelos  tamanhos  relativos  dos  dois  grupos.  Os  resul¬ 
tados  do  procedimento  de  classificação  são  apresentados 
em  forma  matricial.  As  entradas  na  diagonal  da  matriz 
representam  o  número  de  indivíduos  corretamente  clas¬ 
sificados.  Os  números  fora  da  diagonal  correspondem  a 
classificações  incorretas.  O  percentual  corretamente  clas¬ 
sificado,  também  conhecido  como  razão  de  sucesso,  revela 
o  quão  bem  a  função  discriminante  prevê  os  objetos.  Se  os 
custos  da  má  classificação  forem  aproximadamente  iguais 
para  todos  os  grupos,  o  escore  de  corte  ótimo  será  aquele 
que  classificar  mal  o  menor  número  de  objetos  ao  longo 
de  todos  os  grupos.  Se  os  custos  de  má  classificação  forem 
desiguais,  o  escore  de  corte  ótimo  será  aquele  que  mini¬ 
miza  os  custos  de  má  classificação.  Para  avaliar  a  razão  de 
sucesso,  devemos  olhar  para  uma  classificação  por  chan¬ 
ces.  Quando  os  tamanhos  de  grupos  são  iguais,  a  determi¬ 
nação  da  classificação  por  chances  se  baseia  no  número  de 
grupos.  Quando  os  tamanhos  dos  grupos  são  distintos,  o 
cálculo  da  classificação  por  chances  pode  ser  feito  de  duas 
maneiras:  chance  máxima  e  chance  proporcional. 

Dizer  como  identificar  variáveis  independentes  com  po¬ 
der  discriminatório.  Se  a  função  discriminante  é  estatis¬ 
ticamente  significante  e  a  precisão  de  classificação  (razão 
de  sucesso)  é  aceitável,  o  pesquisador  deve  se  concentrar 
na  realização  de  interpretações  substanciais  das  descober¬ 
tas.  Este  processo  envolve  a  determinação  da  importância 
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relativa  de  cada  variável  independente  na  discriminação 
entre  os  grupos.  Três  métodos  de  determinação  da  impor¬ 
tância  relativa  foram  propostos:  (1)  pesos  discriminan¬ 
tes  padronizados,  (2)  cargas  discriminantes  (correlações 
estruturais)  e  (3)  valores  F  parciais.  A  abordagem  tradi¬ 
cional  para  interpretar  funções  discriminantes  examina 
o  sinal  e  a  magnitude  do  peso  discriminante  padronizado 
designado  para  cada  variável  na  computação  das  funções 
discriminantes.  Variáveis  independentes  com  pesos  re¬ 
lativamente  maiores  contribuem  mais  para  o  poder  dis¬ 
criminatório  da  função  do  que  variáveis  com  pesos  me¬ 
nores.  O  sinal  denota  se  a  variável  contribui  negativa  ou 
positivamente.  Cargas  discriminantes  são  cada  vez  mais 
usadas  como  uma  base  para  interpretação  por  conta  das 
deficiências  na  utilização  de  pesos.  Medindo  a  correla¬ 
ção  linear  simples  entre  cada  variável  independente  e  a 
função  discriminante,  as  cargas  discriminantes  refletem  a 
variância  que  as  variáveis  independentes  compartilham 
com  a  função  discriminante.  Elas  podem  ser  interpretadas 
como  cargas  fatoriais  na  avaliação  da  contribuição  relati¬ 
va  de  cada  variável  independente  à  função  discriminante. 
Quando  um  método  de  estimação  stepwise  é  usado,  uma 
maneira  adicional  de  interpretar  o  poder  discriminatório 
relativo  das  variáveis  independentes  é  através  do  empre¬ 
go  de  valores  E  parciais,  o  que  se  consegue  examinando-se 
os  tamanhos  absolutos  dos  valores  E  significantes  e  orde- 
nando-os.  Valores  E  grandes  indicam  um  poder  discrimi¬ 
natório  maior. 

Justificar  o  uso  de  um  método  de  divisão  de  amostra  para 
validação.  O  estágio  final  de  uma  análise  discriminante 
envolve  a  validação  dos  resultados  discriminantes  para 
fornecer  garantias  de  que  os  mesmos  têm  tanto  validade 
interna  quanto  externa.  Além  de  validar  as  razões  de  su¬ 
cesso,  o  pesquisador  deve  usar  o  perfil  dos  grupos  para 
garantir  que  as  médias  deles  são  indicadores  válidos  do 
modelo  conceituai  utilizado  na  seleção  das  variáveis  in¬ 
dependentes.  Validação  pode  ocorrer  com  uma  amostra 
separada  (de  teste)  ou  utilizando  um  procedimento  que 
repetidamente  processa  a  amostra  de  estimação.  Valida¬ 
ção  das  razões  de  sucesso  é  executada  muito  freqüente- 
mente  criando-se  uma  amostra  de  teste,  também  chama¬ 
da  de  amostra  de  validação.  O  propósito  da  utilização  de 
uma  amostra  de  teste  para  fins  de  validação  é  perceber  o 
quão  bem  a  função  discriminante  funciona  em  uma  amos¬ 
tra  de  observações  que  não  foram  usadas  para  obtê-la.  Tal 
avaliação  envolve  o  desenvolvimento  de  uma  função  dis¬ 
criminante  com  a  amostra  de  análise  e  então  a  aplicação 
da  função  à  amostra  de  teste. 

Entender  as  vantagens  e  desvantagens  da  regressão  lo¬ 
gística  comparada  com  análise  discriminante  e  regressão 

múltipla.  Análise  discriminante  é  apropriada  quando  a 
variável  dependente  é  não-métrica.  Se  ela  tiver  apenas 
dois  grupos,  então  a  regressão  logística  pode  ser  prefe¬ 
rível  por  duas  razões.  Primeiro,  a  análise  discriminante 


apóia-se  no  atendimento  estrito  das  suposições  de  nor¬ 
malidade  multivariada  e  igualdade  entre  as  matrizes  de 
variância-covariância  nos  grupos  -  premissas  que  não  são 
atendidas  em  muitas  situações.  A  regressão  logística  não 
se  depara  com  tais  restrições  e  é  muito  mais  robusta  quan¬ 
do  essas  suposições  não  são  atendidas,  tornando  sua  apli¬ 
cação  adequada  em  muitos  casos.  Segundo,  mesmo  que 
as  suposições  sejam  atendidas,  muitos  pesquisadores  pre¬ 
ferem  a  regressão  logística  por  ser  semelhante  à  regres¬ 
são  múltipla.  Como  tal,  ela  tem  testes  estatísticos  diretos, 
métodos  semelhantes  para  incorporar  variáveis  métricas  e 
não-métricas  e  efeitos  não-lineares,  bem  como  uma  vasta 
gama  de  diagnósticos.  A  regressão  logística  é  equivalen¬ 
te  à  análise  discriminante  de  dois  grupos  e  pode  ser  mais 
adequada  em  muitas  situações. 

Interpretar  os  resultados  de  uma  análise  de  regressão  lo¬ 
gística,  com  comparações  com  regressão  múltipla  e  análise 
discriminante.  A  adequação  de  ajuste  para  um  modelo 
de  regressão  logística  pode  ser  avaliada  de  duas  maneiras: 
(1)  usando  valores  pseudo  E^,  semelhantes  àqueles  en¬ 
contrados  em  regressão  múltipla,  e  (2)  examinando  pre¬ 
cisão  preditiva  (i.e.,  a  matriz  de  classificação  em  análise 
discriminante).  As  duas  abordagens  examinam  ajuste  de 
modelo  sob  diferentes  perspectivas,  mas  devem  conduzir 
a  resultados  semelhantes.  Uma  das  vantagens  da  regres¬ 
são  logística  é  que  precisamos  saber  apenas  se  um  evento 
ocorreu  para  definir  um  valor  dicotômico  como  nossa  va¬ 
riável  dependente.  Quando  analisamos  esses  dados  usan¬ 
do  transformação  logística,  contudo,  a  regressão  logísti¬ 
ca  e  seus  coeficientes  assumem  um  significado  um  tanto 
diferente  daqueles  encontrados  em  regressão  com  uma 
variável  dependente  métrica.  Analogamente,  cargas  em 
análise  discriminante  são  interpretadas  diferentemente 
de  um  coeficiente  logístico.  Este  último  reflete  a  direção 
e  a  magnitude  da  relação  da  variável  independente,  mas 
requer  diferentes  métodos  de  interpretação.  A  direção 
da  relação  (positiva  ou  negativa)  retrata  as  variações  na 
variável  dependente  associadas  com  mudanças  na  inde¬ 
pendente.  Uma  relação  positiva  significa  que  um  aumento 
na  variável  independente  é  associado  com  um  aumento 
na  probabilidade  prevista,  e  vice-versa  para  uma  relação 
negativa. Para  determinar  a  magnitude  do  coeficiente,  ou 
o  quanto  que  a  probabilidade  mudará  dada  uma  unidade 
de  variação  na  variável  independente,  o  valor  numérico 
do  coeficiente  deve  ser  avaliado.  Exatamente  como  em 
regressão  múltipla,  os  coeficientes  para  variáveis  métricas 
e  não-métricas  devem  ser  interpretados  diferentemente 
porque  cada  um  reflete  diferentes  impactos  sobre  a  variá¬ 
vel  dependente. 

A  análise  discriminante  múltipla  e  a  regressão  logís¬ 
tica  ajudam  a  compreender  e  explicar  problemas  de  pes¬ 
quisa  que  envolvem  uma  variável  dependente  categórica 
e  diversas  variáveis  independentes  métricas.  Ambas  as 
técnicas  podem  ser  usadas  para  estabelecer  o  perfil  das 
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características  entre  grupos  dos  indivíduos  e  designar  os 
mesmos  a  seus  grupos  apropriados.  Aplicações  potenciais 
dessas  duas  técnicas  tanto  em  negócios  como  em  outras 
áreas  são  inúmeras. 

Questões 

1.  Como  você  diferenciaria  entre  análise  discriminante  múl¬ 
tipla,  análise  de  regressão,  regressão  logística  e  análise  de 
variância? 

2.  Quando  você  empregaria  regressão  logística  no  lugar  de 
análise  discriminante?  Quais  são  as  vantagens  e  desvanta¬ 
gens  dessa  decisão? 

3.  Quais  critérios  você  poderia  usar  para  decidir  se  deve  parar 
uma  análise  discriminante  depois  de  estimar  a  função  discri¬ 
minante?  Depois  do  estágio  de  interpretação? 

4.  Qual  procedimento  você  seguiria  para  dividir  sua  amostra 
em  grupos  de  análise  e  de  teste?  Como  você  mudaria  este 
procedimento  se  sua  amostra  consistisse  de  menos  do  que 
100  indivíduos  ou  objetos? 

5.  Como  você  determinaria  o  escore  de  corte  ótimo? 

6.  Como  você  determinaria  se  a  precisão  de  classificação  da 
função  discriminante  é  suficientemente  alta  relativamente  a 
uma  classificação  ao  acaso? 

7.  Como  uma  análise  discriminante  de  dois  grupos  difere  de 
uma  análise  de  três  grupos? 

8.  Por  que  um  pesquisador  deve  expandir  as  cargas  e  dados 
do  centróide  ao  representar  graficamente  uma  solução  de 
análise  discriminante? 

9.  Como  a  regressão  logística  e  a  análise  discriminante  lidam 
com  a  relação  das  variáveis  dependente  e  independentes? 

10.  Quais  são  as  diferenças  de  estimação  e  interpretação  entre 
regressão  logística  e  análise  discriminante? 

11.  Explique  o  conceito  de  razão  de  desigualdades  e  por  que  ela 
é  usada  para  prever  probabilidade  em  um  procedimento  de 
regressão  logística. 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  ilustrando  questões  e  apli¬ 
cações  da  análise  discriminante  e  regressão  logística  está 
disponível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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CAPITULO 


Análise  Multívaríada  de  Variância 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Explicar  a  diferença  entre  a  hipótese  nula  univariada  de  ANOVA  e  a  hipótese  nula 
multivariada  de  MANOVA. 

■  Discutir  as  vantagens  de  uma  abordagem  multivariada  para  teste  de  significância  comparada 
com  as  das  abordagens  univariadas  mais  tradicionais. 

■  Formular  as  suposições  para  o  uso  de  MANOVA. 

■  Discutir  os  diferentes  tipos  de  estatístioas  de  teste  que  estão  disponíveis  para  teste  de 
significânoia  em  MANOVA. 

■  Desorever  o  propósito  de  testes  post  hoc  em  ANOVA  e  MANOVA. 

■  Interpretar  resultados  de  interação  quando  mais  de  uma  variável  independente  é  empregada 
em  MANOVA. 

■  Desorever  o  propósito  da  análise  multivariada  de  covariãncia  (MANCOVA). 


Apresentação  do  capítulo 

A  análise  multivariada  de  variância  (MANOVA)  é  uma  extensãc  da  análise  de  variância  (ANOVA)  para 
accmcdar  mais  de  uma  variável  dependente.  É  uma  técnica  de  dependência  que  mede  as  diferenças 
para  duas  cu  mais  variáveis  dependentes  métricas,  ccm  base  em  um  ccnjuntc  de  variáveis  categóricas 
(nãc-métricas)  que  atuam  ccmc  variáveis  independentes.  ANOVA  e  MANOVA  podem  ser  enunciadas 
nas  seguintes  formas  gerais: 

Análise  de  Variância 

+  X2  +  X3  +  .  .  .  + 

(métrica)  (não-métrica) 

Análise  Multivariada  de  Variância 

y^+y,+  y,+  ...  +  y„=x,  +  x,+  x,+  ...  +  x„ 

(métrica)  (não-métrica) 

Assim  como  ANOVA,  MANOVA  está  interessada  em  diferenças  entre  grupos  (ou  tratamentos  expe¬ 
rimentais).  ANOVA  é  chamada  de  procedimento  univariado  pelo  fato  de  usarmos  a  mesma  para  avaliar 
diferenças  de  grupos  em  uma  única  variável  dependente  métrica.  MANOVA  é  chamada  de  procedimen¬ 
to  multivariado  porque  usamos  a  mesma  para  avaliar  diferenças  de  grupos  em  múltiplas  variáveis  de¬ 
pendentes  métricas  simultaneamente.  Em  MANOVA,  cada  grupo  de  tratamento  é  observado  em  duas 
ou  mais  variáveis  dependentes. 

O  conceito  de  análise  multivariada  de  variância  foi  introduzido  há  mais  de  70  anos  por  Wilks  [26]. 
No  entanto,  não  foi  antes  do  desenvolvimento  de  estatísticas  de  teste  apropriadas  com  distribuições 
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tabeladas  e  da  ampla  disponibilidade  de  programas  de  computador  para  processar  essas  estatísticas 
que  MANOVA  se  tornou  uma  ferramenta  prática  para  pesquisadores. 

Tanto  ANOVA  quanto  MANOVA  são  particularmente  úteis  quando  usadas  em  conjunto  com  planeja¬ 
mentos  experimentais,  ou  seja,  delineamentos  de  pesquisa  nos  quais  o  pesquisador  controla  ou  mani¬ 
pula  diretamente  uma  ou  mais  variáveis  independentes  para  determinar  o  efeito  sobre  a(s)  variável(eis) 
dependente(s).  ANOVA  e  MANOVA  fornecem  as  ferramentas  necessárias  para  julgar  os  efeitos  obser¬ 
vados  (ou  seja,  se  uma  diferença  observada  ocorre  devido  a  um  efeito  de  tratamento  ou  à  variabilidade 
de  amostragem  aleatória).  No  entanto,  MANOVA  tem  também  um  papel  em  planejamentos  não-experi¬ 
mentais  (p.ex.,  em  levantamentos  de  informações)  onde  grupos  de  interesse  (p.ex.,  sexo,  comprador/ 
não-comprador)  são  definidos  e  então  as  diferenças  em  qualquer  número  de  variáveis  métricas  (p.ex., 
atitudes,  satisfação,  taxa  de  compras)  são  avaliadas  quanto  ã  significância  estatística. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  de¬ 
senvolver  uma  compreensão  dos  conceitos  e  da  terminologia 
empregados.  Ao  longo  do  capítulo,  os  termos-chave  apare¬ 
cem  em  negrito.  Outros  pontos  que  merecem  destaque  no 
capítulo  e  referências  cruzadas  estão  em  itálico.  Exemplos 
ilustrativos  estão  em  quadros. 

Alfa  (a)  Nível  de  significância  associado  ao  teste  estatístico  das 
diferenças  entre  dois  ou  mais  grupos.  Normalmente,  valores 
pequenos,  como  0,05  ou  0,0f ,  são  especificados  para  minimi¬ 
zar  a  possibilidade  de  se  cometer  um  erro  Tipo  I. 

Análise  de  variãncícRaMtBMia  (Técnica  estatística  usada  para 
liíêtérmlnar  se  as  ãmõslrãs  ãe  goTs  õu  rhãfs  ÜfuBos  sui^ém  âé) 
populações  com  rTOdtâíhfguais  (ou  seja,  as  médias  de  grupos 
diferem  significativâmenté?).  A  análise  de  Variância  examina : 
uma  medida  dependente,  ao  passo  que  a  análise  multivariada 
de  variância  compara  diferenças  de  grupos  quanto  a  duas  ou 
:maTs  vãriâvéirçlépendèntes. 

Análise  stepdown  Teste  para  o  poder  discriminatório  incre¬ 
mental  de  uma  variável  dependente  depois  que  os  efeitos  de 
outras  variáveis  dependentes  foram  levados  em  conta.  Seme¬ 
lhante  à  regressão  ou  análise  discriminante  stepwise,  esse 
procedimento,  que  se  baseia  em  uma  ordem  especificada  de 
entrada,  determina  o  quanto  uma  variável  dependente  adicio¬ 
nal  acrescenta  à  explicação  das  diferenças  entre  os  grupos 
na  análise  MANOVA. 

Beta  (p)  Ver  erro  Tipo  II. 

Comparação  planejada  Teste  a  priori  para  uma  comparação 
específica  de  diferenças  de  médias  de  grupos.  Esses  testes 
são  executados  em  conjunto  com  os  testes  para  efeitos  prin- 
oipal  e  de  interação  usando-se  um  contraste. 

Contraste  Procedimento  para  investigar  diferenças  específicas 
de  grupos  de  interesse  em  conjunção  com  ANOVA  e  MANO¬ 
VA  (p.ex.,  comparar  diferenças  de  médias  de  grupos  para  um 
par  específico  de  grupos). 

Covarlávels,  ou  análise  de  covarlávels  Uso  de  procedimentos 
do  tipo  regressão  para  remover  variação  estranha  (inconve¬ 
niente)  nas  variáveis  dependentes  devido  a  uma  ou  mais  va¬ 
riáveis  independentes  métricas  (covarlávels)  não  controladas. 
As  covariáveis  são  consideradas  linearmente  relacionadas 
com  as  variáveis  dependentes.  Depois  de  se  ajustar  a  influên¬ 
cia  de  covariáveis,  uma  ANOVA  ou  MANOVA  padrão  é  rea¬ 
lizada.  Esse  processo  de  ajuste  (conhecido  como  ANCOVA 


ou  MANCOVA)  geralmente  permite  testes  mais  sensíveis  de 
efeitos  de  tratamento. 

Desigualdade  de  Bonferronl  Técnica  para  ajustar  o  nível  alfa 
selecionado  para  controle  da  taxa  de  erro  Tipo  I  geral  quando 
se  executa  uma  série  de  testes  separados.  O  procedimento 
envolve  o  cálculo  de  um  novo  valor  crítico  dividindo-se  a  taxa 
a  proposta  pelo  número  de  testes  estatísticos  a  serem  exe¬ 
cutados.  Por  exemplo,  se  um  nível  de  significância  de  0,05 
é  desejado  para  uma  série  de  cinco  testes  separados,  então 
uma  taxa  de  0,01  (0,05/5)  é  utilizada  em  cada  um. 

Distribuição  normal  multivariada  Generalização  da  distribui¬ 
ção  normal  univariada  para  o  caso  de  p  variáveis.  Uma  dis¬ 
tribuição  normal  multivariada  de  grupos  de  amostras  é  uma 
suposição  básica  exigida  para  a  validade  dos  testes  de  sig¬ 
nificância  em  MANOVA  (ver  Capítulo  2  para  mais  discussão 
sobre  este  tópico). 

Efeito  de  Interação  Em  planejamentos  fatoriais,  os  efeitos 
conjuntos  de  duas  variáveis  de  tratamento  em  adição  aos 
efeitos  prinoipais  individuais.  Isso  significa  que  a  diferença 
entre  grupos  quanto  a  uma  variável  de  tratamento  varia  de 
acordo  com  o  nível  da  segunda  variável  de  tratamento.  Por 
exemplo,  considere  que  os  respondentes  foram  classifica¬ 
dos  por  renda  (três  níveis)  e  sexo  (homens  versus  mulheres). 
Uma  interação  significante  seria  encontrada  quando  as  di¬ 
ferenças  entre  homens  e  mulheres  quanto  à  (s)  variável(eis) 
independente(s)  variassem  substancialmente  ao  longo  dos 
três  níveis  de  renda. 

Efeito  principal  Em  planejamentos  fatoriais,  o  efeito  individual 
de  cada  variável  de  tratamento  sobre  a  variável  dependente. 

Erro  padrão  Medida  da  dispersão  das  médias  ou  das  diferen¬ 
ças  das  médias  esperada  devido  ã  variação  amostrai.  O  erro 
padrão  é  usado  no  cálculo  da  estatística  t 

Erro  Tipo  I  Probabilidade  de  rejeitar  a  hipótese  nula  quando 
ela  deveria  ser  aceita,  ou  seja,  concluir  que  duas  médias  são 
significantemente  diferentes  quando  na  verdade  são  iguais. 
Valores  pequenos  de  alfa  {p.ex.,  0,05  ou  0,01),  também  deno¬ 
tados  como  a,  levam  à  rejeição  da  hipótese  nula  e  aceitação 
da  hipótese  alternativa  de  que  as  médias  das  populações  não 
são  iguais. 

Erro  Tipo  II  Probabilidade  de  se  falhar  na  rejeição  da  hipótese 
nula  quando  ela  deveria  ser  rejeitada,  ou  seja,  concluir  que 
duas  médias  não  são  significantemente  diferentes  quando  na 
verdade  o  são.  Também  conhecido  como  erro  beta  ((3). 

Estatística  U  Ver  lambda  de  Wllks. 
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Estatística  f  Teste  estatístico  que  avalia  a  significância  estatísti¬ 
ca  entre  dois  grupos  em  uma  única  variável  dependente  (ver 
teste  t). 

Fator  Variável  independente  não-métrica,  também  chamada  de 
tratamento  ou  variável  experimental. 

Fator  de  blocagem  Característica  de  respondentes  em  ANO- 
VA  ou  MANOVA  que  é  usada  para  reduzir  a  variabilidade 
interna  do  grupo  tornando-se  um  fator  adicional  na  análise. 
Muito  freqüentemente  usada  como  uma  variável  de  controle 
(ou  seja,  característica  não  incluída  na  análise,  mas  uma  pela 
qual  diferenças  são  esperadas  ou  propostas).  Incluindo-se  fa¬ 
tor  de  blocagem  na  anãlise,  são  formados  grupos  adicionais 
que  são  mais  homogêneos  e  aumentam  a  chance  de  mostrar 
diferenças  significantes.  Como  exemplo,  considere  que  clien¬ 
tes  são  questionados  sobre  suas  intenções  de  compra  de  um 
produto  e  que  a  medida  independente  empregada  é  idade. 
Experiência  anterior  mostrou  que  uma  variação  substancial 
em  intenções  de  compras  de  outros  produtos  deste  tipo  era 
devida  também  a  sexo.  Logo,  sexo  poderia  ser  acrescenta¬ 
do  como  um  fator  adicional,  de  forma  que  cada  categoria  de 
idade  fosse  dividida  em  grupos  de  homens  e  mulheres  com 
maior  homogeneidade  interna. 

Função  discriminante  Dimensão  de  diferença  ou  discriminação 
entre  os  grupos  na  análise  MANOVA.  A  função  discriminante  é 
uma  variável  estatística  das  variáveis  dependentes. 

Função  de  ligação  Uma  componente  fundamental  de  GLM  que 
especifica  a  transformação  entre  a  variável  estatística  de  va¬ 
riáveis  independentes*  e  a  distribuição  especificada  de  pro¬ 
babilidade.  Em  MANOVA  (e  regressão),  a  ligação  identidade 
é  usada  com  uma  distribuição  normal,  correspondendo  a  nos¬ 
sas  suposições  estatísticas  de  normalidade. 

Hipótese  nula  Hipótese  com  amostras  que  surgem  de  popu¬ 
lações  com  médias  iguais  (i.e.,  as  médias  de  grupos  são 
iguais)  para  uma  variãvel  dependente  (teste  univariado)  ou 
um  conjunto  de  variáveis  dependentes  (teste  multivariado).  A 
hipótese  nula  pode  ser  aceita  ou  rejeitada,  dependendo  dos 
resultados  de  um  teste  de  significância  estatística. 

Independência  Suposição  crítica  de  ANOVA  ou  MANOVA  que 
requer  que  as  medidas  dependentes  para  cada  respondente 
sejam  totalmente  não-correlacionadas  com  as  respostas  de 
outros  respondentes  na  amostra.  Uma  falta  de  independência 
afeta  severamente  a  validade  estatística  da  análise  a  menos 
que  uma  ação  corretiva  seja  realizada. 

Interação  desordinal  Forma  de  efeito  de  interação  entre  variá¬ 
veis  independentes  que  invalida  a  interpretação  dos  efeitos 
principais  dos  tratamentos.  Uma  interação  desordinal  é  mos¬ 
trada  graficamente  fazendo-se  o  grãfico  das  médias  para 
cada  grupo  e  fazendo-se  a  intersecção  de  retas.  Nesse  tipo 
de  interação,  as  diferenças  médias  não  apenas  variam,  dadas 
as  combinações  únicas  de  níveis  de  variável  independente, 
mas  a  ordenação  relativa  de  grupos  também  muda. 

Interação  ordinal  Tipo  aceitável  de  efeito  de  interação  no  qual 
as  magnitudes  de  diferenças  entre  grupos  variam,  mas  as  po¬ 
sições  relativas  dos  grupos  permanecem  constantes.  É  grafi¬ 
camente  representada  com  valores  médios  e  observando-se 
retas  não-paralelas  que  não  se  interceptam. 


*  N.  de  R.  T:  A  frase  correta  seria  “variáveis  dependentes”. 


Lambda  de  Wilks  Uma  das  quatro  principais  estatísticas  para 
testar  a  hipótese  nula  em  MANOVA.  Também  chamado  de  cri¬ 
tério  de  máxima  verossimilhança  ou  estatística  U. 

Maior  raiz  característica  (gcr)  Estatística  para  testar  a  hipótese 
nula  em  MANOVA.  Ela  testa  a  primeira  função  discriminante 
das  variáveis  dependentes  em  relação  á  sua  habilidade  de 
distinguir  diferenças  de  grupos. 

Medidas  repetidas  Uso  de  duas  ou  mais  respostas  de  um  único 
indivíduo  em  uma  análise  ANOVA  ou  MANOVA.  O  propósito 
de  um  delineamento  de  medidas  repetidas  é  controlar  as  di¬ 
ferenças  de  nível  individual  que  possam  afetar  a  variância  in¬ 
terna  no  grupo.  As  medidas  repetidas  representam  uma  falta 
de  independência  que  deve  ser  explicada  de  uma  maneira 
especial  na  análise. 

Modeio  iinear  gerai  (GLM)  Procedimento  generalizado  de 
estimação  baseado  em  três  componentes:  (1)  uma  variável 
estatística  formada  pela  combinação  linear  de  variáveis  in¬ 
dependentes,  (2)  uma  distribuição  de  probabilidade  especi¬ 
ficada  pelo  pesquisador  com  base  nas  características  das 
variáveis  dependentes,  e  (3)  uma  função  de  ligação  que  de¬ 
nota  a  conexão  entre  a  variável  estatística  e  a  distribuição  de 
probabilidade. 

Nível  de  significância  Ver  alfa. 

Ortogonal  Independência  estatística  ou  ausência  de  associa¬ 
ção.  As  variáveis  estatísticas  ortogonais  explicam  a  variância 
única,  sem  qualquer  explicação  de  variância  compartilhada 
entre  elas.  Contrastes  ortogonais  são  comparações  planeja¬ 
das  estatisticamente  independentes  e  representam  compara¬ 
ções  únicas  de  médias  de  grupos. 

Planejamento  experimental  Plano  de  pesquisa  no  qual  o 
pesquisador  manipula  ou  controla  diretamente  uma  ou  mais 
variáveis  preditoras  (ver  tratamento  ou  fator)  e  avalia  seus 
efeitos  sobre  as  variáveis  dependentes.  Comum  nas  ciên¬ 
cias  físicas,  está  se  tornando  popular  nos  negócios  e  em 
ciências  sociais.  Por  exemplo,  os  respondentes  são  confron¬ 
tados  com  anúncios  separados  que  variam  sistematicamen¬ 
te  em  uma  característica,  como  diferentes  apelos  (emocional 
versus  racional)  ou  tipos  de  apresentação  (colorido  versus 
preto-e-branco),  e  são  então  questionados  sobre  suas  ati¬ 
tudes,  avaliações  ou  sentimentos  em  relação  aos  diferentes 
anúncios. 

Planejamento  fatorial  Delineamento  com  mais  de  um  fetor  (tra¬ 
tamento).  Os  planejamentos  fatoriais  examinam  os  efeitos  de 
diversos  fatores  simultaneamente,  formando  grupos  basea¬ 
dos  em  todas  as  possíveis  combinações  de  níveis  (valores) 
das  diversas  variáveis  de  tratamento. 

Poder  Probabilidade  de  identificar  um  efeito  de  tratamento 
quando  ele  realmente  existe  na  amostra.  O  poder  é  definido 
como  1  -  p  (ver  beta).  É  determinado  como  uma  função  do 
nível  de  significância  estatística  (a)  dado  pelo  pesquisador 
para  um  erro  Tipo  /,  do  tamanho  da  amostra  usada  na  anãlise, 
e  do  tamanho  do  efeito  sob  exame. 

Replicação  Administração  repetida  de  um  experimento  com  o 
intento  de  validar  os  resultados  em  uma  outra  amostra  de  res¬ 
pondentes. 

T^de  Hoteiling  Teste  para  avaliar  a  significância  estatística  da 
diferença  nas  médias  de  duas  ou  mais  variáveis  entre  dois 
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grupos.  É  um  caso  especial  de  MANOVA  usado  com  dois  gru¬ 
pos  ou  níveis  de  uma  variável  de  tratamento. 

Tamanho  de  efeito  Medida  padronizada  de  diferenças  de  gru¬ 
pos  usada  no  cálculo  de  poder  estatístico.  Calculado  como  a 
diferença  em  médias  de  grupos  dividida  pelo  desvio-padrão, 
é  então  comparável,  em  estudos  de  pesquisa,  a  uma  medi¬ 
da  generalizada  de  efeito  (ou  seja,  diferenças  em  médias  de 
grupos). 

Taxa  de  erro  de  experimento  A  faxa  de  erro  combinado  ou  ge¬ 
ral  que  resulfa  da  execução  de  múltiplos  testes  f  ou  Fque  são 
relacionados  (p.ex.,  testes  í  entre  uma  série  de  pares  correla¬ 
cionados  de  variáveis,  ou  uma  série  de  testes  f  entre  os  pares 
de  categorias  em  uma  variável  multicotômica). 

Tratamento  Variável  independente  {fator)  que  um  pesquisador 
manipula  para  ver  o  efeito  (se  houver)  sobre  as  variáveis  de¬ 
pendentes.  A  variável  de  tratamento  pode  ter  diversos  níveis. 
Por  exemplo,  diferentes  intensidades  de  apelos  de  publicida¬ 
de  podem  ser  manipuladas  para  ver  o  efeito  sobre  a  crença 
do  cliente. 

Teste  a  príori  Ver  comparação  planejada. 

Teste  M  de  Box  Teste  estatístico  para  a  igualdade  de  matrizes 
de  variância-covariância  das  variáveis  dependentes  ao  lon¬ 
go  dos  grupos.  É  sensível,  especialmente  diante  da  presença 
de  variáveis  não-normais.  O  uso  de  um  nível  de  significância 
conservador  (i.e.,  0,01  ou  menos)  é  sugerido  como  um  ajuste 
para  a  sensibilidade  da  estatística. 

Teste  post  hoc  Teste  estatístico  de  diferenças  de  médias  exe¬ 
cutado  depois  que  os  testes  estatísticos  para  efeitos  princi¬ 
pais  foram  realizados.  Em  geral,  os  testes  post  hoc  não  usam 
um  único  contraste,  mas  em  vez  disso  testam  diferenças  entre 
todas  as  possíveis  combinações  de  grupos.  Ainda  que  for¬ 
neçam  informação  diagnóstica  abundante,  eles  aumentam  a 
taxa  de  erro  Tipo  I  geral  fazendo  múltiplos  testes  estatísticos 
e,  por  isso,  devem  usar  níveis  de  confiança  muito  estritos. 

Teste  t  Teste  para  avaliar  a  significância  estatística  da  diferença 
entre  duas  médias  amostrais  para  uma  única  variável  depen¬ 
dente.  O  teste  té  um  caso  especial  de  ANOVA  para  dois  gru¬ 
pos  ou  níveis  de  uma  variável  de  tratamento. 

Valor  crítico  Valor  de  um  teste  estatístico  (teste  t,  teste  F)  que 
denota  um  nível  de  significância  especificado.  Por  exemplo, 
1,96  denota  um  nível  de  significância  de  0,05  para  o  teste  t 
com  grandes  amostras. 

Variável  estatística  Combinação  linear  de  variáveis.  Em  MA¬ 
NOVA,  as  variáveis  dependentes  são  formadas  em  variáveis 
estatísticas  na(s)  função(ões)  discriminante(s). 

Vetor  Conjunto  de  números  reais  (por  exemplo,  X,...  XJ  que 
podem  ser  escritos  em  colunas  ou  linhas.  Os  vetores  coluna 
são  considerados  convencionais,  e  os  vetores  linha  são  tidos 
como  transpostos.  Os  vetores  coluna  e  vetores  linha  são  mos¬ 
trados  como  se  segue: 


MANOVA:  EXTENSÃO  DOS  MÉTODOS 
UNIVARIADOS  PARA  AVALIAÇÃO 
DE  DIEERENÇAS  DE  GRUPOS 

Muitas  vezes  técnicas  multivariadas  são  extensões  de 
métodos  univariados,  como  no  caso  da  regressão  múl¬ 
tipla,  que  estende  a  regressão  simples  (com  apenas 
uma  variável  independente)  a  uma  análise  multivariada 
onde  duas  ou  mais  variáveis  independentes  podem  ser 
usadas.  Uma  situação  parecida  é  encontrada  na  análise 
de  diferenças  de  grupos.  Tais  procedimentos  são  classi¬ 
ficados  como  univariados  não  por  causa  do  número  de 
variáveis  independentes,  mas  por  conta  do  número  de 
variáveis  dependentes.  Em  regressão  múltipla,  os  ter¬ 
mos  univariado  e  multivariado  se  referem  à  quantia  de 
variáveis  independentes,  mas  para  ANOVA  e  MANO¬ 
VA  a  terminologia  se  aplica  ao  uso  de  uma  ou  múltiplas 
variáveis  dependentes.  Ambas  as  técnicas  são  há  bas¬ 
tante  tempo  associadas  com  a  análise  de  planejamentos 
experimentais. 

As  técnicas  univariadas  para  análise  de  diferenças 
de  grupos  são  o  teste  t  (2  grupos)  e  a  análise  de  variân¬ 
cia  (ANOVA)  para  2  ou  mais  grupos.  Os  procedimentos 
multivariados  equivalentes  são  o  7^  de  Hotelling  e  a  aná¬ 
lise  multivariada  de  variância,  respectivamente.  As  rela¬ 
ções  entre  os  procedimentos  univariado  e  multivariado 
são  como  se  segue: 


Número  de  variáveis 
dependentes 

Número  de  grupos  em 
variável  independente 

Uma 

(univariada) 

Duas  ou  mais 
(multivariada) 

Dois  grupos  (caso 
especializado) 

Teste  t 

7^  de 
Hotelling 

Dois  ou  mais  grupos 

Análise  de 

Análise 

(caso  generalizado) 

variância 

(ANOVA) 

multivariada 
de  variância 
(MANOVA) 

O  teste  í  e  o  7^  de  Hotelling  (ver  discussões  mais  de¬ 
talhadas  em  seções  adiante)  são  retratados  como  casos 
especializados  no  sentido  de  serem  limitados  à  avaliação 
de  apenas  dois  grupos  (categorias)  para  uma  variável  in¬ 
dependente,  ao  passo  que  ANOVA  e  MANOVA  tam¬ 
bém  podem  lidar  com  situações  de  dois  grupos,  bem  como 
análises  nas  quais  as  variáveis  independentes  têm  mais  de 
dois  grupos.  Antes  de  proceder  com  nossa  discussão  dos 
aspectos  únicos  de  MANOVA,  examinamos  os  princípios 
básicos  das  técnicas  univariadas. 


X 


X 

n 


X^=[X^X,...XJ 


Vetor  coluna  Vetor  linha 


Procedimentos  univariados  para 
avaliação  de  diferenças  de  grupos 

A  discussão  a  seguir  aborda  os  dois  tipos  mais  comuns  de 
procedimentos  univariados,  o  teste  t,  que  compara  uma 
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variável  dependente  ao  longo  de  dois  grupos,  e  ANOVA, 
usada  sempre  que  o  número  de  grupos  é  dois*  ou  mais. 

O  teste  t 

O  teste  t  avalia  a  significância  estatística  da  diferença  en¬ 
tre  duas  médias  de  amostras  independentes  para  uma  úni¬ 
ca  variável  dependente.  Ao  descrevermos  os  elementos 
básicos  do  teste  t  e  outros  testes  de  diferenças  de  grupos, 
abordamos  dois  tópicos:  planejamento  da  análise  e  teste 
estatístico. 

Planejamento  da  análise.  A  diferença  em  escores  médios 
de  grupos  é  o  resultado  de  designar  observações  (p.ex.,  res- 
pondentes)  a  um  dos  dois  grupos  com  base  em  seus  valores 
de  uma  variável  não-métrica  conhecida  como  fator  (tam¬ 
bém  chamada  de  tratamento).  Um  fator  é  uma  variável 
não-métrica,  muitas  vezes  empregada  em  um  planejamen¬ 
to  experimental  no  qual  ela  é  manipulada  com  categorias 
ou  níveis  pré-especificados  que  são  propostos  para  refletir 
diferenças  em  uma  variável  dependente.  Um  fator  pode 
também  ser  apenas  uma  variável  não-métrica  observada, 
como  sexo.  Em  qualquer  caso,  a  análise  é  fundamental¬ 
mente  a  mesma.  Um  exemplo  de  um  planejamento  experi¬ 
mental  simples  será  usado  para  ilustrar  tal  análise: 


Um  pesquisador  está  interessado  em  como  dois  diferen¬ 
tes  anúncios  -  um  informativo  e  outro  emocional  -  afe¬ 
tam  o  apelo  dos  mesmos.  Para  avaliar  as  possíveis  dife¬ 
renças,  dois  anúncios  refletindo  os  diferentes  apelos  são 
preparados.  Respondentes  são  em  seguida  escolhidos  ao 
acaso  para  receber  o  anúncio  informativo  ou  o  emoti¬ 
vo.  Depois  de  examinarem  o  anúncio,  cada  respondente 
deve  avaliar  o  apelo  da  mensagem  em  uma  escala  de  10 
pontos,  sendo  que  1  é  pobre  e  10  é  excelente. 


As  duas  diferentes  mensagens  representam  um  único 
fator  experimental  com  dois  níveis  (informativo  versus 
emocional).  A  avaliação  de  apelo  se  torna  a  variável  de¬ 
pendente.  A  meta  é  determinar  se  os  respondentes  que 
examinaram  o  anúncio  informativo  têm  uma  avaliação  de 
apelo  signiflcativamente  diferente  do  que  aqueles  que  vi¬ 
ram  o  anúncio  com  a  mensagem  emocional.  Neste  caso,  o 
fator  foi  experimentalmente  manipulado  (ou  seja,  os  dois 
níveis  de  tipo  de  mensagem  foram  criados  pelo  pesqui¬ 
sador),  mas  o  mesmo  processo  básico  poderia  ser  usado 
para  examinar  diferença  em  uma  variável  dependente 
para  quaisquer  dois  grupos  de  respondentes  (p.ex.,  ho¬ 
mens  versus  mulheres,  clientes  versus  não-clientes  etc.). 
Com  os  respondentes  designados  a  grupos  com  base  em 
seus  valores  do  fator,  o  próximo  passo  é  avaliar  se  as  dife¬ 
renças  entre  os  grupos  em  termos  da  variável  dependente 
são  estatisticamente  signiflcantes. 


*  N.  de  R.  T.:  A  frase  correta  seria  “sempre  que  o  número  de  grupos 
é  três  ou  mais”. 


Teste  estatístico.  Para  determinar  se  o  tratamento  tem 
um  efeito  (ou  seja,  os  dois  anúncios  têm  diferentes  níveis 
de  apelo?),  um  teste  estatístico  é  executado  sobre  as  dife¬ 
renças  entre  os  escores  médios  (i.e.,  avaliação  de  apelo) 
para  cada  grupo  (aqueles  que  vêem  os  anúncios  emocio¬ 
nais  versus  aqueles  que  vêem  os  informativos). 

Cálculo  da  estatística  t.  A  medida  usada  é  a  estatís¬ 
tica  f,  definida  neste  caso  como  a  razão  da  diferença  entre 
as  médias  da  amostra  (pj  —  pj)  ^  seu  erro  padrão.  O  erro 
padrão  é  uma  estimativa  da  diferença  entre  médias  a  ser 
esperada  por  conta  de  erro  amostrai.  Se  a  diferença  real 
entre  as  médias  de  grupos  é  suflcientemente  maior  do  que 
o  erro  padrão,  então  podemos  concluir  que  essas  dife¬ 
renças  são  estatisticamente  signiflcantes.  Abordamos  na 
próxima  seção  qual  nível  da  estatística  t  é  necessário  para 
significância  estatística,  mas  primeiro  podemos  expressar 
o  cálculo  na  equação  a  seguir: 

estatística  t  =  — - ^ 


onde 

Pj  =  média  do  grupo  1 
P2  =  média  do  grupo  2 

SEpjPj  =  erro  padrão  da  diferença  em  médias  de  grupos 


Em  nosso  exemplo,  calcularíamos  primeiramente  o  es¬ 
core  médio  da  avaliação  de  apelo  para  cada  grupo  de 
respondentes  (informativo  versus  emocional)  e  em  segui¬ 
da  encontraríamos  a  diferença  em  seus  escores  médios 
(fliniormativo  -  flemodonai)'  Formando  a  razão  de  diferença  real 
entre  as  médias  com  a  diferença  esperada  devido  a  erro 
amostrai  (o  erro  padrão),  quantificamos  o  impacto  real 
do  tratamento  que  é  devido  a  erro  de  amostragem  alea¬ 
tória.  Em  outras  palavras,  o  valor  í,  ou  estatística  í,  repre¬ 
senta  a  diferença  de  grupo  em  termos  de  erros  padrão. 


Interpretação  da  estatística  t.  Quão  grande  deve 
ser  o  valor  t  para  se  considerar  a  diferença  estatistica¬ 
mente  significante  (ou  seja,  a  diferença  não  era  devido 
à  variabilidade  amostrai,  mas  representa  uma  diferença 
verdadeira)?  Essa  determinação  é  feita  comparando-se  a 
estatística  t  com  o  valor  crítico  da  estatística  t  (U,,).  Deter¬ 
minamos  o  valor  crítico  (Uj,)  para  nossa  estatística  t  e  tes¬ 
tamos  a  significância  estatística  das  diferenças  observadas 
pelo  seguinte  procedimento: 

1.  Computamos  a  estatística  t  como  a  razão  da  diferença  entre 
médias  amostrais  e  seu  erro  padrão. 

2.  Especificamos  um  nível  de  erro  Tipo  I  (denotado  como  alfa, 
a,  ou  nível  de  significância),  que  indica  o  nível  de  probabi¬ 
lidade  que  o  pesquisador  aceitará  para  concluir  que  as  mé¬ 
dias  de  grupos  são  diferentes  quando  na  verdade  não  o  são. 
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3.  Determinamos  o  valor  crítico  referente  à  distribuição 
f  com  Nj+  N2-  2  graus  de  liberdade  e  um  a  especificado, 
onde  Aj  e  Aj  são  tamanhos  de  amostras.  Apesar  de  o  pesqui¬ 
sador  poder  usar  as  tabelas  estatísticas  para  descobrir  o  va¬ 
lor  exato,  diversos  valores  típicos  são  empregados  quando  o 
tamanho  total  da  amostra  (Aj-i-Aj)  é  pelo  menos  maior  que 
50.  O  que  se  segue  são  alguns  níveis  a  amplamente  usados  e 
os  correspondentes  valores 


a  (Nível  de  significância) 

Valor 

0,10 

1,64 

0,05 

1,96 

0,01 

2,58 

4.  Se  o  valor  absoluto  da  estatística  í  calculada  exceder  o  pes¬ 
quisador  pode  concluir  que  os  dois  grupos  revelam  diferenças 
em  médias  de  grupos  na  medida  dependente  (ou  seja,  |jLj  = 
p,2*),  com  uma  probabilidade  de  erro  Tipo  f  de  a.  O  pesquisa¬ 
dor  pode  então  examinar  os  valores  médios  reais  para  deter¬ 
minar  qual  grupo  é  maior  no  valor  dependente. 

Os  programas  de  computador  atuais  fornecem  o  valor 
í  calculado  e  o  nível  de  significância  associado,  tornando  a 
interpretação  ainda  mais  fácil.  O  pesquisador  apenas  preci¬ 
sa  ver  se  o  nível  de  significância  atende  ou  excede  o  nível  de 
erro  Tipo  I  estabelecido  pelo  pesquisador. 

O  teste  f  é  amplamente  usado  por  funcionar  com  gru¬ 
pos  pequenos  em  tamanho  e  é  muito  fácil  de  aplicar  e  in¬ 
terpretar.  Ele  enfrenta  poucas  limitações:  (1)  ele  acomoda 
somente  dois  grupos,  e  (2)  ele  pode  avaliar  apenas  uma 
variável  independente  por  vez.  Para  remover  alguma  ou 
ambas  dessas  restrições,  o  pesquisador  pode  utilizar  análi¬ 
se  de  variância,  a  qual  pode  testar  variáveis  independentes 
com  mais  de  dois  grupos  e  ainda  avaliar  simultaneamente 
duas  ou  mais  variáveis  independentes. 

Análise  de  variância 

Em  nosso  exemplo  do  teste  t,  um  pesquisador  expôs  dois 
grupos  de  respondentes  a  diferentes  anúncios  e  em  segui¬ 
da  pediu  que  avaliassem  o  nível  de  apelo  dos  anúncios  em 
uma  escala  de  10  pontos.  Suponha  que  estejamos  inte¬ 
ressados  em  avaliar  três  mensagens,  em  vez  de  duas.  Os 
respondentes  seriam  aleatoriamente  designados  a  um  dos 
três  grupos,  e  teríamos  três  médias  de  amostras  para  com¬ 
parar.  Para  analisar  esses  dados,  poderíamos  ser  tentados 
a  conduzir  testes  t  separados  para  a  diferença  entre  cada 
par  de  médias  (ou  seja,  grupo  1  versus  grupo  2;  grupo  1 
versus  grupo  3;  e  grupo  2  versus  grupo  3). 

No  entanto,  múltiplos  testes  t  aumentam  a  taxa  de  erro 
Tipo  I  geral  (discutimos  isso  em  mais  detalhes  na  próxima 
seção).  A  análise  de  variância  (ANOVA)  evita  essa  infla¬ 
ção  do  erro  Tipo  I  ao  fazerem  múltiplas  comparações  de 
grupos  de  tratamento,  determinando  em  um  único  teste 
se  o  conjunto  inteiro  de  médias  de  amostras  sugere  que 
as  amostras  foram  obtidas  a  partir  da  mesma  população 
geral.  Ou  seja,  ANOVA  é  empregada  para  determinar  a 

*  N.  de  R.  T.:  A  expressão  certa  é  Pj  Pj- 


probabilidade  de  que  diferenças  em  médias  ao  longo  de 
diversos  grupos  ocorrem  apenas  devido  a  erro  amostrai. 

Planejamento  de  análise.  ANOVA  oferece  conside¬ 
ravelmente  maior  flexibilidade  no  teste  de  diferenças  de 
grupos  do  que  o  teste  t.  Ainda  que  um  teste  t  possa  ser 
executado  com  ANOVA,  o  pesquisador  tem  também  a 
habilidade  para  testar  diferenças  em  mais  de  dois  grupos, 
bem  como  testar  mais  de  uma  variável  independente.  Fa¬ 
tores  não  são  limitados  a  apenas  dois  níveis,  mas  podem 
ter  quantos  níveis  (grupos)  que  se  queira.  Além  disso,  a 
habilidade  de  analisar  mais  de  uma  variável  independen¬ 
te  permite  ao  pesquisador  uma  visão  mais  analítica  sobre 
questões  complexas  de  pesquisa  que  não  poderiam  ser 
abordadas  pela  análise  de  apenas  uma  variável  indepen¬ 
dente  por  vez. 

Com  essa  maior  flexibilidade  surgem,  porém,  proble¬ 
mas  extras.  O  mais  importante  se  refere  às  exigências  de 
tamanho  de  amostra  a  partir  do  aumento  do  número  de 
níveis  ou  de  variáveis  independentes.  Para  cada  grupo, 
um  pesquisador  desejará  ter  uma  amostra  de  aproximada¬ 
mente  20  observações  (uma  discussão  mais  detalhada  se 
encontra  em  uma  seção  posterior).  Desse  modo,  aumen¬ 
tar  o  número  de  níveis  em  qualquer  fator  demanda  um 
aumento  no  tamanho  da  amostra.  Além  disso,  a  análise 
de  múltiplos  fatores  pode  criar  uma  situação  de  exigências 
por  grandes  amostras  de  maneira  muito  rápida.  Lembre- 
se,  quando  dois  ou  mais  fatores  são  incluídos  na  análise, 
o  número  de  grupos  formados  é  o  produto  do  número  de 
níveis,  e  não  a  soma  (ou  seja,  Número  de  grupos  =  Núme¬ 
ro  de  níveiSpjKoj  1  x  Número  de  níveisp^j^^j)-  Um  exemplo 
simples  ilustra  a  questão. 


Os  dois  níveis  de  anúncio  publicitário  (informativo  e 
emocional)  requerem  uma  amostra  total  de  50  se  o  pes¬ 
quisador  desejar  25  respondentes  por  célula.  Agora, 
considere  que  um  segundo  fator  é  acrescentado  quanto 
à  colorização  do  anúncio  em  três  níveis  (1  =  colorido,  2  = 
preto  e  branco,  3  =  combinação  de  ambos).  Se  os  dois  fa¬ 
tores  são  agora  incluídos  na  análise,  o  número  de  grupos 
aumenta  para  seis  (Número  de  grupos  =  2x3)  e  a  amos¬ 
tra  cresce  para  150  respondentes  (Tamanho  amostrai  = 
6  grupos  X  25  respondentes  por  grupo).  Assim,  perce¬ 
bemos  que  o  acréscimo  de  um  fator  de  três  níveis  pode 
aumentar  a  complexidade  e  a  amostra  exigida. 


Logo,  pesquisadores  devem  ser  cuidadosos  quando 
determinam  o  número  de  níveis  para  um  fator,  bem  como 
o  número  de  fatores  incluídos,  especialmente  quando  se 
analisam  pesquisas  de  campo,  onde  a  habilidade  de  conse¬ 
guir  um  tamanho  necessário  de  amostra  por  célula  é  mui¬ 
to  mais  difícil  do  que  em  condições  sob  controle. 

Teste  estatístico.  A  lógica  de  um  teste  ANOVA  é  bas¬ 
tante  simples.  Como  o  nome  análise  de  variância  sugere, 
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duas  estimativas  independentes  da  variância  para  a  va¬ 
riável  dependente  são  comparadas.  A  primeira  reflete  a 
variabilidade  geral  de  respondentes  dentro  dos  grupos 
(MS^),  e  a  segunda  representa  as  diferenças  entre  grupos 
atribuíveis  aos  efeitos  de  tratamento  (MS^): 

•  Estimativa  de  variância  dentro  de  grupos  (MS^:  quadrado 
médio  dentro  dos  grupos):  Essa  estimativa  da  variabilida¬ 
de  média  dos  respondentes  quanto  à  variável  dependente 
dentro  de  um  grupo  de  tratamento  é  baseada  em  desvios  de 
escores  individuais  a  partir  de  suas  respectivas  médias  de 
grupos.  A  é  comparável  ao  erro  padrão  entre  duas  mé¬ 
dias  calculadas  no  teste  t,  uma  vez  que  representa  a  variabi¬ 
lidade  dentro  dos  grupos.  O  valor  MS^  às  vezes  é  chamado 
de  variância  de  erro. 

•  Estimativa  de  variância  entre  grupos  {MS^:  quadrado  mé¬ 
dio  entre  grupos):  A  segunda  estimativa  de  variância  é  a 
variabilidade  das  médias  de  grupos  de  tratamento  quanto 
à  variável  dependente.  Baseia-se  em  desvios  de  médias  de 
grupos  a  partir  da  grande  média  geral  de  todos  os  escores. 
Sob  a  hipótese  nula  de  inexistência  de  efeitos  de  tratamen¬ 
to  (ou  seja,  pi  =  p.2  =  p.3  =.  .  .  =  pj.),  essa  estimativa  de 
variância,  diferente  da  MS^^,  reflete  quaisquer  efeitos  de 
tratamento  que  existam;  em  outras  palavras,  diferenças 
em  médias  de  tratamentos  aumentam  o  valor  esperado  da 
MS^.  Note  que  qualquer  número  de  grupos  pode  ser  aco¬ 
modado. 


a  (Nível  de  significância) 

Valor 

0,10 

2,68 

0,05 

3,84 

0,01 

6,63 

2.  Calcule  a  estatística  E  ou  encontre  o  valor  F  calculado  pelo 
programa  de  computador. 

3.  Se  o  valor  calculado  da  estatística  F  exceder  conclua 
que  as  médias  ao  longo  de  todos  os  grupos  não  são  todas 
iguais.  Novamente,  os  programas  computacionais  fornecem 
o  valor  F  e  o  correspondente  nível  de  significância,  de  modo 
que  o  pesquisador  pode  diretamente  avaliar  se  ele  alcança 
um  nível  aceitável. 

O  exame  das  médias  de  grupos  então  viabiliza  ao  pes¬ 
quisador  a  avaliação  da  posição  relativa  de  cada  grupo 
quanto  à  medida  dependente.  Apesar  de  o  teste  estatís¬ 
tico  F  avaliar  a  hipótese  nula  de  médias  iguais,  ele  não 
aborda  a  questão  de  quais  médias  são  diferentes.  Por 
exemplo,  em  uma  situação  de  três  grupos,  todos  eles  po¬ 
dem  diferir  signiflcantemente,  ou  dois  podem  ser  iguais, 
mas  diferirem  do  terceiro.  Para  avaliar  essas  diferenças, 
o  pesquisador  pode  empregar  comparações  planejadas 
ou  testes  post  hoc.  Examinamos  cada  um  desses  métodos 
posteriormente. 


Cálculo  da  estatística  F.  A  razão  entre  MS^  e  MS^ 
é  uma  medida  de  quanta  variância  é  atribuível  aos  dife¬ 
rentes  tratamentos  versus  a  variância  esperada  a  partir  de 
amostragem  aleatória.  A  razão  entre  MS^e  MS^é  concei- 
tualmente  semelhante  ao  valor  t,  mas  neste  caso  nos  dá 
um  valor  para  a  estatística  F. 


Estatística  F  = 


MS„ 


MS.. 


Como  as  diferenças  entre  grupos  tendem  a  inflacionar 
MS^,  grandes  valores  da  estatística  F  levam  à  rejeição  da 
hipótese  nula  de  inexistência  de  diferença  em  médias  de 
grupos.  Se  a  análise  tem  diversos  tratamentos  diferentes 
(variáveis  independentes),  então  estimativas  de  Af^gSão 
calculadas  para  cada  tratamento,  bem  como  estatísticas  F. 
Isso  permite  a  avaliação  separada  de  cada  tratamento. 


Interpretação  da  estatística  F.  Para  determinar  se 
a  estatística  F  é  suflcientemente  grande  para  justificar  a 
rejeição  da  hipótese  nula  (o  que  significa  que  diferenças 
estão  presentes  entre  os  grupos),  siga  um  processo  pareci¬ 
do  com  o  teste  f: 

1.  Determine  o  valor  crítico  para  a  estatística  F  (F^^j,)  usando  a 
distribuição  F  com  (L  -  1)  e  (A  -  k)  graus  de  liberdade  para 
um  nível  especificado  de  a  (onde  N  =  Nj^  +  . . .  +  k  =  nú¬ 
mero  de  grupos).  Como  ocorre  com  o  teste  f,  um  pesquisa¬ 
dor  pode  usar  certos  valores  F  como  diretrizes  gerais  quan¬ 
do  as  amostras  são  relativamente  grandes.  Esses  valores  são 
simplesmente  ao  quadrado,  resultando  no  seguinte: 


Procedimentos  multivariados  para 
avaliação  de  diferenças  de  grnpos 

Como  procedimentos  de  inferência  estatística,  tanto 
as  técnicas  univariadas  (teste  t  e  ANOVA)  quanto  suas 
extensões  multivariadas  (7^  de  Hotelling  e  MANOVA) 
são  utilizadas  para  avaliar  a  significância  estatística  de 
diferenças  entre  grupos.  No  teste  t  e  ANOVA,  a  hipóte¬ 
se  nula  testada  é  a  igualdade  de  médias  de  uma  variável 
dependente  ao  longo  de  grupos.  Nas  técnicas  multivaria¬ 
das,  a  hipótese  nula  testada  é  a  igualdade  de  vetores  de 
médias  sobre  múltiplas  variáveis  dependentes  ao  longo  de 
grupos.  A  distinção  entre  as  hipóteses  testadas  em  ANO¬ 
VA  e  MANOVA  é  ilustrada  na  Figura  6-1.  No  caso  uni- 
variado,  uma  única  medida  dependente  é  testada  quanto 
à  igualdade  ao  longo  de  grupos.  No  caso  multivariado, 
uma  variável  estatística  é  testada  quanto  a  igualdade.  O 
conceito  de  variável  estatística  tem  sido  instrumental  em 
nossas  discussões  das  técnicas  multivariadas  anteriores  e  é 
abordado  em  detalhes  no  Capítulo  1. 

Em  MANOVA,  o  pesquisador  na  verdade  tem  duas 
variáveis  estatísticas,  uma  para  as  variáveis  dependentes 
e  outra  para  as  independentes.  A  variável  estatística  de 
variáveis  dependentes  é  de  maior  interesse  porque  as  me¬ 
didas  dependentes  métricas  podem  ser  reunidas  em  uma 
combinação  linear,  como  já  vimos  na  regressão  múltipla 
e  na  análise  discriminante.  O  aspecto  único  de  MANO¬ 
VA  é  que  a  variável  estatística  combina  de  maneira  ótima 
as  múltiplas  medidas  dependentes  em  um  único  valor  que 
maximiza  as  diferenças  ao  longo  dos  grupos. 
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ANOVA 


Wo:iii=li2=  ■••11* 

Hipótese  nula  (Hg)  =  todas  as  médias  de  grupos  são  iguais, 
ou  seja,  elas  se  originam  da  mesma  população. 


MANOVA 


Hipótese  nula  (Hg)  =  todos  os  vetores  de  médias  de  grupos  são 
iguais,  ou  seja,  eles  se  originam  da  mesma  população. 

Pp*  =  médias  da  variável  p,  grupo  k 

FIGURA  6-1  Teste  da  hipótese  nula  de  ANOVA  e  de  MANOVA. 


O  caso  de  dois  grupos:  de  Hotelling 

Em  nosso  exemplo  univariado  anterior,  os  pesquisado¬ 
res  estavam  interessados  no  apelo  de  duas  mensagens 
de  anúncios.  Mas  e  se  eles  também  quisessem  conhecer 
a  intenção  de  compra  gerada  pelas  duas  mensagens?  Se 
fossem  usadas  apenas  análises  univariadas,  os  pesqui¬ 
sadores  fariam  testes  í  separados  sobre  as  avaliações  de 
apelo  e  intenção  de  compra  geradas  pelos  anúncios.  En¬ 
tretanto,  as  duas  medidas  estão  inter-relacionadas;  logo, 
o  que  realmente  se  deseja  é  um  teste  das  diferenças  entre 
as  mensagens  nas  duas  variáveis  coletivamente.  Esse  é  o 
momento  em  que  o  7^  de  Hotelling,  uma  forma  especiali¬ 
zada  de  MANOVA  que  é  uma  extensão  direta  do  teste  t 
univariado,  pode  ser  usado. 

Controle  para  a  taxa  de  erro  Tipo  I.  O  7^  de  Hotelling 
fornece  um  teste  estatístico  da  variável  estatística  forma¬ 
da  a  partir  das  variáveis  dependentes,  que  produz  a  maior 
diferença  de  grupos.  Ele  também  aborda  o  problema  de 
inflacionar  o  nível  de  erro  Tipo  I  que  surge  quando  se  faz 
uma  série  de  testes  t  de  médias  de  grupos  sobre  diversas 
medidas  dependentes.  Ele  controla  essa  inflação  de  nível 
de  erro  Tipo  I,  fornecendo  um  teste  geral  único  de  dife¬ 
renças  de  grupos  ao  longo  de  todas  as  variáveis  dependen¬ 
tes  em  um  nível  a  especificado. 

Como  o  T^de  Hotelling  atinge  esses  objetivos?  Consi¬ 
dere  a  seguinte  equação  para  uma  variável  estatística  das 
variáveis  dependentes: 

c  =  w,x,+w^x,+...+  w,x„ 


C  =  escore  composto  ou  multivariado  para  um  res- 
pondente 

=  peso  para  a  variável  dependente  i 
X.  =  variável  dependente  i 


Em  nosso  exemplo,  as  avaliações  de  apelo  de  mensagem 
são  combinadas  com  as  intenções  de  compra  para  formar 
a  composição.  Para  qualquer  conjunto  de  pesos,  podería¬ 
mos  computar  escores  compostos  para  cada  respondente  e 
então  calcular  uma  estatística  t  ordinária  para  a  diferença 
entre  grupos  quanto  aos  escores  compostos.  No  entanto, 
se  conseguíssemos  achar  um  conjunto  de  pesos  que  desse 
o  valor  máximo  à  estatística  t  para  esse  conjunto  de  dados, 
esses  pesos  seriam  os  mesmos  da  função  discriminante  en¬ 
tre  os  dois  grupos  (como  mostrado  no  Capítulo  5).  A  esta¬ 
tística  t  máxima  que  resulta  a  partir  dos  escores  compostos 
produzidos  pela  função  discriminante  pode  ser  elevada  ao 
quadrado  para  produzir  o  valor  'f  de  Hotelling  [11]. 


A  fórmula  computacional  para  o  7^de  Hotelling  repre¬ 
senta  os  resultados  de  derivações  matemáticas  emprega¬ 
das  para  se  chegar  à  estatística  t  máxima  (e,  implicitamen¬ 
te,  à  combinação  linear  mais  discriminante  das  variáveis 
dependentes).  Isso  equivale  a  dizer  que  se  encontrarmos 
uma  função  discriminante  para  os  dois  grupos  que  produ¬ 
za  um  7^  significante,  os  dois  grupos  serão  considerados 
diferentes  ao  longo  dos  vetores  de  médias. 

Teste  estatístico.  Como  o  7^  de  Hotelling  fornece  um 
teste  da  hipótese  de  nenhuma  diferença  de  grupos  nos 


onde 
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vetores  de  escores  médios?  Assim  como  a  estatística  t 
segue  uma  distribuição  conhecida  sob  a  hipótese  nula  de 
nenhum  efeito  de  tratamento  sobre  uma  única  variável 
dependente,  o  7^  de  Hotelling  segue  uma  distribuição  co¬ 
nhecida  sob  a  hipótese  nula  de  nenhum  efeito  de  trata¬ 
mento  sobre  qualquer  uma  de  um  conjunto  de  medidas 
dependentes.  Essa  distribuição  se  transforma  em  uma  dis¬ 
tribuição  F com p  e  N^  +  N^- 2-1  graus  de  liberdade  após 
ajuste  (onde  p  =  número  de  variáveis  dependentes).  Para 
conseguir  o  valor  crítico  para  o  7^  de  Hotelling,  encontra¬ 
mos  o  valor  tabelado  para  E^.^^jCm  um  nível  a  especificado 
e  computamos  7^j,jj,como  se  segue: 

,  p{N+N-2) 

^  ^  X  F 

N^+N^-p-1 

O  caso  de  k  grupos:  MANO  VA 

Assim  como  ANOVA  é  uma  extensão  do  teste  í,  MA- 
NOVA  pode  ser  considerada  uma  extensão  do  procedi¬ 
mento  7^  de  Hotelling.  Criamos  pesos  para  as  variáveis 
dependentes  para  produzir  um  escore  da  variável  estatís¬ 
tica  para  cada  respondente  que  é  maximamente  diferente 
ao  longo  de  todos  os  grupos.  Muitas  das  mesmas  questões 
sobre  planejamento  de  análise  discutidas  em  ANOVA  se 
aplicam  em  MANOVA,  mas  o  método  de  teste  estatístico 
difere  sensivelmente  de  ANOVA. 

Planejamento  de  análise.  Todos  os  aspectos  do  pla¬ 
nejamento  da  análise  discutidos  anteriormente  para 
ANOVA  (número  de  níveis  por  fator,  quantia  de  fato¬ 
res  etc.)  também  se  aplicam  a  MANOVA.  Além  disso, 
o  número  de  variáveis  dependentes  e  as  relações  entre 
essas  medidas  dependentes  levantam  questões  adicio¬ 
nais  que  são  discutidas  adiante.  MANOVA  permite  ao 
pesquisador  que  o  mesmo  avalie  o  impacto  de  múltiplas 
variáveis  independentes  sobre  as  variáveis  dependentes 
não  somente  individualmente,  mas  também  coletiva¬ 
mente. 

Teste  estatístico.  No  caso  de  dois  grupos,  uma  vez  que  a 
variável  estatística  é  formada,  os  procedimentos  de  ANO¬ 
VA  são  basicamente  usados  para  identificar  se  há  diferen¬ 
ças.  Com  três  ou  mais  grupos  (tendo  uma  única  variável 
independente  com  três  níveis  ou  usando  duas  ou  mais  va¬ 
riáveis  independentes),  a  análise  de  diferenças  de  grupos 
fica  mais  próxima  da  análise  discriminante  (ver  Capítu¬ 
lo  5).  Para  três  ou  mais  grupos,  assim  como  em  análise 
discriminante,  variáveis  estatísticas  múltiplas  de  medidas 
dependentes  são  formadas.  A  primeira  variável  estatísti¬ 
ca,  chamada  de  função  discriminante,  especifica  um  con¬ 
junto  de  pesos  que  maximiza  as  diferenças  entre  grupos, 
maximizando  portanto  o  valor  F.  O  valor  F  máximo  em 
si  nos  permite  computar  diretamente  o  que  se  chama  de 
estatística  da  maior  raiz  característica  (gcr),  a  qual  viabili¬ 
za  o  teste  estatístico  da  primeira  função  discriminante.  A 


estatística  da  maior  raiz  característica  pode  ser  calculada 
como  [11]: 

gcr={k-í)F^J{N-k). 

Para  obter  um  único  teste  da  hipótese  de  inexistência 
de  diferenças  de  grupos  nesse  primeiro  vetor  de  escores 
médios,  poderíamos  apelar  para  tabelas  da  distribuição 
gcr.  Assim  como  a  estatística  F  segue  uma  distribuição 
conhecida  sob  a  hipótese  nula  de  médias  equivalentes  de 
grupos  sobre  uma  variável  dependente,  a  estatística  gcr 
segue  uma  distribuição  conhecida  sob  a  hipótese  nula  de 
vetores  equivalentes  de  médias  de  grupos  (ou  seja,  as  mé¬ 
dias  de  grupos  são  equivalentes  em  um  conjunto  de  me¬ 
didas  dependentes).  Uma  comparação  do  gcr  observado 
com  o  gcrj,j;,nos  fornece  uma  base  para  rejeitar  a  hipótese 
nula  geral  de  vetores  equivalentes  de  médias  de  grupos. 

Quaisquer  funções  discriminantes  subseqüentes  são 
ortogonais:  elas  maximizam  as  diferenças  entre  grupos 
com  base  na  variância  remanescente  não  explicada  pela(s) 
função(ões)  anterior(es).  Assim,  em  muitos  casos,  o  teste 
para  diferenças  entre  grupos  envolve  não  apenas  o  pri¬ 
meiro  escore  de  variável  estatística,  mas  um  conjunto  de 
escores  de  variável  estatística  que  são  avaliados  simulta¬ 
neamente.  Em  tais  casos,  há  diversos  testes  multivariados 
disponíveis  (p.ex.,  lambda  de  Wilks,  critério  de  Pillai), 
cada  um  mais  adequado  a  situações  específicas  para  testes 
dessas  múltiplas  variáveis  estatísticas. 

Diferenças  entre  MANOVA  e  análise  discriminante 

Observamos  anteriormente  que,  em  teste  estatístico,  MA¬ 
NOVA  emprega  uma  função  discriminante,  a  qual  é  a  va¬ 
riável  estatística  de  medidas  dependentes  que  maximiza 
a  diferença  entre  grupos.  Pode  surgir  a  questão:  qual  é  a 
diferença  entre  MANOVA  e  análise  discriminante?  Em 
alguns  aspectos,  MANOVA  e  análise  discriminante  são 
imagens  espelhadas.  As  variáveis  dependentes  em  MA¬ 
NOVA  (um  conjunto  de  variáveis  métricas)  são  as  variá¬ 
veis  independentes  em  análise  discriminante,  e  a  variável 
dependente  não-métrica  da  análise  discriminante  se  torna 
a  variável  independente  em  MANOVA.  Além  disso,  am¬ 
bas  usam  os  mesmos  métodos  na  formação  de  variáveis 
estatísticas  e  na  avaliação  da  significância  estatística  entre 
grupos. 

As  diferenças,  entretanto,  se  concentram  em  torno  dos 
objetivos  das  análises  e  do  papel  da(s)  variável(eis)  não- 
métricas. 

•  A  análise  discriminante  emprega  uma  única  variável  não- 
métrica  como  dependente.  As  categorias  da  variável  depen¬ 
dente  são  assumidas  como  dadas,  e  as  variáveis  indepen¬ 
dentes  são  empregadas  para  formar  variáveis  estatísticas 
que  diferem  maximamente  entre  os  grupos  formados  pelas 
categorias  da  variável  dependente. 

•  MANOVA  usa  o  conjunto  de  variáveis  métricas  como  as 
variáveis  dependentes,  e  o  objetivo  passa  a  ser  encontrar 
grupos  de  respondentes  que  exibam  diferenças  no  conjun- 
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to  de  variáveis  dependentes.  Os  grupos  de  respondentes 
não  são  pré-especificados;  ao  invés  disso,  o  pesquisador  usa 
uma  ou  mais  variáveis  independentes  (não-métricas)  para 
formar  grupos.  MANOVA,  mesmo  enquanto  forma  esses 
grupos,  ainda  mantém  a  habilidade  de  avaliar  o  impacto  de 
cada  variável  não-métrica  separadamente. 


UMA  ILUSTRAÇÃO 
HIPOTÉTICA  DE  MANOVA 

Um  exemplo  simples  pode  ilustrar  os  benefícios  de  se  usar 
MANOVA  e  também  mostrar  o  uso  de  duas  variáveis  in¬ 
dependentes  para  avaliar  diferenças  em  duas  variáveis 
dependentes. 


Considere  que  a  agência  publicitária  da  HBAT  identi¬ 
ficou  duas  características  de  anúncios  da  empresa  (tipo 
de  produto  sendo  anunciado  e  tipo  de  cliente)  que  eles 
imaginaram  que  causariam  diferenças  na  maneira  como 
as  pessoas  avaliam  os  anúncios.  Eles  pediram  ao  depar¬ 
tamento  de  pesquisa  para  desenvolver  e  executar  um  es¬ 
tudo  para  avaliar  o  impacto  dessas  características  sobre 
as  avaliações  de  anúncios. 


cada  fator,  dois  níveis  foram  também  definidos;  tipo  de 
produto  (produto  1  versus  produto  2)  e  tipo  de  cliente 
(cliente  atual  versus  ex-cliente).  Ao  combinar  essas 
duas  variáveis,  conseguimos  quatro  grupos  distintos: 


Tipo 

de  produto 

Tipo  do  cliente 

Produto  1 

Produto  2 

Cliente  atual 

Grupo  1 

Grupo  2 

Ex-cliente 

Grupo  3 

Grupo  4 

•  Variáveis  dependentes'.  Avaliação  dos  anúncios  HBAT 
usou  duas  variáveis  (habilidade  para  ganhar  atenção  e 
persuasão)  medidas  em  uma  escala  de  10  pontos. 

•  Amostra'.  Respondentes  foram  expostos  aos  anúncios 

e  avaliaram  os  mesmos  quanto  às  duas  medidas  depen¬ 
dentes  (ver  Tabela  6-1). 


Diferenças  da  análise  discriminante 

Apesar  de  MANOVA  construir  a  variável  estatística  e 
analisar  diferenças  de  uma  maneira  semelhante  à  análise 
discriminante,  as  duas  técnicas  diferem  sensivelmente  em 
como  os  grupos  são  formados  e  analisados.  Usemos  este 
exemplo  para  ilustrar  tais  diferenças: 


Planejamento  de  análise 

Ao  planejar  o  estudo,  a  equipe  de  pesquisa  definiu  os  se¬ 
guintes  elementos  relacionados  a  fatores  utilizados,  variá¬ 
veis  dependentes  e  tamanho  de  amostra: 


Fatores'.  Dois  fatores  foram  identificados  como  re¬ 
presentando  Tipo  de  produto  e  Tipo  do  cliente.  Para 


Com  análise  discriminante,  poderíamos  examinar  apenas 
as  diferenças  no  conjunto  de  quatro  grupos,  sem  distinção 
quanto  às  características  dos  mesmos  (tipo  de  produto  ou 
tipo  de  cliente).  O  pesquisador  seria  capaz  de  determinar 
se  a  variável  estatística  difere  significativamente  somente 
ao  longo  dos  grupos,  mas  não  poderia  avaliar  quais  carac¬ 
terísticas  dos  grupos  se  relacionam  a  tais  diferenças. 

Com  MANOVA,  porém,  o  pesquisador  analisa  as 
diferenças  nos  grupos  enquanto  também  avalia  se  as 


TABELA  6-1  Exemplo  hipotético  de  MANOVA 

Produto  1 

Produto  2 

^lembrança  ”  3,50  ^compra  “  4,50 

^total=8,00 

X,  .  =  5,50 

lembrança 

X,  ,  ,= 

total 

^compra  “  5»625 

11,125 

Tipo  de  Cliente/Linha  de 

produto 

Identificação 

Atenção  Compra 

Total 

Identificação 

Atenção 

Compra 

Total 

Ex-cliente 

1 

1  3 

4 

5 

3 

4 

7 

X  =  'í  nn 

lembrança  '-'ivv 

2 

2  1 

4 

6 

4 

3 

7 

compra 

3 

2  3 

5 

7 

4 

5 

9 

X  =  fí  2^5 

4 

3  2 

5 

8 

5 

5 

10 

Média 

2,0  2,25 

4,25 

4,0 

4,25 

8,25 

Cliente 

9 

4  7 

11 

13 

6 

7 

13 

^lembrança “  6,00 

10 

5  6 

11 

14 

7 

8 

15 

Üo.pra=  6.875 

11 

5  7 

12 

15 

7 

7 

14 

12,875 

12 

6  7 

13 

16 

8 

6 

14 

Média 

5,0  6,75 

11,75 

7,0 

7,0 

14,0 

Valores  são  respostas  em  uma  escala  de  1 0  pontos  (1  =  Baixo,  1 0  =  Alto). 
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mesmas  são  devido  ao  tipo  de  produto,  de  cliente  ou 
ambos.  Logo,  MANOVA  se  concentra  na  análise  da 
composição  dos  grupos  com  base  em  suas  características 
(as  variáveis  independentes). 


MANOVA  permite  ao  pesquisador  propor  um  plane¬ 
jamento  mais  complexo  de  pesquisa  usando  qualquer  nú¬ 
mero  de  variáveis  não-métricas  independentes  (dentro  de 
limites)  para  formar  grupos  e  então  procurar  diferenças 
significantes  na  variável  estatística  dependente  associada 
a  variáveis  não-métricas  específicas. 

Formação  da  variável  estatística 
e  avaliação  das  diferenças 

Com  MANOVA  podemos  combinar  múltiplas  medidas 
dependentes  em  uma  única  variável  estatística  que  será 
então  avaliada  quanto  a  diferenças  em  uma  ou  mais  variá¬ 
veis  independentes.  Vejamos  como  uma  variável  estatísti¬ 
ca  é  formada  e  utilizada  em  nosso  exemplo. 


Considere  para  este  exemplo  que  as  duas  medidas  de¬ 
pendentes  (lembrança  e  compra)  fossem  igualmente 
ponderadas  quando  somadas  no  valor  da  variável  esta¬ 
tística  (variável  estatística  total  =  escore^^biudade  de  conqmstar 


atenção  +  escorCp^^^.^jJ.  Estc  primeiro  passo  é  idêntico  à 
análise  discriminante  e  fornece  um  valor  composto  com 
as  variáveis  ponderadas  para  atingir  diferenças  máximas 
entre  os  grupos. 

Com  a  variável  estatística  formada,  podemos  agora 
calcular  médias  para  cada  um  dos  quatro  grupos,  bem 
como  as  médias  gerais  para  cada  nível.  A  partir  da  Tabe¬ 
la  6-f  podemos  identificar  diversos  padrões: 

•  As  quatro  médias  de  grupos  para  a  variável  composta 
total  (ou  seja,  4,25,  8,25, 11,75  e  14,0)  variam  significati¬ 
vamente  entre  os  grupos,  sendo  bastante  diferenciáveis 
entre  si.  Se  fôssemos  usar  análise  discriminante  com 
esses  quatro  grupos  especificados  como  a  medida  de¬ 
pendente,  esta  determinaria  que  diferenças  significantes 
surgiram  na  variável  composta  e  também  que  ambas  as 
variáveis  dependentes*  (lembrança  e  compra)  contri¬ 
buíram  para  tais  diferenças.  A  despeito  disso,  ainda  não 
teríamos  qualquer  visão  sobre  como  as  duas  variáveis 
independentes  contribuíram  para  essas  diferenças. 

•  MANOVA,  porém,  vai  além  da  análise  das  diferenças 
ao  longo  de  grupos,  avaliando  se  tipo  de  produto  e/ou 
tipo  de  cliente  criaram  grupos  com  essas  diferenças. 

Isso  é  obtido  calculando-se  as  médias  de  categoria  (de¬ 
notadas  pelo  símbolo  ■),  que  são  mostradas  na  Figura 

(Continua) 


*  N.  de  R.  T.:  A  frase  correta  seria  “ambas  as  variáveis  independentes”. 


FIGURA  6-2  Representação  gráfica  de  médias  de  grupo  da  variávei  estatística  (totai)  para  exempio  hipotético. 
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6-2  com  as  médias  individuais  de  grupos  (as  duas  linhas 
conectam  os  grupos  -  ex-cliente  e  cliente  -  para  os  pro¬ 
dutos  1  e  2).  Se  olharmos  para  o  tipo  de  produto  (igno¬ 
rando  distinções  quanto  ao  tipo  de  cliente),  poderemos 
ver  um  valor  médio  de  8,0  para  os  usuários  do  produto  1 
e  um  valor  médio  de  11,125  para  os  usuários  do  produto 
2.  Do  mesmo  modo,  para  o  tipo  de  cliente,  os  ex-clien- 
tes  têm  um  valor  médio  de  6,25,  e  os  clientes,  de  12,875. 
A  inspeção  visual  sugere  que  essas  médias  de  categoria 
mostram  diferenças  significantes,  com  as  diferenças 
para  tipo  de  cliente  (12,875  -  6,25  =  6,625)  maiores  do 
que  para  produto  (11,125  -  8,00  =  3,125). 


Por  ser  capaz  de  representar  essas  médias  de  categoria 
de  variável  independente  na  análise,  MANOVA  não  ape¬ 
nas  mostra  que  diferenças  gerais  entre  os  quatro  grupos 
ocorrem  (como  foi  feito  com  a  análise  discriminante),  mas 
também  que  tanto  o  tipo  de  cliente  quanto  o  tipo  de  pro¬ 
duto  contribuem  significantemente  para  formar  tais  gru¬ 
pos  distintos.  Logo,  as  duas  características  “provocam” 
diferenças  significantes,  uma  descoberta  impossível  com 
a  análise  discriminante. 


UM  PROCESSO  DE  DECISÃO 
PARA  MANOVA 

O  processo  de  executar  uma  análise  multivariada  de  va¬ 
riância  é  semelhante  ao  encontrado  em  muitas  outras 
técnicas  multivariadas  e  por  isso  pode  ser  descrito  por 
meio  do  processo  de  seis  estágios  para  a  construção  de 
modelo  descrito  no  Capítulo  1.  O  processo  começa  com  a 
especificação  dos  objetivos  da  pesquisa.  Segue  então  com 
várias  questões  do  projeto  que  uma  análise  multivariada 
demanda  e  prossegue  com  uma  análise  das  suposições 
inerentes  a  MANOVA.  Com  tais  questões  abordadas, 
o  processo  continua  com  a  estimação  do  modelo  MA¬ 
NOVA  e  a  avaliação  do  ajuste  geral  do  modelo.  Ouando 
um  modelo  MANOVA  aceitável  é  encontrado,  os  resul¬ 
tados  podem  ser  interpretados  em  maiores  detalhes.  O 
passo  final  envolve  esforços  para  validar  os  resultados 
para  garantir  generalização  para  a  população.  A  Figura 
6-3  (estágios  1-3)  e  a  Figura  6-4  (estágios  4-6,  mostrados 
adiante  no  texto)  fornecem  uma  representação  gráfica 
do  processo,  que  será  discutido  em  detalhes  nas  próxi¬ 
mas  seções. 


ESTÁGIO  1:  OBJETIVOS  DE  MANOVA 

A  seleção  de  MANOVA  é  baseada  no  desejo  de  analisar 
uma  relação  de  dependência  representada  como  as  dife¬ 
renças  em  um  conjunto  de  medidas  dependentes  ao  longo 
de  uma  série  de  grupos  formados  por  uma  ou  mais  medi¬ 
das  independentes  categóricas.  Desse  modo,  MANOVA 


representa  uma  poderosa  ferramenta  analítica  adequada 
a  uma  ampla  colocação  de  questões  de  pesquisa.  Se  em¬ 
pregada  em  situações  reais  ou  quase  experimentais  (como 
pesquisas  de  campo  ou  investigações  nas  quais  as  medidas 
independentes  são  categóricas),  MANOVA  pode  forne¬ 
cer  idéias  não  apenas  sobre  a  natureza  e  o  poder  preditivo 
das  medidas  independentes,  mas  também  sobre  as  inter- 
relações  e  diferenças  percebidas  no  conjunto  de  medidas 
dependentes. 

Quando  devemos  usar  MANOVA? 

Com  a  habilidade  de  examinar  diversas  medidas  depen¬ 
dentes  simultaneamente,  o  pesquisador  pode  se  benefi¬ 
ciar  do  uso  de  MANOVA  de  diversas  maneiras.  Discu¬ 
timos  as  questões  do  uso  de  MANOVA  da  perspectiva 
de  controle  da  precisão  estatística  e  eficiência  e  ainda 
fornecemos  o  ambiente  apropriado  para  testar  questões 
multivariadas. 

Controle  de  taxa  de  erro  experimental 

O  uso  de  ANOVAs  univariadas  separadas  ou  testes  t  pode 
criar  um  problema  quando  tentamos  controlar  a  taxa  de 
erro  experimental  [12].  Por  exemplo,  considere  que  ava¬ 
liamos  uma  série  de  cinco  variáveis  dependentes  por  meio 
de  ANOVAs  separadas,  sempre  usando  0,05  como  nível 
de  significância.  Dada  a  inexistência  de  diferenças  reais 
nas  variáveis  dependentes,  é  de  se  esperar  a  observação 
de  um  efeito  significante  sobre  qualquer  variável  depen¬ 
dente  dada  em  5%  do  tempo.  No  entanto,  em  nossos  cinco 
testes  separados,  a  probabilidade  de  um  erro  Tipo  I  gira 
em  torno  de  5%,  se  todas  as  variáveis  dependentes  estão 
perfeitamente  correlacionadas,  e  23%  (1  -  0,95^),  se  todas 
as  variáveis  dependentes  são  não-correlacionadas.  Assim, 
uma  série  de  testes  estatísticos  separados  nos  deixa  sem 
controle  de  nossa  taxa  de  erro  Tipo  I  efetiva  geral  ou  ex¬ 
perimental.  Se  o  pesquisador  deseja  manter  o  controle  so¬ 
bre  a  taxa  de  erro  experimental  e  existe  pelo  menos  algum 
grau  de  inter-correlação  entre  as  variáveis  dependentes, 
então  MANOVA  é  apropriada. 

Diferenças  em  uma  combinação 
de  variáveis  dependentes 

Uma  série  de  testes  ANOVA  univariados  também  ignora 
a  possibilidade  de  que  alguma  composição  (combinação 
linear)  das  variáveis  dependentes  possa  fornecer  evidên¬ 
cia  de  uma  diferença  geral  de  grupo  que  possa  passar 
despercebida  ao  examinar-se  cada  variável  dependente 
separadamente.  Os  testes  individuais  ignoram  as  corre¬ 
lações  entre  as  variáveis  dependentes,  e,  na  presença  de 
multicolinearidade  entre  as  variáveis  dependentes,  MA¬ 
NOVA  será  mais  poderosa  do  que  os  testes  univariados 
individuais  de  diversas  maneiras: 

•  MANOVA  pode  detectar  diferenças  combinadas  não  en¬ 
contradas  nos  testes  univariados. 


CAPÍTULO  6  Análise  Multivariada  de  Variância  315 


FIGURA  6-3  Estágios  1  -3  no  diagrama  de  decisão  da  anáiise  muitivariada  de  variância  (MANOVA). 


•  Se  múltiplas  variáveis  estatísticas  são  formadas,  então  elas 
podem  fornecer  dimensões  de  diferenças  que  podem  distin¬ 
guir  entre  os  grupos  melhor  do  que  variáveis  isoladas. 

•  Se  o  número  de  variáveis  dependentes  for  mantido  relati¬ 
vamente  baixo  (5  ou  menos),  o  poder  estatístico  dos  testes 
de  MANOVA  se  iguala  ou  excede  aquele  obtido  com  uma 
única  ANO  VA  [4], 

As  considerações  que  envolvem  tamanho  de  amostra, 
número  de  variáveis  dependentes  e  poder  estatístico  são 
apresentadas  em  uma  seção  subseqüente. 

Tipos  de  questões  multivariadas 
apropriadas  a  MANOVA 

As  vantagens  de  MANOVA  versus  uma  série  de  ANO- 
VAs  univariadas  vão  além  do  domínio  estatístico  discutido 
anteriormente  e  também  são  encontradas  em  sua  habili¬ 


dade  de  fornecer  um  único  método  para  testar  diversas 
questões  multivariadas.  No  texto,  enfatizamos  a  natureza 
de  interdependência  da  análise  multivariada.  MANOVA 
tem  a  flexibilidade  de  permitir  ao  pesquisador  a  seleção 
de  estatísticas  de  testes  mais  adequadas  à  questão  de  inte¬ 
resse.  Hand  e  Taylor  [10]  classificaram  os  problemas  mul- 
tivariados  em  três  categorias,  das  quais  cada  uma  emprega 
diferentes  aspectos  de  MANOVA  em  sua  resolução.  Essas 
três  categorias  são  questões  univariadas  múltiplas,  multi¬ 
variadas  estruturadas  e  intrinsecamente  multivariadas. 

Questões  univariadas  múltiplas 

Um  pesquisador  que  estuda  múltiplas  questões  univaria¬ 
das  identifica  diversas  variáveis  dependentes  separadas 
(p.ex.,  idade,  renda,  nível  de  formação  de  consumidores 
ou  clientes)  que  devem  ser  analisadas  separadamente, 
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mas  precisam  de  certo  controle  sobre  a  taxa  de  erro  expe¬ 
rimental.  Nesse  caso,  MANOVA  é  usada  para  avaliar  se 
uma  diferença  geral  é  encontrada  entre  grupos,  e  então  os 
testes  univariados  separados  são  executados  para  abordar 
as  questões  individuais  para  cada  variável  dependente. 

Questões  multivariadas  estruturadas 

Um  pesquisador  que  lida  com  questões  multivariadas  es¬ 
truturadas  reúne  duas  ou  mais  medidas  dependentes  que 
tenham  relações  específicas  entre  si.  Uma  situação  comum 
nessa  categoria  é  a  de  medidas  repetidas,  nas  quais  são 
reunidas  múltiplas  respostas  de  cada  sujeito,  talvez  com 
o  passar  do  tempo  ou  em  uma  exposição  pré/pós-teste  a 
algum  estímulo,  como  um  anúncio.  Aqui,  MANOVA  for¬ 
nece  um  método  estruturado  para  especificar  as  compara¬ 
ções  de  diferenças  de  grupos  em  um  conjunto  de  medidas 
dependentes  enquanto  mantém  a  eficiência  estatística. 

Questões  intrinsecamente  multivariadas 

Uma  questão  intrinsecamente  multivariada  envolve  um 
conjunto  de  medidas  multivariadas  no  qual  a  principal 
preocupação  é  o  modo  como  elas  diferem  como  um  todo 
nos  grupos.  As  diferenças  de  medidas  dependentes  indi¬ 
viduais  são  menos  importantes  do  que  seu  efeito  coletivo. 
Um  exemplo  é  o  teste  das  múltiplas  medidas  de  resposta 
que  devem  ser  consistentes,  como  atitudes,  preferência  e 
intenção  de  compra,  todas  relacionadas  com  diferentes 
campanhas  publicitárias.  Todo  o  poder  de  MANOVA  é 
utilizado  nesse  caso,  avaliando-se  não  somente  as  diferen¬ 
ças  gerais,  mas  também  as  diferenças  entre  combinações 
de  medidas  dependentes  que,  caso  contrário,  não  seriam 
visíveis.  Esse  tipo  de  questionamento  é  bem  abordado 
pela  habilidade  de  MANOVA  de  detectar  diferenças 
multivariadas,  mesmo  quando  nenhum  teste  univariado 
mostra  diferenças. 

Seleção  das  medidas  dependentes 

Ao  identificar  as  questões  adequadas  a  MANOVA,  é  im¬ 
portante  também  discutir  brevemente  o  desenvolvimen¬ 
to  da  questão  de  pesquisa,  especificamente  a  seleção  das 
medidas  dependentes.  Um  problema  comum  encontrado 
em  MANOVA  é  a  tendência  dos  pesquisadores  a  usar  de 
maneira  imprópria  uma  de  suas  vantagens  -  a  habilidade 
de  lidar  com  múltiplas  medidas  dependentes  -  incluindo 
variáveis  sem  uma  base  conceituai  ou  teórica  válida.  O 
problema  ocorre  quando  os  resultados  indicam  que  um 
subconjunto  das  variáveis  dependentes  pode  influenciar 
as  diferenças  gerais  entre  grupos.  Se  algumas  das  medidas 
dependentes  com  as  grandes  diferenças  não  são  realmente 
apropriadas  à  questão  de  pesquisa,  diferenças  “falsas”  po¬ 
dem  conduzir  o  pesquisador  a  conclusões  erradas  sobre 
o  conjunto  como  um  todo.  Assim,  o  pesquisador  sempre 
deve  examinar  cuidadosamente  as  medidas  dependentes 
e  assegurar-se  de  que  existe  uma  sólida  argumentação 
para  incluí-las.  Qualquer  ordenação  das  variáveis,  como 


possíveis  efeitos  seqüenciais,  também  deve  ser  observada. 
MANOVA  fornece  um  teste  especial,  a  análise  stepdo- 
wn,  para  avaliar  as  diferenças  estatísticas  de  uma  maneira 
seqüencial,  muito  parecido  com  a  adição  de  variáveis  em 
uma  análise  de  regressão. 

Em  resumo,  o  pesquisador  deve  avaliar  todos  os  aspec¬ 
tos  da  questão  de  pesquisa  cuidadosamente  e  garantir  que 
MANOVA  seja  aplicada  da  maneira  correta  e  mais  pode¬ 
rosa.  As  seções  a  seguir  abordam  muitas  questões  que  têm 
um  impacto  sobre  a  validade  e  precisão  de  MANOVA;  no 
entanto,  em  última  instância,  é  responsabilidade  do  pes¬ 
quisador  o  emprego  da  técnica  de  maneira  adequada. 


ESTÁGIO  2:  QUESTÕES  NO  PROJETO 
DE  PESQUISA  DE  MANOVA 

MANOVA  segue  todos  os  princípios  básicos  de  planeja¬ 
mento  de  ANOVA,  ainda  que  em  alguns  casos  a  natureza 
multivariada  das  medidas  dependentes  exija  uma  perspec¬ 
tiva  única.  Na  seção  a  seguir,  examinamos  os  princípios 
básicos  de  planejamento  e  ilustramos  os  aspectos  ímpares 
de  uma  análise  MANOVA. 

Exigências  no  tamanho  da 
amostra  -  geral  e  por  grnpo 

MANOVA,  como  todas  as  demais  técnicas  multivariadas, 
pode  ser  sensivelmente  afetada  pelo  tamanho  da  amostra 
usada.  A  principal  diferença  em  MANOVA  (e  as  outras 
técnicas  que  avaliam  diferenças  de  grupos,  como  o  teste  t 


-  REGRAS  PRÁTICAS  6-1  - 

Processos  de  decisão  para  MANOVA 

•  MANOVA  é  uma  extensão  de  ANOVA  que  examina 
o  efeito  de  uma  ou  mais  variáveis  independentes  não- 
métricas  sobre  duas  ou  mais  variáveis  dependentes 
métricas 

•  Além  da  habilidade  de  analisar  múltiplas  variáveis 
dependentes,  MANOVA  apresenta  também  as 
vantagens  de: 

•  Controlar  a  taxa  de  erro  experimental  quando  algum 
grau  de  inter-correlação  entre  variáveis  dependentes 
está  presente 

•  Fornecer  maior  poder  estatístico  do  que  ANOVA 
quando  o  número  de  variáveis  dependentes  é  5  ou 
menos 

•  Variáveis  independentes  não-métricas  criam 
grupos  entre  os  quais  as  variáveis  dependentes  são 
comparadas;  muitas  vezes  os  grupos  representam 
variáveis  experimentais  ou  "efeitos  de  tratamento" 

•  Pesquisadores  devem  incluir  somente  variáveis 
dependentes  que  têm  forte  suporte  teórico 
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e  ANOVA)  é  que  as  demandas  de  tamanho  amostrai  se 
relacionam  com  tamanhos  de  grupos  individuais  e  não 
com  o  tamanho  da  amostra  total  em  si.  Diversas  questões 
básicas  surgem  referentes  a  tamanhos  amostrais  necessá¬ 
rios  em  MANO  VA: 

•  No  mínimo,  a  amostra  em  cada  célula  (grupo)  deve  ser  maior 
do  que  o  número  de  variáveis  dependentes.  Apesar  de  essa 
preocupação  não  parecer  muito  importante,  a  inclusão  de 
apenas  um  pequeno  número  de  variáveis  dependentes  (de 
5  a  10)  na  análise  impõe  uma  restrição  um  tanto  problemá¬ 
tica  à  coleta  de  dados.  Isso  é  um  problema  particularmente 
freqüente  na  experimentação  ou  pesquisa  de  campo,  onde  o 
pesquisador  tem  menor  controle  sobre  a  amostra  obtida. 

•  Como  diretriz  prática,  um  tamanho  mínimo  recomendado 
de  célula  é  de  20  observações.  Novamente,  lembre-se  que 
esta  quantidade  é  por  grupo,  sendo  necessárias  amostras 
gerais  consideravelmente  grandes  mesmo  para  análises 
simples.  Em  nosso  exemplo  anterior  de  anúncios  publicitá¬ 
rios,  tínhamos  apenas  dois  fatores,  cada  um  com  dois  níveis, 
mas  tal  análise  exigiria  80  observações  para  um  trabalho 
adequado. 

•  A  medida  que  o  número  de  variáveis  dependentes  aumenta, 
o  tamanho  amostrai  exigido  para  manter  poder  estatístico 
também  cresce.  Continuamos  nossa  discussão  sobre  tama¬ 
nho  amostrai  e  poder  em  uma  seção  adiante,  mas,  como 
exemplo,  tamanhos  exigidos  de  amostra  aumentam  quase 
50%  quando  a  quantia  de  variáveis  dependentes  pula  de 
duas  para  seis. 

Pesquisadores  devem  procurar  amostras  de  tamanhos 
iguais  ou  aproximadamente  iguais  por  grupo.  Apesar  de 
programas  de  computador  facilmente  acomodarem  gru¬ 
pos  de  tamanhos  desiguais,  o  objetivo  é  garantir  que  um 
tamanho  adequado  de  amostra  esteja  disponível  para  to¬ 
dos  os  grupos.  Na  maioria  dos  casos,  a  efetividade  da  aná¬ 
lise  é  ditada  pelos  grupos  de  menor  tamanho,  tornando 
assim  a  preocupação  com  este  assunto  algo  prioritário. 

Delineamentos  fatoriais  -  dois 
on  mais  tratamentos 

Muitas  vezes,  o  pesquisador  deseja  examinar  os  efeitos  de 
diversas  variáveis  independentes  ou  tratamentos  em  vez 
de  usar  apenas  um  único  tratamento  em  testes  ANOVA 
ou  MANOVA.  Essa  capacidade  é  uma  distinção  funda¬ 
mental  entre  MANOVA  e  análise  discriminante  no  sen¬ 
tido  de  ser  capaz  de  determinar  o  impacto  de  múltiplas 
variáveis  independentes  na  formação  de  grupos  com  dife¬ 
renças  significantes.  Uma  análise  com  dois  ou  mais  trata¬ 
mentos  (fatores)  é  chamada  de  planejamento  fatorial.  Em 
geral,  um  planejamento  com  n  tratamentos  é  chamado  de 
planejamento  fatorial  com  n  fatores. 

Seleção  de  tratamentos 

O  uso  mais  comum  de  planejamentos  fatoriais  envolve  as 
questões  de  pesquisa  que  relacionam  duas  ou  mais  variá¬ 
veis  independentes  não-métricas  a  um  conjunto  de  variá¬ 


veis  dependentes.  Nesses  casos,  as  variáveis  independen¬ 
tes  são  especificadas  no  delineamento  do  experimento  ou 
incluídas  no  delineamento  do  campo  da  experimentação 
ou  no  questionário  da  pesquisa. 

Tipos  de  tratamentos.  Como  discutido  ao  longo  do  capí¬ 
tulo,  um  tratamento  ou  fator  é  uma  variável  independente 
não-métrica  com  um  número  definido  de  níveis  (catego¬ 
rias).  Cada  nível  representa  uma  diferente  condição  ou 
característica  que  afeta  a(s)  variável(i)s  dependente(s). 
Em  um  experimento,  esses  tratamentos  e  níveis  são  pla¬ 
nejados  pelo  pesquisador  e  administrados  no  curso  do 
experimento.  Em  pesquisa  de  campo,  eles  são  caracterís¬ 
ticas  dos  respondentes  reunidas  pelo  pesquisador  e  então 
incluídas  na  análise. 

Mas,  em  alguns  casos,  tratamentos  são  necessários  em 
acréscimo  àqueles  na  análise  original  planejada.  O  uso 
mais  comum  de  tratamentos  adicionais  é  para  controlar 
uma  característica  que  afeta  as  variáveis  dependentes  mas 
não  é  parte  do  planejamento  de  estudo.  Em  tais  casos,  o 
pesquisador  está  ciente  de  condições  (p.ex.,  método  de  co¬ 
leta  de  dados)  ou  características  dos  respondentes  (p.ex., 
localização  geográfica,  sexo  etc.)  que  potencialmente 
criam  diferenças  nas  medidas  dependentes.  Ainda  que 
eles  não  sejam  variáveis  independentes  de  interesse  para 
o  estudo,  negligenciá-los  é  como  ignorar  fontes  potenciais 
de  diferenças  que,  não  explicadas,  podem  obscurecer  al¬ 
guns  resultados  de  interesse. 

A  maneira  mais  direta  de  explicar  tais  efeitos  é  atra¬ 
vés  de  um  fator  de  blocagem,  o  qual  é  uma  característica 
não-métrica  empregada  post  hoc  para  segmentar  os  res¬ 
pondentes.  A  meta  é  agrupar  os  respondentes  para  obter 
maior  homogeneidade  interna  nos  grupos  e  reduzir  a  fon¬ 
te  de  variância  MS^.  Fazendo  isso,  a  habilidade  dos  testes 
estatísticos  de  identificar  diferenças  é  aumentada. 


Considere  que  em  nosso  exemplo  anterior  de  anúncio 
tivéssemos  descoberto  que  os  homens  em  geral  reagiram 
de  maneira  diferente  das  mulheres.  Se  o  sexo  é  usado 
como  um  fator  de  blocagem,  podemos  avaliar  os  efeitos 
das  variáveis  independentes  separadamente  para  ho¬ 
mens  e  mulheres.  Espera-se  que  essa  abordagem  torne 
os  efeitos  mais  visíveis  do  que  se  assumirmos  que  ambos 
reagem  analogamente  sem  que  se  faça  uma  distinção  por 
sexo.  Os  efeitos  de  tipo  de  mensagem  e  perfil  do  cliente 
podem  agora  ser  avaliados  para  homens  e  mulheres  se¬ 
paradamente,  fornecendo  um  teste  mais  preciso  de  seus 
efeitos  individuais. 


Assim,  qualquer  característica  não-métrica  pode  ser 
incorporada  diretamente  na  análise  para  explicar  seu  im¬ 
pacto  sobre  as  medidas  dependentes.  Porém,  se  as  variá¬ 
veis  que  você  deseja  controlar  forem  métricas,  elas  podem 
ser  incluídas  como  covariáveis,  o  que  se  discute  na  próxi¬ 
ma  seção. 
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Número  de  tratamentos.  Uma  das  vantagens  das  técni¬ 
cas  multivariadas  é  o  emprego  de  múltiplas  variáveis  em 
uma  única  análise.  Para  MANOVA,  esta  característica 
se  relaciona  com  o  número  de  variáveis  dependentes  que 
podem  ser  analisadas  concomitantemente.  Como  já  discu¬ 
tido,  o  número  de  variáveis  dependentes  afeta  o  tamanho 
amostrai  exigido,  bem  como  outros  aspectos.  Mas  e  quan¬ 
to  ao  número  de  tratamentos  (ou  seja,  variáveis  inde¬ 
pendentes)?  Apesar  de  ANOVA  e  MANOVA  poderem 
analisar  diversos  tratamentos  ao  mesmo  tempo,  diversas 
considerações  se  relacionam  ao  número  de  tratamentos 
em  uma  análise. 

Número  de  células  formadas.  Talvez  a  questão  mais 
limitante  envolvendo  múltiplos  tratamentos  seja  o  nú¬ 
mero  de  células  (grupos)  formadas.  Como  discutido  em 
nosso  exemplo  anterior,  o  número  de  células  é  o  produto 
do  número  de  níveis  para  cada  tratamento.  Por  exemplo, 
se  tivéssemos  dois  tratamentos  com  dois  níveis  cada  e  um 
tratamento  com  quatro  níveis,  um  total  de  16  células  (2  x 
2  X  4  =  16)  seria  formado.  Manter  um  tamanho  suficiente 
para  cada  célula  (assumindo  20  respondentes  por  célula) 
requer  uma  amostra  total  de  320. 

Quando  aplicado  a  dados  de  pesquisa  de  campo,  po¬ 
rém,  o  aumento  do  número  de  células  se  torna  muito  mais 
problemático.  Como  em  pesquisa  de  campo  geralmente 
não  se  é  capaz  de  administrar  individualmente  o  estudo 
para  cada  célula  do  planejamento,  o  pesquisador  deve  ad¬ 
mitir  uma  amostra  geral  suficientemente  grande  para  pre¬ 
encher  cada  célula  de  acordo  com  o  mínimo  exigido.  As 
proporções  da  amostra  total  em  cada  célula  possivelmen¬ 
te  variam  bastante  (ou  seja,  algumas  células  são  mais  pro¬ 
váveis  de  ocorrer  do  que  outras),  especialmente  quando  o 
número  de  células  aumenta.  Em  tal  situação,  o  pesquisa¬ 
dor  deve  planejar  um  tamanho  amostrai  ainda  maior  do 
que  aquele  determinado  quando  se  multiplica  o  número 
de  células  pelo  mínimo  por  célula.  Retornemos  ao  nosso 
exemplo  anterior  para  ilustrar  este  problema. 


Considere  que  temos  um  planejamento  simples  de  dois 
fatores  com  dois  níveis  para  cada  um  (2  x  2).  Se  esse  pla¬ 
nejamento  de  quatro  células  fosse  um  experimento  con¬ 
trolado,  o  pesquisador  seria  capaz  de  designar  aleato¬ 
riamente  20  respondentes  por  célula  para  uma  amostra 
geral  de  80.  E  se  for  uma  pesquisa  de  campo?  Se  fosse 
igualmente  provável  que  respondentes  se  encaixassem 
em  cada  célula,  então  o  pesquisador  poderia  obter  uma 
amostra  total  de  80  e  cada  célula  deveria  ter  uma  amos¬ 
tra  de  20.  Proporções  e  amostras  tão  organizadas  rara¬ 
mente  acontecem.  E  se  uma  célula  representasse  apenas 
10%  da  população?  Se  usarmos  uma  amostra  total  de  80, 
tal  célula  deveria  ter  uma  amostra  de  apenas  8.  Logo,  se 
o  pesquisador  quisesse  uma  amostra  de  20  mesmo  para 
esta  pequena  célula,  a  amostra  geral  deveria  ser  aumen¬ 
tada  para  200. 


A  menos  que  sofisticados  planos  de  amostragem  se¬ 
jam  usados  para  garantir  o  tamanho  necessário  por  célula, 
aumentar  o  número  delas  (e  assim  a  possibilidade  de  pro¬ 
porções  populacionais  diferentes)  demanda  um  tamanho 
amostrai  ainda  maior  do  que  em  um  experimento  contro¬ 
lado.  Falhar  nisso  criaria  situações  nas  quais  as  proprie¬ 
dades  estatísticas  da  análise  poderiam  ficar  seriamente 
comprometidas. 

Criação  de  efeitos  de  interação.  Sempre  que  mais 
de  um  tratamento  é  usado,  efeitos  de  interação  são  cria¬ 
dos.  O  termo  de  interação  representa  o  efeito  conjunto 
de  dois  ou  mais  tratamentos.  Em  termos  simples,  significa 
que  a  diferença  entre  grupos  de  um  tratamento  depende 
dos  valores  de  outro.  Examinemos  um  exemplo  simples: 


Considere  que  temos  dois  tratamentos  -  região  (leste  ver¬ 
sus  oeste)  e  tipo  de  cliente  (clientes  e  não-clientes).  Pri¬ 
meiro,  considere  que  na  variável  dependente  (atitude  em 
relação  à  HBAT)  clientes  marquem  15  pontos  a  mais  do 
que  não-clientes.  No  entanto,  uma  interação  de  região  e 
tipo  de  cliente  indicaria  que  a  diferença  entre  cliente  e 
não-cliente  depende  da  região  dos  mesmos.  Por  exemplo, 
quando  separamos  as  duas  regiões,  podemos  ver  que  clien¬ 
tes  do  leste  marcaram  25  pontos  a  mais  do  que  não-clientes 
na  mesma  região,  enquanto  no  oeste  a  diferença  é  de  ape¬ 
nas  5  pontos.  Em  ambos  os  casos,  os  clientes  pontuaram 
mais,  mas  a  dimensão  da  diferença  depende  da  região. 
Este  resultado  é  uma  interação  dos  dois  tratamentos. 


Termos  de  interação  são  criados  para  cada  combinação 
de  variáveis  de  tratamento.  Interações  de  dois  fatores  são 
variáveis  consideradas  duas  por  vez.  Interações  de  três  fa¬ 
tores  são  combinações  de  três  variáveis,  e  assim  por  diante. 
O  número  de  tratamentos  determina  a  quantia  possível  de 
termos  de  interação.  A  tabela  a  seguir  mostra  as  interações 
criadas  para  duas,  três  e  quatro  variáveis  independentes: 


Termos  de  interação 

Tratamentos 

Duas 

Três  Quatro 

A,B 

AxB 

A,B,C 

AxB 

AxBxC 

AxC 

BxC 

A,  B,  C,  D 

AxB 

AxBxC  AxBxCxD 

AxC 

AxD 

AxB  xD 

BxC 

BxD 

BxCxD 

CxD 

AxCxD 

Discutimos  os  vários  tipos  de  termos  de  interação  e  as 
interpretações  correspondentes  na  próxima  seção,  mas  o 
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pesquisador  deve  estar  pronto  para  interpretar  e  explicar 
os  mesmos,  sejam  significantes  ou  não,  dependendo  da 
questão  de  pesquisa. 

Obviamente,  as  considerações  sobre  tamanho  amostrai 
são  da  maior  importância,  mas  o  pesquisador  não  deve  se 
descuidar  das  implicações  dos  termos  de  interação.  Além 
de  usar  pelo  menos  um  grau  de  liberdade  para  cada  inte¬ 
ração,  eles  apresentam  questões  de  interpretação  discuti¬ 
das  no  estágio  4. 

Uso  de  covariáveis  -  ANCOVA  e  MANCOVA 

Discutimos  anteriormente  o  uso  de  fator  de  blocagem  para 
controlar  influências  sobre  a  variável  dependente  que  não 
são  parte  do  planejamento  de  pesquisa  mas  precisam  ser 
explicadas  na  análise.  Ele  permite  ao  pesquisador  contro¬ 
le  sobre  variáveis  não-métricas,  mas  e  quanto  às  variáveis 
métricas?  Um  método  é  converter  a  variável  métrica  em 
uma  não-métrica  (p.ex.,  partição  pela  mediana  etc.),  mas 
este  processo  geralmente  é  considerado  inadequado,  pois 
muita  informação  contida  na  variável  métrica  é  perdida 
na  conversão.  Uma  segunda  abordagem  é  a  inclusão  das 
variáveis  métricas  como  covariáveis. 

Essas  variáveis  podem  extrair  influências  estranhas  da 
variável  dependente,  aumentando  assim  a  variância  den¬ 
tro  do  grupo  (M5w).  O  processo  segue  dois  passos: 

1.  Procedimentos  semelhantes  à  regressão  linear  são  emprega¬ 
dos  para  remover  variação  na  variável  dependente  associa¬ 
da  com  uma  ou  mais  covariáveis. 

2.  Uma  análise  convencional  é  conduzida  sobre  a  variável 
dependente  ajustada.  De  modo  simples,  ela  se  torna  uma 
análise  dos  resíduos  de  regressão  uma  vez  que  os  efeitos  das 
covariáveis  são  removidos. 

Quando  usada  com  ANOVA,  a  análise  se  chama  análise 
de  covariância  (ANCOVA)  e  a  extensão  simples  dos  princí¬ 
pios  de  ANCOVA  para  a  análise  de  multivariada  (múltiplas 
variáveis  dependentes)  é  conhecida  como  MANCOVA. 

Objetivos  de  análise  de  covariância 

O  objetivo  da  covariável  é  eliminar  quaisquer  efeitos  que 
(1)  afetem  apenas  uma  parte  dos  respondentes  ou  (2)  va¬ 
riem  entre  os  respondentes.  Semelhantes  ao  uso  de  um 
fator  de  blocagem,  covariáveis  podem  atingir  dois  propó¬ 
sitos  específicos: 

1.  Eliminar  algum  erro  sistemático  fora  do  controle  do  pesqui¬ 
sador  e  que  possa  viesar  os  resultados 

2.  Explicar  diferenças  nas  respostas  devido  a  características 
típicas  dos  respondentes 

Em  ambientes  experimentais,  a  maioria  dos  vieses  sis¬ 
temáticos  pode  ser  eliminada  pela  associação  aleatória 
de  respondentes  a  vários  tratamentos.  Não  obstante,  em 
pesquisa  não-experimental,  tais  controles  não  são  viáveis. 
Por  exemplo,  no  teste  de  um  anúncio  publicitário,  efeitos 
podem  diferir,  dependendo  da  hora  do  dia  ou  do  tipo  de 
audiência  e  de  suas  reações.  Além  disso,  diferenças  pes¬ 


soais  como  atitudes  ou  opiniões  podem  afetar  respostas, 
mas  a  análise  não  inclui  as  mesmas  como  um  fator  de  tra¬ 
tamento.  O  pesquisador  usa  uma  covariável  para  eliminar 
quaisquer  diferenças  devido  a  tais  fatores  antes  que  os 
efeitos  do  experimento  sejam  calculados. 

Seleção  de  covariáveis 

Uma  covariável  efetiva  é  aquela  que  é  altamente  correla¬ 
cionada  com  a  variável  dependente,  mas  não-correlaciona- 
da  com  as  variáveis  independentes.  Examinemos  o  porquê. 
A  variância  na  variável  dependente  forma  a  base  de  nosso 
termo  de  erro. 

•  Se  a  covariável  é  correlacionada  com  a  variável  dependen¬ 
te  e  não  com  as  variáveis  independentes,  podemos  explicar 
uma  parte  da  variância  com  a  covariável  (por  meio  de  re¬ 
gressão  linear),  restando  uma  variância  residual  (não  expli¬ 
cada)  menor  na  variável  dependente.  Essa  variância  residu¬ 
al  fornece  um  termo  de  erro  menor  (MS^)  para  a  estatística 
F  e,  assim,  um  teste  mais  eficiente  de  efeitos  de  tratamento. 
De  qualquer  modo,  a  quantia  explicada  pela  covariável  não- 
correlacionada  não  teria  sido  explicada  pela  variável  inde¬ 
pendente  (pois  a  covariável  não  está  correlacionada  com  a 
mesma).  Logo,  o  teste  das  variáveis  independentes  é  mais 
sensível  e  poderoso. 

•  No  entanto,  se  a  covariável  está  correlacionada  com  a(s) 
variável(eis)  independente(s),  então  a  covariável  explica 
parte  da  variância  que  poderia  ter  sido  explicada  pela  variá¬ 
vel  independente  e  reduz  seus  efeitos.  Como  a  covariável  é 
extraída  primeiro,  qualquer  variação  associada  com  ela  não 
está  disponível  para  as  variáveis  independentes. 

Assim,  é  crítico  que  o  pesquisador  garanta  que  a  cor¬ 
relação  das  covariáveis  e  variáveis  independentes  seja  pe¬ 
quena  o  suficiente,  de  forma  que  a  diminuição  no  poder 
explanatório  a  partir  da  redução  da  variância  que  poderia 
ter  sido  explicada  pelas  variáveis  independentes  seja  me¬ 
nor  do  que  a  queda  na  variância  não  explicada  atribuível 
às  covariáveis. 

Número  de  covariáveis.  Uma  questão  comum  envolve  a 
quantidade  de  covariáveis  a  serem  acrescentadas  na  aná¬ 
lise.  Apesar  de  o  pesquisador  querer  explicar  o  máximo 
possível  de  efeitos  estranhos,  um  número  muito  grande 
reduz  a  eficiência  estatística  dos  procedimentos.  Uma  re¬ 
gra  prática  [13]  é  que  o  número  máximo  de  covariáveis  se 
determina  da  seguinte  maneira: 

Número  máximo  de  covariáveis  =  (0,10  x  Tamanho  da 
amostra)  -  (Número  de  grupos  -  1). 


Por  exemplo,  para  uma  amostra  de  100  respondentes  e  5 
grupos,  o  número  de  covariáveis  deve  ser  menor  do  que 
6  [6  =  0,10  X  100  -  (5  -  1)].  No  entanto,  para  apenas  dois 
grupos,  a  análise  poderia  incluir  até  9  covariáveis. 


O  pesquisador  sempre  deve  tentar  minimizar  o  número 
de  covariáveis,  ao  mesmo  tempo  em  que  garante  que  cova- 
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riáveis  efetivas  não  sejam  eliminadas,  pois  em  muitos  ca¬ 
sos,  particularmente  com  amostras  pequenas,  elas  podem 
melhorar  muito  a  sensibilidade  dos  testes  estatísticos. 

Suposições  para  análise  de  covariância.  Há  duas  exigên¬ 
cias  para  o  uso  de  uma  análise  de  covariância: 

1.  As  covariáveis  devem  ter  alguma  relação  (correlação)  com 
as  medidas  dependentes 

2.  As  covariáveis  devem  ter  uma  homogeneidade  de  efeito  de 
regressão,  o  que  significa  que  a(s)  covariável(eis)  têm  efei¬ 
tos  iguais  sobre  a  variável  dependente  ao  longo  dos  grupos. 
Em  termos  de  regressão,  isso  implica  coeficientes  iguais 
para  todos  os  grupos. 

Há  testes  estatísticos  disponíveis  para  avaliar  se  essa 
suposição  é  verdadeira  para  cada  covariável  empregada. 
Se  alguma  dessas  exigências  não  for  atendida,  o  uso  de 
covariáveis  será  inadequado. 

Contrapartes  MANOVA  de  outros 
delineamentos  ANOVA 

Existem  muitos  tipos  de  planejamentos  ANOVA  que  são 
discutidos  em  textos  padrão  sobre  planejamento  expe¬ 
rimental  [15,  19,  22].  Todo  planejamento  ANOVA  tem 
sua  contraparte  multivariada;  ou  seja,  qualquer  ANOVA 
sobre  uma  variável  dependente  pode  ser  estendida  para 
planejamentos  MANOVA.  Para  ilustrar  este  fato,  terí¬ 
amos  que  discutir  cada  processo  ANOVA  em  detalhes. 
Naturalmente,  este  tipo  de  discussão  não  é  possível  em 
um  único  capítulo,  pois  livros  inteiros  são  dedicados  a 
planejamentos  ANOVA.  Para  mais  informações,  o  leitor 
pode  consultar  textos  de  caráter  mais  estatístico  [1, 2, 5, 7, 
8,  9, 11,  20,  25]. 

Um  caso  especial  de  MANOVA: 
medidas  repetidas 

Discutimos  várias  situações  nas  quais  queremos  examinar 
diferenças  sobre  diversas  medidas  dependentes.  Uma  si¬ 
tuação  especial  desse  tipo  ocorre  quando  o  mesmo  res- 
pondente  fornece  diversas  medidas,  como  escores  de  teste 
ao  longo  do  tempo,  e  desejamos  examiná-las  para  ver  se 
surge  qualquer  tendência.  No  entanto,  sem  tratamento 
especial,  estaríamos  violando  a  suposição  mais  importan¬ 
te,  a  independência.  Há  modelos  MANOVA  especiais, 
chamados  de  medidas  repetidas,  que  podem  explicar  essa 
dependência  e  ainda  verificar  se  quaisquer  diferenças 
ocorreram  em  indivíduos  no  conjunto  de  variáveis  depen¬ 
dentes.  A  perspectiva  pessoal  é  importante,  de  forma  que 
cada  pessoa  é  colocada  em  uma  mesma  situação.* 


Por  exemplo,  considere  que  estejamos  avaliando  melho¬ 
ramentos  sobre  escores  de  teste  no  semestre.  Devemos 


*  N.  de  R.  T.:  A  idéia  é  que  cada  pessoa  possa  ter  as  suas  próprias 
medidas  comparadas  entre  si. 


explicar  os  escores  de  teste  anteriores  e  o  modo  como 
eles  se  relacionam  com  os  escores  posteriores,  e  pode¬ 
mos  esperar  ver  diferentes  tendências  para  aqueles  com 
escores  iniciais  baixos  versus  altos.  Assim,  devemos  “ca¬ 
sar”  os  escores  de  cada  respondente  quando  fazemos  a 
análise.  As  diferenças  nas  quais  estamos  interessados  são 
o  quanto  cada  pessoa  muda,  e  não  necessariamente  as 
mudanças  em  médias  de  grupos  ao  longo  do  semestre. 


Não  abordamos  os  detalhes  de  modelos  de  medidas  re¬ 
petidas  neste  texto  porque  é  uma  forma  especializada  de 
MANOVA.  O  leitor  interessado  pode  encontrar  muitos 
textos  bons  sobre  o  assunto  [1, 2, 5, 7, 8, 9, 11,  20,  25]. 


ESTÁGIO  3:  SUPOSIÇÕES  DE 
ANOVA  E  MANOVA 

Os  procedimentos  de  teste  univariado  de  ANOVA  descri¬ 
tos  neste  capítulo  são  válidos  (em  um  sentido  estatístico) 
somente  quando  se  assume  que  a  variável  dependente  é 
normalmente  distribuída,  que  os  grupos  são  independen¬ 
tes  em  suas  respostas  sobre  a  variável  dependente,  e  que 
as  variâncias  são  iguais  para  todos  os  grupos  de  tratamen¬ 
to.  Há  evidências  [19,  27],  porém,  de  que  os  testes  Eem 


-  REGRAS  PRÁTICAS  6-2  - 

Planejamento  de  pesqnisa  de  MANOVA 

•  Células  (grupos)  são  formadas  pela  combinação  de 
variáveis  independentes;  por  exemplo,  uma  variável 
não-métrica  de  três  categorias  (como  baixo,  médio  e 
alto)  combinada  com  uma  variável  não-métrica  de  duas 
categorias  (como  sexo  masculino  e  feminino)  resultará 
em  um  planejamento  3x2  com  seis  células  (grupos) 

•  Tamanho  amostrai  por  grupo  é  uma  questão  crítica  de 
planejamento: 

•  O  tamanho  mínimo  de  amostra  por  grupo  deve  ser 
maior  do  que  o  número  de  variáveis  dependentes 

•  O  mínimo  recomendado  é  de  20  observações  por 
célula  (grupo) 

•  Pesquisadores  deveriam  tentar  ter  tamanhos 
amostrais  aproximadamente  iguais  por  célula 
(grupo) 

•  Covariáveis  e  variáveis  de  blocagem  são  modos  efetivos 
de  controle  de  influências  externas  sobre  as  variáveis 
dependentes  que  não  são  diretamente  representadas 
nas  variáveis  independentes 

•  Uma  covariável  efetiva  é  aquela  que  é  altamente 
correlacionada  com  a(s)  variável(is)  dependente(s) 
mas  não  correlacionada  com  as  independentes 

•  O  número  máximo  de  covariáveis  em  um  modelo 
deve  ser  (0,10  X  Tamanho  amostrai)  -  (Número  de 
grupos  - 1) 
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ANOVA  são  robustos  em  relação  a  essas  suposições,  ex¬ 
ceto  em  casos  extremos. 

Para  os  procedimentos  de  teste  multivariado  de  MA- 
NOVA  serem  válidos,  três  suposições  devem  ser  atendi¬ 
das: 

•  As  observações  devem  ser  independentes 

•  As  matrizes  de  variância-covariância  devem  ser  iguais  para 
todos  os  grupos  de  tratamento 

•  O  conjunto  de  variáveis  dependentes  deve  seguir  uma  dis¬ 
tribuição  normal  multivariada  (isto  é,  qualquer  combinação 
linear  das  variáveis  dependentes  deve  seguir  uma  distribui¬ 
ção  normal)  [11] 

Além  das  suposições  estatísticas  estritas,  o  pesquisa¬ 
dor  também  deve  considerar  diversas  questões  que  in¬ 
fluenciam  os  possíveis  efeitos  -  a  saber,  a  linearidade  e 
a  multicolinearidade  da  variável  estatística  de  variáveis 
dependentes. 

Independência 

A  mais  básica,  porém  mais  séria,  violação  de  uma  suposi¬ 
ção  ocorre  quando  há  uma  falta  de  independência  entre 
as  observações,  o  que  significa  que  as  respostas  em  cada 
célula  (grupo)  não  são  feitas  independentemente  de  res¬ 
postas  em  qualquer  outro  grupo.  Violações  dessa  supo¬ 
sição  podem  acontecer  de  maneira  igualmente  fácil  tan¬ 
to  em  situações  experimentais  como  não-experimentais. 
Qualquer  quantia  de  efeitos  estranhos  e  não-medidos 
pode  afetar  os  resultados  criando  dependência  entre  os 
grupos,  mas  duas  das  mais  comuns  violações  de  indepen¬ 
dência  são  devido  a: 

•  Efeitos  temporalmente  ordenados  (correlação  serial)  que 
acontecem  se  forem  tomadas  medidas  ao  longo  do  tempo, 
mesmo  a  partir  de  diferentes  respondentes. 

•  Reunião  de  informação  em  grupos,  de  modo  que  uma  expe¬ 
riência  em  comum  (como  uma  sala  barulhenta  ou  um  con¬ 
junto  confuso  de  instruções)  faria  com  que  um  subconjunto 
de  indivíduos  (aqueles  que  têm  a  experiência  em  comum) 
tivesse  respostas  que  de  algum  modo  fossem  correlaciona¬ 
das. 

Apesar  de  não  existirem  testes  com  uma  certeza  abso¬ 
luta  de  detectar  todas  as  formas  de  dependência,  o  pesqui¬ 
sador  deve  explorar  todos  os  efeitos  possíveis  e  corrigi-los 
quando  encontrados.  Uma  possível  solução  é  combinar  os 
que  estão  dentro  dos  grupos  e  analisar  o  escore  médio  de 
grupo  em  vez  dos  escores  dos  respondentes  em  separado. 
Outra  abordagem  é  empregar  um  fator  de  blocagem  ou 
alguma  forma  de  análise  de  co variáveis  para  explicar  a  de¬ 
pendência.  Em  qualquer  caso,  ou  quando  se  suspeita  que 
haja  dependência,  o  pesquisador  deve  usar  um  nível  de 
signiflcância  mais  baixo  (0,01  ou  até  menos). 

Igualdade  de  matrizes  de  variância-covariância 

A  segunda  suposição  de  MANOVA  é  a  equivalência  de 
matrizes  de  covariância  nos  grupos.  Aqui  estamos  preocu¬ 


pados  com  diferenças  substanciais  no  montante  de  variân¬ 
cia  de  um  grupo  versus  outro  grupo  para  as  variáveis  de¬ 
pendentes  (como  no  problema  de  heteroscedasticidade  em 
regressão  múltipla).  Em  MANOVA,  com  múltiplas  variá¬ 
veis  dependentes,  o  interesse  é  nas  matrizes  de  variância- 
covariância  das  medidas  dependentes  para  cada  grupo. 

A  exigência  de  equivalência  é  um  teste  estrito,  porque 
em  vez  de  variâncias  iguais  para  uma  única  variável  em 
ANOVA,  o  teste  MANOVA  examina  todos  os  elemen¬ 
tos  da  matriz  de  covariância  das  variáveis  dependentes. 
Por  exemplo,  para  cinco  variáveis  dependentes,  as  cin¬ 
co  correlações  e  dez  covariâncias  são  todas  testadas  em 
termos  de  igualdade  nos  grupos.  Programas  MANOVA 
conduzem  o  teste  para  igualdade  de  matrizes  de  covariân¬ 
cia  -  tipicamente  o  teste  M  de  Box  -  e  fornecem  níveis 
de  signiflcância  para  a  estatística  do  teste.  O  teste  M  de 
Box  é  particularmente  sensível  a  desvios  da  normalidade 
[11,  23].  Logo,  sempre  deve  ser  verificada  a  normalidade 
univariada  de  todas  as  medidas  dependentes  antes  de  se 
executar  tal  teste. 

Felizmente,  uma  violação  dessa  suposição  tem  impac¬ 
to  mínimo  se  os  grupos  têm  aproximadamente  o  mesmo 
tamanho  (ou  seja,  se  o  tamanho  do  maior  grupo  dividi¬ 
do  pelo  tamanho  do  menor  for  menos  do  que  1,5).  Se  os 
tamanhos  diferem  mais  do  que  isso,  então  o  pesquisador 
tem  diversas  opções: 

•  Primeiro,  aplicar  uma  das  muitas  transformações  de  esta¬ 
bilização  de  variância  disponíveis  (ver  Capítulo  2  para  uma 
discussão  sobre  esses  métodos)  e  testar  novamente  para  ver 
se  o  problema  foi  solucionado. 

•  Se  as  variâncias  diferentes  persistirem  após  a  transformação 
e  os  tamanhos  dos  grupos  diferirem  bastante,  o  pesquisa¬ 
dor  deverá  fazer  ajustes  para  seus  efeitos.  Primeiro,  deve-se 
verificar  qual  grupo  tem  a  maior  variância.  Essa  determina¬ 
ção  é  facilmente  feita  examinando-se  a  matriz  de  variância- 
covariância  ou  usando-se  o  determinante  da  matriz  de  va¬ 
riância-covariância,  que  é  fornecida  por  todos  os  programas 
estatísticos.  Em  seguida: 

•  Se  as  maiores  variâncias  são  encontradas  nos  maiores 
grupos,  o  nível  alfa  fica  exagerado,  o  que  significa  que  as 
diferenças  deveriam  na  verdade  ser  avaliadas  usando  um 
valor  um  pouco  menor  (por  exemplo,  usar  0,03  no  lugar 
de  0,05). 

•  Se  a  variância  maior  é  encontrada  nos  grupos  menores, 
então  o  inverso  é  verdadeiro.  O  poder  do  teste  foi  redu¬ 
zido  e  o  pesquisador  deve  aumentar  o  nível  de  signifi- 
cância. 

A  habilidade  de  amostras  com  tamanhos  aproximada¬ 
mente  iguais  entre  os  grupos  para  suavizar  violações  dessa 
suposição  reforça  a  importância  do  planejamento  da  aná¬ 
lise  na  seleção  de  tratamentos  para  a  mesma  e  na  manu¬ 
tenção  de  amostras  com  o  mesmo  tamanho. 

Normalidade 

A  última  suposição  para  MANOVA  ser  válida  se  refere  à 
normalidade  das  medidas  dependentes.  No  sentido  estri- 
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to,  a  suposição  é  que  todas  as  variáveis  são  normais  mul- 
tívaríadas.  Uma  distribuição  normal  multivariada  consi¬ 
dera  que  o  efeito  conjunto  de  duas  variáveis  é  distribuído 
normalmente.  Ainda  que  essa  suposição  seja  inerente  à 
maioria  das  técnicas  multivariadas,  não  existe  teste  direto 
para  normalidade  multivariada.  Logo,  a  maioria  dos  pes¬ 
quisadores  testa  a  normalidade  univariada  de  cada  variá¬ 
vel.  Apesar  de  a  normalidade  univariada  não  garantir  a 
normalidade  multivariada,  se  todas  as  variáveis  atendem 
essa  condição,  então  quaisquer  desvios  da  normalidade 
multivariada  geralmente  são  inócuos. 

Violações  dessa  suposição  têm  pouco  impacto  em 
amostras  maiores,  assim  como  ocorre  em  ANOVA.  Violar 
essa  suposição  inicialmente  cria  problemas  na  aplicação 
do  teste  M  de  Box,  mas  transformações  podem  corrigir 
tais  problemas  na  maioria  das  situações.  Para  uma  discus¬ 
são  sobre  as  transformações  de  variáveis,  ver  o  Capítulo  2. 
Com  amostras  de  tamanho  moderado,  violações  modestas 
podem  ser  acomodadas  desde  que  as  diferenças  sejam  de¬ 
correntes  de  assimetrias  e  não  de  observações  atípicas. 

Linearidade  e  multicolinearidade 
entre  as  variáveis  dependentes 

Apesar  de  MANOVA  avaliar  as  diferenças  ao  longo  de 
combinações  de  medidas  dependentes,  ela  pode  construir 
uma  relação  linear  apenas  entre  as  medidas  dependentes 
(e  quaisquer  covariáveis,  se  incluídas).  O  pesquisador  é 
novamente  encorajado  a  primeiramente  examinar  os  da¬ 
dos,  dessa  vez  avaliando  a  presença  de  relações  não-line- 
ares.  Se  elas  existirem,  então  poderá  ser  tomada  a  deci¬ 
são  quanto  a  necessidade  de  elas  serem  incorporadas  ao 
conjunto  de  variáveis  dependentes,  ao  preço  de  crescente 
complexidade,  mas  maior  representatividade.  O  Capítulo 
2  aborda  tais  testes. 

-  REGRAS  PRÁTICAS  6-3  - 

Suposições  MANO  VA/ANO  VA 

•  Para  que  os  procedimentos  de  teste  multivariado 

usados  com  MANOVA  sejam  válidos: 

•  Observações  devem  ser  independentes 

•  Matrizes  de  variância-covariância  devem  ser 
iguais  (ou  comparáveis)  para  todos  os  grupos  de 
tratamento 

•  As  variáveis  dependentes  devem  ter  uma 
distribuição  normal  multivariada 

•  Normalidade  multivariada  é  assumida,  mas  muitas 
vezes  difícil  de  avaliar;  normalidade  univariada  não 


violações  dessas  suposições  sao  modestas 


Além  da  condição  de  linearidade,  as  variáveis  depen¬ 
dentes  não  devem  ter  multicolinearidade  elevada  (discu¬ 
tida  no  Capítulo  4),  o  que  indica  medidas  dependentes 
redundantes  e  diminui  a  eficiência  estatística.  Discutimos 
o  impacto  da  multicolinearidade  sobre  o  poder  estatístico 
de  MANOVA  na  próxima  seção. 

Sensibilidade  a  observações  atípicas 

Além  do  impacto  de  heteroscedasticidade  discutido  an¬ 
teriormente,  MANOVA  (e  ANOVA)  é  especialmente 
sensível  a  observações  atípicas  e  seu  impacto  sobre  o  erro 
Tipo  I.  O  pesquisador  é  fortemente  encorajado  a  primei¬ 
ramente  examinar  os  dados  em  busca  de  observações  atí¬ 
picas  e  eliminá-las  da  análise,  se  possível,  pois  seu  impacto 
sobre  os  resultados  gerais  será  desproporcional. 


ESTÁGIO  4:  ESTIMAÇÃO  DO 
MODELO  MANOVA  E  AVALIAÇÃO 
DO  AJUSTE  GERAL 

Uma  vez  que  a  análise  MANOVA  tenha  sido  formula¬ 
da  e  as  suposições  tenham  sido  testadas  do  modo  como 
se  exige,  a  avaliação  de  diferenças  significantes  entre  os 
grupos  formados  pelo(s)  tratamento(s)  pode  prosseguir 
(ver  Figura  6-4).  Procedimentos  de  estimação  baseados 
no  modelo  linear  geral  estão  se  tornando  mais  comuns,  e 
as  questões  básicas  serão  abordadas.  Com  o  modelo  esti¬ 
mado,  o  pesquisador  pode  então  avaliar  as  diferenças  em 
médias  com  base  nas  estatísticas  de  teste  mais  apropriadas 
aos  objetivos  de  estudo.  Além  disso,  em  qualquer  situa¬ 
ção,  mas  especialmente  quando  a  análise  se  torna  mais 
complexa,  o  pesquisador  deve  avaliar  o  poder  dos  testes 
estatísticos  para  fornecer  a  perspectiva  mais  bem  informa¬ 
da  sobre  os  resultados  obtidos. 

Estimação  com  o  modelo  linear  geral 

A  maneira  tradicional  de  calcular  as  estatísticas  de  teste 
apropriadas  para  ANOVA  e  MANOVA  foi  estabelecida 
há  mais  de  70  anos  [26].  Nos  últimos  anos,  porém,  o  mo¬ 
delo  linear  geral  (GLM)  [18,  21]  tornou-se  um  modo  po¬ 
pular  de  estimação  de  modelos  ANOVA  e  MANOVA.  O 
procedimento  GLM,  como  o  nome  sugere,  é  uma  família 
de  modelos,  cada  um  composto  de  três  elementos: 

•  Variável  estatística.  A  combinação  linear  de  variáveis  inde¬ 
pendentes  como  especificada  pelo  pesquisador.  Cada  variá¬ 
vel  independente  tem  um  peso  estimado  representando  a 
contribuição  da  mesma  ao  valor  previsto. 

Componente  aleatória.  A  distribuição  de  probabilidade  con¬ 
siderada  para  as  variáveis  dependentes.  Distribuições  típi¬ 
cas  de  probabilidades  são  a  normal,  de  Poisson,  binomial  e 
multinomial.  Cada  distribuição  é  associada  com  um  tipo  de 
variável  resposta  (p.ex.,  variáveis  contínuas  são  associadas 
com  uma  distribuição  normal,  proporções  são  associadas 
com  a  distribuição  binomial,  e  variáveis  dicotômicas  corres- 


garante  a  multivariada,  mas  se  todas  as  variáveis 
atendem  à  exigência  em  sua  versão  univariada, 
então  desvios  da  normalidade  multivariada  são 
inconsequentes. 

•  Testes  F  de  ANOVA  são  geralmente  robustos  se 
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Estágio  4 


Estágio  5 


Estágio  6 


FiGURA  6-4  Estágios  4-6  no  diagrama  de  decisão  da  análise  multivariada  de  variância  (MANOVA). 


pondem  à  distribuição  de  Poisson).  O  pesquisador  escolhe 
a  componente  aleatória  com  base  no  tipo  de  variável  res¬ 
posta. 

•  Função  de  ligação.  Fornece  a  conexão  teórica  entre  a  va¬ 
riável  estatística  e  a  componente  aleatória  para  acomodar 
diferentes  formulações  de  modelos.  A  função  de  ligação  es¬ 
pecifica  o  tipo  de  transformação  necessário  para  designar  o 
modelo  desejado.  Os  três  tipos  mais  comuns  de  funções  de 
ligação  são  a  identidade,  logit  e  logaritmo. 

O  método  GLM  dá  ao  pesquisador  um  modelo  de  es¬ 
timação  dentro  do  qual  qualquer  quantia  de  modelos  es¬ 
tatísticos  distintos  pode  ser  acomodada.  Duas  vantagens 
únicas  do  método  GLM  são  a  sua  flexibilidade  e  simplici¬ 
dade  no  delineamento  de  modelos. 

•  Pela  determinação  de  uma  combinação  específica  da  com¬ 
ponente  aleatória  e  da  função  de  ligação  acopladas  com  um 
tipo  de  variável  na  variável  estatística,  uma  vasta  gama  de 
modelos  multivariados  pode  ser  estimada.  Como  se  mostra 
na  Tabela  6-2,  combinações  dessas  componentes  correspon¬ 


dem  a  muitas  das  técnicas  multivariadas  já  discutidas.  As¬ 
sim,  um  procedimento  de  estimação  único  pode  ser  usado 
para  muitos  modelos  empíricos. 

•  O  pesquisador  pode  também  mudar  a  função  de  ligação  ou 
a  distribuição  de  probabilidades  para  melhor  combinar  as 
propriedades  reais  dos  dados  em  vez  de  empregar  exten¬ 
sivas  transformações  dos  mesmos.  Dois  exemplos  ilustram 
este  ponto.  Primeiro,  em  casos  de  heteroscedasticidade,  a 
substituição  da  distribuição  gama  permitiria  a  estimação  do 
modelo  sem  transformar  a  medida  dependente.  Segundo,  se 
a  variável  estatística  fosse  considerada  multiplicativa  e  não 
aditiva,  uma  alternativa  seria  o  emprego  de  uma  transfor¬ 
mação  logarítmica  da  variável  estatística.  Em  um  GLM,  a 
variável  estatística  pode  permanecer  na  formulação  aditiva 
com  uma  função  logarítmica  de  ligação  sendo  empregada. 

Uma  discussão  mais  aprofundada  do  procedimento 
GLM  e  suas  inúmeras  variações  está  disponível  em  diver¬ 
sos  textos  [6, 14, 18].  Aqui,  oferecemos  esta  breve  introdu¬ 
ção  ao  conceito  de  GLM  por  ele  ter  se  tornado  o  método 
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TABELA  6-2  Especificação  de  modeios  muitivariados  como  componentes  GLM 


Técnica  multivariada 

Variável  resposta 
(dependente) 

Variável 

independente 

Função  de  ligação 

Distribuição  de 
probabilidade 

Regressão  múltipla 

Métrica 

Métrica 

Identidade 

Normal 

Regressão  logística 

Não-métrica 

Métrica 

Logit 

Binomial 

ANOVA/MANOVA 

Métrica 

Não-métrica 

Identidade 

Normal 

preferido  de  estimação  para  ANOVA  e  MANOVA  entre 
muitos  pesquisadores  e  entre  alguns  programas  estatísti¬ 
cos  (p.ex.,  SPSS). 

Critérios  para  teste  de  significância 

Em  nossas  discussões  sobre  a  semelhança  de  MANO¬ 
VA  com  análise  discriminante,  chamamos  atenção  para 
a  maior  raiz  característica  e  a  primeira  função  discrimi¬ 
nante,  e  tais  termos  implicam  que  múltiplas  funções  dis¬ 
criminantes  podem  atuar  como  variáveis  estatísticas  das 
variáveis  dependentes.  O  número  de  funções  é  defini¬ 
do  pelo  menor  entre  (/c  -  1)  e  p,  onde  k  é  o  número  de 
grupos  e  p  é  a  quantia  de  variáveis  dependentes.  Assim, 
qualquer  medida  para  testar  a  significância  estatística  de 
diferenças  de  grupos  em  MANOVA  pode  demandar  que 
se  considerem  diferenças  ao  longo  de  múltiplas  funções 
discriminantes. 

Medidas  estatísticas 

Como  vimos  primeiramente  em  análise  discriminante 
(Capítulo  5),  pesquisadores  usam  vários  critérios  estatís¬ 
ticos  para  avaliar  as  diferenças  ao  longo  de  dimensões  das 
variáveis  dependentes.  As  medidas  mais  usadas  são: 

•  A  maior  raiz  característica  de  Roy  (gcr),  como  o  nome  su¬ 
gere,  mede  as  diferenças  apenas  quanto  à  primeira  função 
discriminante  entre  as  variáveis  dependentes.  Esse  critério 
fornece  vantagens  em  poder  e  especificidade  do  teste,  mas 
o  torna  menos  útil  em  situações  em  que  todas  as  dimensões 
devem  ser  consideradas.  O  teste  gcr  de  Roy  é  mais  ade¬ 
quado  quando  as  variáveis  dependentes  estão  fortemente 
inter-relacionadas  em  uma  única  dimensão,  mas  também 
é  a  medida  mais  facilmente  afetada  por  violações  das  su¬ 
posições. 

•  O  lambda  de  Wilks  (também  conhecido  como  a  estatística 
U)  é  muitas  vezes  chamado  de  fmultivariado  e  é  comumen- 
te  usado  para  testar  significância  geral  entre  grupos  em  uma 
situação  multivariada.  Diferente  da  estatística  gcr  de  Roy,  a 
qual  é  baseada  na  primeira  função  discriminante,  o  lambda 
de  Wilks  considera  todas  as  funções  discriminantes;  ou  seja, 
examina  se  os  grupos  são  de  algum  modo  diferentes,  sem 
se  preocupar  com  a  possibilidade  de  eles  diferirem  em  pelo 
menos  uma  combinação  linear  das  variáveis  dependentes. 
Apesar  de  a  distribuição  do  lambda  de  Wilks  ser  complexa, 
há  boas  aproximações  disponíveis  para  teste  de  significância 
que  a  transformam  em  uma  estatística  F  [22]. 

•  O  critério  de  Pillai  e  o  traço  de  Hotelling  são  duas  outras 
medidas  semelhantes  ao  lambda  de  Wilks  por  considerarem 
todas  as  raízes  características  e  poderem  ser  aproximadas 
por  uma  estatística  F. 


Com  somente  dois  grupos,  todas  as  medidas  são  equiva¬ 
lentes.  Diferenças  ocorrem  à  medida  que  o  número  de  fun¬ 
ções  discriminantes  aumenta.  A  discussão  a  seguir  identifi¬ 
ca  as  medidas  mais  adequadas  para  diferentes  situações. 

Seleção  de  uma  medida  estatística 

Qual  critério  é  preferido?  A  medida  preferida  é  a  que  for 
mais  imune  a  violações  das  suposições  inerentes  a  MA¬ 
NOVA  e  que  ainda  mantiver  o  maior  poder.  Cada  medida 
tem  diferentes  propriedades,  de  modo  que  variadas  situa¬ 
ções  favorecem  medidas  distintas: 

•  O  critério  de  Pillai  ou  o  lambda  de  Wilks  é  a  medida  pre¬ 
ferida  quando  as  considerações  básicas  de  planejamento 
(tamanho  amostrai  adequado,  sem  violações  de  suposições, 
células  com  tamanhos  parecidos)  são  atendidas. 

•  O  critério  de  Pillai  é  tido  como  mais  robusto  e  deve  ser  uti¬ 
lizado  se  o  tamanho  da  amostra  diminui,  se  surgem  células 
com  tamanhos  distintos,  ou  se  a  homogeneidade  de  covari- 
âncias  é  violada. 

•  O  gcr  de  Roy  é  um  teste  estatístico  mais  poderoso  se  o  pes¬ 
quisador  está  seguro  de  que  todas  as  suposições  são  estrita¬ 
mente  atendidas  e  as  medidas  dependentes  são  representa¬ 
tivas  de  uma  única  dimensão  de  efeitos. 

Em  uma  vasta  maioria  de  situações,  todos  os  critérios 
estatísticos  fornecem  conclusões  semelhantes.  No  entanto, 
quando  se  lida  com  conclusões  conflitantes,  as  condições 
acima  descritas  podem  ajudar  o  pesquisador  na  escolha 
do  critério  mais  apropriado.  Todos  os  critérios  estão  dis¬ 
poníveis  nos  principais  pacotes  estatísticos,  o  que  torna  as 
comparações  bastante  fáceis. 

Poder  estatístico  dos  testes  muitivariados 

Em  termos  simples  para  MANOVA,  poder  é  a  proba¬ 
bilidade  de  que  um  teste  estatístico  identifique  um  efei¬ 
to  do  tratamento  se  ele  realmente  existir.  O  poder  pode 
ser  expresso  também  como  um  menos  a  probabilidade 
de  um  erro  Tipo  II  ((3)  (ou  seja.  Poder  =  1  -  (3).  Poder 
estatístico  tem  um  papel  crucial  em  qualquer  análise 
MANOVA,  pois  é  usado  nos  processos  de  planejamento 
(ou  seja,  determinando  tamanho  amostrai  necessário)  e 
como  medida  diagnóstica  dos  resultados,  particularmen¬ 
te  quando  efeitos  não-significantes  são  descobertos.  As 
seções  a  seguir  examinam  primeiro  os  impactos  sobre 
poder  estatístico  e  então  abordam  questões  únicas  para 
utilizar  análise  de  poder  em  um  planejamento  MANO¬ 
VA.  O  leitor  é  encorajado  também  a  rever  a  discussão 
sobre  poder  no  Capítulo  1. 
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Impactos  sobre  poder  estatístico 

O  nível  de  poder  para  qualquer  um  dos  quatro  critérios 
estatísticos  -  gcr  de  Roy,  lambda  de  Wilks,  traço  de  Ho- 
telling  ou  o  critério  de  Pillai  -  é  baseado  em  três  consi¬ 
derações:  o  nível  alfa  (a),  o  tamanho  do  efeito  do  trata¬ 
mento,  e  o  tamanho  das  amostras  dos  grupos.  Cada  uma 
dessas  considerações  é  controlável  em  variados  graus  em 
um  planejamento  MANOVA  e  fornece  ao  pesquisador 
diversas  opções  para  gerenciar  o  poder  a  fim  de  atingir  o 
nível  desejado  de  poder  na  faixa  de  0,80  ou  acima  disso. 

Nível  de  sígníficâncía  estatística  (alfa  a).  Como  discuti¬ 
do  no  Capítulo  1,  poder  é  inversamente  relacionado  ao 
nível  alfa  (a)  selecionado.  Muitos  pesquisadores  consi¬ 
deram  que  o  nível  de  significância  é  fixo  em  algum  nível 
(p.ex.,  0,05),  mas  na  verdade  ele  é  um  julgamento  do  pes¬ 
quisador  sobre  onde  colocar  a  ênfase  do  teste  estatístico. 
Muitas  vezes  os  outros  dois  elementos  que  afetam  poder 
(tamanho  do  efeito  e  tamanho  da  amostra)  já  estão  espe¬ 
cificados  ou  os  dados  já  foram  coletados,  fazendo  assim  o 
nível  alfa  se  tornar  a  ferramenta  principal  na  definição  do 
poder  de  uma  análise. 

Estabelecendo  o  nível  alfa  necessário  para  denotar 
significância  estatística,  o  pesquisador  está  equilibrando  a 
vontade  de  ser  estrito  no  que  é  considerada  uma  diferença 
significante  entre  grupos  com  a  definição  de  um  critério 
não  tão  alto  a  ponto  de  diferenças  não-significantes  não 
serem  percebidas.* 

•  Aumentar**  alfa  (isto  é,  a  se  tornar  mais  conservador,  como 
mudar  de  0,05  para  0,01)  reduz  as  chances  de  se  aceitarem 
diferenças  como  significantes  quando  na  realidade  não  o 
são.  Contudo,  fazer  isso  diminui  o  poder,  pois  ser  mais  sele¬ 
tivo  quanto  àquilo  que  é  considerado  como  uma  diferença 
estatística  também  aumenta  a  dificuldade  na  descoberta  de 
uma  diferença  significante. 

•  Diminuir***  o  nível  alfa  exigido  para  algo  ser  estatisti¬ 
camente  significante  (p.ex.,  a  mudar  de  0,05  para  0,10)  é 
considerado  muitas  vezes  como  sendo  "menos  estatísti¬ 
co",  pois  o  pesquisador  deseja  aceitar  diferenças  menores 
de  grupos  como  significantes.  Não  obstante,  em  casos  nos 
quais  tamanhos  de  efeitos  ou  de  amostras  são  menores 
do  que  o  desejado,  pode  ser  necessário  estar  menos  preo¬ 
cupado  com  a  aceitação  desses  falsos  positivos  e  dimi- 
nuir***  o  nível  alfa  para  aumentar  o  poder.  Um  exemplo 
assim  ocorre  quando  se  fazem  múltiplas  comparações. 
Para  controlar  taxa  de  erro  experimental,  o  nível  alfa  é 
aumentado  para  cada  comparação  separada.  Porém,  fazer 
diversas  comparações  e  ainda  se  atingir  uma  taxa  geral  de 
0,05  pode  demandar  níveis  estritos  (p.ex.,  0,01  ou  menos) 
para  cada  comparação  separada,  tornando  assim  difícil  a 
tarefa  de  se  encontrarem  diferenças  significantes  (ou  seja, 
menor  poder).  Aqui  o  pesquisador  pode  aumentar  o  nível 
alfa  geral  para  permitir  um  nível  alfa  mais  razoável  para 
os  testes  separados. 


*  N.  de  R.  T.:  A  frase  correta  seria  “...  com  a  definição  de  um  critério  não 
tão  alto  a  ponto  de  diferenças  não-significantes  serem  percebidas”. 

**  N.  de  R.  T.:  O  certo  é  “Diminuir  alfa”. 

***  N.  de  R.  T.:  O  certo  é  “Aumentar  o  nível  alfa”. 


O  pesquisador  sempre  deve  estar  ciente  das  implica¬ 
ções  do  ajuste  do  nível  alfa,  pois  o  objetivo  prioritário 
da  análise  não  é  apenas  evitar  erros  Tipo  I,  mas  também 
identificar  os  efeitos  do  tratamento  se  eles  de  fato  existi¬ 
rem.  Se  o  nível  alfa  é  estabelecido  de  forma  muito  estrita, 
então  o  poder  talvez  seja  muito  pequeno  para  identificar 
resultados  válidos.  O  pesquisador  deve  tentar  manter  um 
nível  alfa  aceitável  com  poder  na  faixa  de  0,80.  Para  uma 
discussão  mais  detalhada  da  relação  entre  erros  Tipo  I  e 
Tipo  II  e  poder,  ver  Capítulo  1. 

Tamanho  do  efeito.  Como  o  pesquisador  aumenta  o  po¬ 
der,  uma  vez  que  um  nível  alfa  tenha  sido  especificado? 
A  “ferramenta”  principal  à  sua  disposição  é  o  tamanho 
amostrai  dos  grupos.  Mas  antes  de  avaliarmos  o  seu  papel, 
precisamos  entender  o  impacto  do  tamanho  do  efeito,  o 
qual  é  uma  medida  padronizada  de  diferenças  de  grupos, 
normalmente  expressa  como  as  diferenças  em  médias  de 
grupos  divididas  por  seu  desvio-padrão.  Esta  fórmula  con¬ 
duz  a  várias  generalizações: 

•  Como  é  de  se  esperar,  com  todas  as  demais  coisas  iguais, 
tamanhos  de  efeitos  maiores  têm  mais  poder  (ou  seja,  são 
mais  fáceis  de  achar)  do  que  tamanhos  de  efeitos  meno¬ 
res. 

•  A  magnitude  do  tamanho  do  efeito  tem  um  impacto  direto 
sobre  o  poder  do  teste  estatístico.  Para  qualquer  tamanho 
de  amostra,  o  poder  do  teste  estatístico  será  maior  quanto 
maior  o  tamanho  do  efeito.  Reciprocamente,  se  um  trata¬ 
mento  tem  um  pequeno  tamanho  de  efeito  esperado,  será 
necessária  uma  amostra  muito  maior  para  se  atingir  o  mes¬ 
mo  poder  de  um  tratamento  com  um  grande  tamanho  de 
efeito. 

Pesquisadores  sempre  esperam  planejar  experimen¬ 
tos  com  grandes  tamanhos  de  efeitos.  Contudo,  diante  de 
pesquisas  de  campo,  pesquisadores  devem  “pegar  o  que 
conseguem”  e  assim  devem  estar  cientes  dos  possíveis 
tamanhos  de  efeitos  quando  planejam  suas  pesquisas  e 
quando  analisam  seus  resultados. 

Tamanho  da  amostra.  Com  o  nível  alfa  especificado  e  o 
tamanho  de  efeito  identificado,  o  elemento  final  que  afeta 
o  poder  é  o  tamanho  da  amostra.  Em  muitos  casos,  esse  é 
o  elemento  sob  maior  controle  do  pesquisador.  Como  dis¬ 
cutido  anteriormente,  a  amostra  aumentada  geralmente 
reduz  o  erro  amostrai  e  aumenta  a  sensibilidade  (poder) 
do  teste.  Outros  fatores  discutidos  anteriormente  (nível 
alfa  e  tamanho  de  efeito)  também  afetam  o  poder,  e  po¬ 
demos  obter  algumas  generalizações  para  planejamentos 
ANO  VA  e  MANOVA: 

•  Em  análises  com  grupos  com  menos  de  30  membros,  obter 
níveis  de  poder  desejados  pode  ser  bastante  problemáti¬ 
co.  Se  tamanhos  de  efeitos  forem  pequenos,  o  pesquisador 
pode  se  ver  obrigado  a  diminuir***  o  alfa  (p.ex.,  de  0,05 
para  0,10)  para  obter  o  poder  desejado. 

•  Aumentar  o  tamanho  das  amostras  em  cada  grupo  tem  efei¬ 
tos  significativos  até  o  momento  em  que  os  grupos  atingem 
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aproximadamente  150,  e  então  o  aumento  no  poder  diminui 
sensivelmente. 

•  Lembre-se  que  grandes  amostras  (como  400  ou  mais)  redu¬ 
zem  a  componente  de  erro  amostrai  a  um  nível  tão  pequeno 
que  a  maioria  das  pequenas  diferenças  é  considerada  es¬ 
tatisticamente  significante.  Quando  as  amostras  se  tornam 
grandes  e  a  significância  estatística  é  indicada,  o  pesquisa¬ 
dor  deve  examinar  o  poder  e  os  tamanhos  de  efeito  para 
garantir  não  apenas  a  significância  estatística,  mas  também 
a  significância  prática. 

A  habilidade  de  se  analisarem  múltiplas  variáveis  de¬ 
pendentes  em  MANO  VA  cria  restrições  adicionais  sobre 
o  poder  em  uma  análise  MANOVA.  Uma  fonte  [17]  de 
tabelas  publicadas  apresenta  poder  em  várias  situações 
comuns  para  as  quais  MANOVA  se  aplica.  Porém,  pode¬ 
mos  obter  algumas  conclusões  gerais  a  partir  do  exame  de 
uma  série  de  condições  encontradas  em  muitos  planeja¬ 
mentos  de  pesquisa.  A  Tabela  6-3  fornece  uma  visão  geral 
dos  tamanhos  amostrais  necessários  para  diversos  níveis 
de  complexidade  de  análise.  Uma  leitura  da  tabela  con¬ 
duz  a  vários  pontos  de  caráter  geral. 

•  Aumentar  o  número  de  variáveis  dependentes  demanda 
tamanhos  maiores  para  amostras  para  que  se  mantenha 
um  dado  nível  de  poder.  O  tamanho  amostrai  extra  ne¬ 
cessário  é  mais  pronunciado  para  tamanhos  de  efeitos 
menores. 

•  Para  pequenos  tamanhos  de  efeitos,  o  pesquisador  deve  es¬ 
tar  preparado  para  se  empenhar  em  um  substancial  esfor¬ 
ço  de  pesquisa  para  atingir  níveis  aceitáveis  de  poder.  Por 
exemplo,  para  conseguir  o  poder  sugerido  de  0,80  quando  se 
avaliam  pequenos  tamanhos  de  efeitos  em  um  planejamen¬ 
to  de  quatro  grupos,  115  sujeitos  por  grupo  são  exigidos  se 
duas  medidas  dependentes  forem  usadas.  O  tamanho  amos¬ 
trai  exigido  aumenta  para  185  por  grupo  se  oito  variáveis 
dependentes  são  consideradas. 

Como  podemos  ver,  as  vantagens  de  se  utilizarem 
múltiplas  medidas  dependentes  surgem  com  um  custo  em 
nossa  análise.  Desse  modo,  o  pesquisador  sempre  deve 
equilibrar  o  emprego  de  mais  medidas  dependentes  ver¬ 
sus  os  benefícios  da  parcimônia  no  conjunto  de  variáveis 
dependentes  que  ocorrem  não  apenas  na  interpretação, 
mas  também  nos  testes  estatísticos  para  diferenças  de 
grupos. 


Cálculo  de  níveis  de  poder  Para  calcular  o  poder  para 
análises  ANOVA,  há  publicações  [3,24]  e  programas 
disponíveis.  Os  métodos  para  computar  o  poder  de  MA¬ 
NOVA,  porém,  são  muito  mais  limitados.  Felizmente,  a 
maioria  dos  programas  de  computador  fornece  uma  ava¬ 
liação  de  poder  para  os  testes  de  significância  e  permite  ao 
pesquisador  determinar  se  o  poder  deve  ter  um  papel  na 
interpretação  dos  resultados. 

Em  termos  de  material  publicado  para  fins  de  delinea¬ 
mento,  existe  pouca  coisa  para  MANOVA,  pois  muitos 
elementos  afetam  o  poder  de  uma  análise  MANOVA.  O 
pesquisador,  porém,  deve  utilizar  as  ferramentas  dispo¬ 
níveis  para  ANOVA  e  então  promover  ajustes  descritos 
para  aproximar  o  poder  de  um  planejamento  MANOVA. 

Uso  do  poder  no  planejamento  e  na  análise 

A  estimação  de  poder  deve  ser  usada  tanto  no  delinea¬ 
mento  da  análise  quanto  na  avaliação  dos  resultados.  No 
estágio  de  planejamento,  o  pesquisador  determina  o  ta¬ 
manho  amostrai  necessário  para  identificar  o  tamanho  de 
efeito  estimado.  Em  muitos  casos,  o  tamanho  do  efeito 
pode  ser  estimado  a  partir  de  pesquisa  anterior  ou  de  al¬ 
gum  tipo  de  julgamento,  ou  mesmo  ser  estabelecido  em 
um  nível  mínimo  de  significância  prática.  Em  cada  caso,  o 
tamanho  amostrai  necessário  para  atingir  um  dado  nível 
de  poder  com  um  nível  alfa  especificado  pode  ser  deter¬ 
minado. 

Avaliando  o  poder  dos  critérios  de  teste  depois  que  a 
análise  tenha  sido  concluída,  o  pesquisador  fornece  um 
contexto  para  interpretar  os  resultados,  especialmen¬ 
te  se  não  foram  encontradas  diferenças  significantes.  O 
pesquisador  deve  primeiramente  determinar  se  o  poder 
atingido  é  suficiente  (0,80  ou  mais).  Caso  contrário,  a 
análise  pode  ser  reformulada  para  fornecer  mais  poder? 
Uma  possibilidade  inclui  alguma  forma  de  tratamento 
por  bloqueio  ou  análise  covariada  que  tornarão  o  teste 
mais  eficiente,  acentuando-se  o  tamanho  do  efeito.  Se  o 
poder  for  adequado  e  não  tiver  sido  encontrada  signi¬ 
ficância  estatística  para  um  efeito  do  tratamento,  então 
muito  provavelmente  o  tamanho  do  efeito  para  o  trata¬ 
mento  foi  muito  pequeno  para  ter  significância  estatísti¬ 
ca  ou  prática. 


TABELA  6-3  Exigências  de  tamanho  de  amostra  por  grupo  para  se  atingir  poder  estatístico  de  0,80  em  MANOVA 

NÚMERO  DE  GRUPOS 

3  4  5 


Número  de  variáveis  dependentes  Número  de  variáveis  dependentes  Número  de  variáveis  dependentes 


Tamanho  de  efeito 

2 

4 

6 

8 

2 

4 

6 

8 

2 

4 

6 

8 

Muito  grande 

13 

16 

18 

21 

14 

18 

21 

23 

16 

21 

24 

27 

Grande 

26 

33 

38 

42 

29 

37 

44 

46 

34 

44 

52 

58 

Médio 

44 

56 

66 

72 

50 

64 

74 

84 

60 

76 

90 

100 

Pequeno 

98 

125 

145 

160 

115 

145 

165 

185 

135 

170 

200 

230 

Fonte:  J.  Láuter,  “Sample  Size  Requirements  for  the  T^Test  of  MANOVA  (Tables  for  One-Way  Classification),”  Biometricai  Journal  20  (1978):  389-406. 
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Os  efeitos  da  multicolinearidade  de 
variáveis  dependentes  sobre  o  poder 

Até  este  ponto,  discutimos  o  poder  sob  uma  perspectiva 
aplicável  a  ANOVA  e  MANOVA.  No  entanto,  em  MA- 
NOVA,  o  pesquisador  também  deve  considerar  os  efeitos 
de  multicolinearidade  das  variáveis  dependentes  sobre  o 
poder  dos  testes  estatísticos.  O  pesquisador,  no  estágio  de 
delineamento  ou  análise,  deve  considerar  a  força  e  a  di¬ 
reção  das  correlações,  bem  como  os  tamanhos  de  efeitos 
sobre  as  variáveis  dependentes.  Se  classificamos  as  variá¬ 
veis  por  seus  tamanhos  de  efeitos  como  fortes  ou  fracas, 
diversos  padrões  emergem  [4]. 

•  Primeiro,  se  o  par  de  variáveis  correlacionadas  é  formado 
por  variáveis  forte-forte  ou  fraca-fraca,  então  o  maior  po¬ 
der  é  alcançado  quando  a  correlação  entre  variáveis  é  al¬ 
tamente  negativa.  Isso  sugere  que  MANOVA  é  otimizada 
acrescentando-se  variáveis  dependentes  que  tenham  altas 
correlações  negativas.  Por  exemplo,  ao  invés  de  incluir  duas 
medidas  redundantes  de  satisfação,  o  pesquisador  pode 
substituí-las  por  medidas  correlacionadas  de  satisfação  e  in¬ 
satisfação  para  aumentar  o  poder. 

•  Quando  o  par  de  variáveis  correlacionadas  é  uma  mistura 
(forte-fraca),  o  poder  é  maximizado  quando  a  correlação  é 
alta,  sendo  positiva  ou  negativa. 

•  Uma  exceção  a  esse  padrão  geral  é  o  fato  de  que  o  uso  de 
múltiplos  itens  para  aumentar  a  confiabilidade  resulta  em 
um  ganho  líquido  de  poder,  mesmo  quando  os  itens  são  re¬ 
dundantes  e  positivamente  correlacionados. 

Revisão  do  poder  em  MANOVA 

Uma  das  mais  importantes  considerações  em  uma  MA¬ 
NOVA  bem  sucedida  é  o  poder  estatístico  da  análise. 
Ainda  que  pesquisadores  empenhados  em  experimentos 
tenham  muito  maior  controle  sobre  os  três  elementos 
que  afetam  poder,  eles  devem  se  assegurar  de  abordar  as 
questões  levantadas  nas  seções  anteriores,  senão  podem 
facilmente  ocorrer  problemas  potenciais  que  reduzam 
o  poder  abaixo  do  valor  desejado  de  0,80.  Em  pesquisa 
de  campo,  o  pesquisador  está  diante  não  apenas  de  uma 
menor  certeza  sobre  os  tamanhos  de  efeitos  na  análise, 
mas  também  da  falta  de  controle  sobre  tamanhos  de  gru¬ 
pos  e  de  grupos  potencialmente  pequenos  que  podem 
acontecer  no  processo  de  amostragem.  Assim,  questões 
no  planejamento  e  na  execução  da  pesquisa  de  campo 
discutidas  no  estágio  2  são  igualmente  críticas  em  uma 
análise  bem  sucedida. 


ESTÁGIO  5:  INTERPRETAÇÃO 
DOS  RESULTADOS  MANOVA 

Assim  que  a  significância  estatística  dos  tratamentos  ti¬ 
ver  sido  avaliada,  o  pesquisador  volta  sua  atenção  para  o 
exame  dos  resultados  para  compreender  como  cada  trata¬ 
mento  afeta  as  medidas  dependentes.  Fazendo  isso,  uma 
série  de  três  passos  deve  ser  seguida: 


-  REGRAS  PRÁTICAS  6-4  - 

Estimação  MANOVA 

•  As  quatro  medidas  mais  usadas  para  avaliar 
significância  estatística  entre  grupos  quanto  às  variáveis 
independentes*  são: 

•  A  maior  raiz  característica  de  Roy 

•  Lambda  de  Wilks 

•  Critério  de  Pillai 

•  Traço  de  Hotelling 

•  Na  maioria  das  situações  os  resultados/conclusões  serão 
os  mesmos  em  todas  as  quatro  medidas,  mas  em  alguns 
casos  únicos  eles  serão  diferentes  entre  as  medidas 

•  Manter  poder  estatístico  adequado  é  crucial: 

•  Poder  na  faixa  de  0,80  para  o  nível  alfa  escolhido  é 
aceitável 

•  Quando  o  tamanho  de  efeito  é  pequeno,  o 
pesquisador  deve  usar  tamanhos  amostrais  maiores 
por  grupo  para  manter  níveis  aceitáveis  de  poder 
estatístico 

•  Q  modelo  linear  geral  (GLM)  é  amplamente  usado 
hoje  em  dia  para  teste  de  modelos  ANQVA  ou 
MANQVA;  GLM  está  disponível  na  maioria  dos 
pacotes  estatísticos,  como  SPSS  e  SAS 


1.  Interpretação  dos  efeitos  de  covariáveis,  se  empregadas 

2.  Avaliação  de  qual(ais)  variável(eis)  dependente(s)  exibe(m) 
diferenças  nos  grupos  de  cada  tratamento. 

3.  Identificação  de  quais  grupos  diferem  em  uma  única  variável 
dependente  ou  na  variável  estatística  dependente  inteira. 

Primeiro,  examinamos  os  métodos  pelos  quais  as  co¬ 
variáveis  significantes  e  variáveis  dependentes  são  identi¬ 
ficadas,  e  então  abordamos  os  métodos  pelos  quais  as  di¬ 
ferenças  entre  grupos  individuais  e  variáveis  dependentes 
podem  ser  medidas. 

Avaliação  de  covariáveis  estatísticas 

Covariáveis  podem  ter  um  importante  papel  ao  se  incluí¬ 
rem  variáveis  métricas  em  um  planejamento  MANOVA  ou 
ANOVA.  No  entanto,  uma  vez  que  covariáveis  atuam  como 
medida  de  controle  sobre  a  variável  estatística  dependen¬ 
te,  elas  devem  ser  avaliadas  antes  que  os  tratamentos  sejam 
examinados.  Tendo  atendido  às  suposições  para  aplicar  co¬ 
variáveis,  o  pesquisador  pode  interpretar  o  efeito  real  das 
covariáveis  sobre  a  variável  estatística  dependente  e  seu  im¬ 
pacto  sobre  os  testes  estatísticos  reais  dos  tratamentos. 

Avaliação  do  impacto  geral 

O  papel  mais  importante  das  covariáveis  é  o  impacto  ge¬ 
ral  nos  testes  estatísticos  para  os  tratamentos.  A  aborda¬ 
gem  mais  direta  para  avaliar  tais  impactos  é  executar  a 
análise  com  e  sem  as  covariáveis.  As  covariáveis  efetivas 


*  N.  de  R.  T.:  A  frase  correta  seria  “sobre  as  variáveis  dependentes”. 
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melhoram  o  poder  estatístico  dos  testes  e  reduzem  a  va¬ 
riância  dentro  dos  grupos.  Se  o  pesquisador  não  perceber 
qualquer  melhora  substancial,  então  as  covariáveis  po¬ 
dem  ser  eliminadas,  pois  elas  reduzem  os  graus  de  liber¬ 
dade  disponíveis  para  os  testes  dos  efeitos  do  tratamento. 
Essa  abordagem  também  pode  identificar  casos  nos  quais 
a  covariável  é  muito  poderosa  e  reduz  a  variância  a  um 
ponto  em  que  os  tratamentos  são  todos  não-significantes. 
Geralmente  isso  ocorre  quando  uma  covariável  incluída 
é  correlacionada  com  uma  das  variáveis  independentes  e, 
assim,  remove  essa  variância,  reduzindo,  portanto,  o  po¬ 
der  explicativo  da  variável  independente. 

Interpretação  das  covariáveis 

Como  ANCOVA  e  MANCOVA  são  aplicações  de  proce¬ 
dimentos  de  regressão  dentro  do  método  de  análise  de  va¬ 
riância,  avaliar  o  impacto  das  covariáveis  sobre  as  variáveis 
dependentes  é  bastante  semelhante  ao  exame  de  equações 
de  regressão.  Se  o  impacto  geral  é  considerado  significante, 
então  cada  covariável  estatística  pode  ser  examinada  quan¬ 
to  a  força  da  relação  preditiva  com  as  medidas  dependen¬ 
tes.  Se  as  covariáveis  representam  efeitos  teóricos,  então 
esses  resultados  fornecem  uma  base  objetiva  para  aceitar 
ou  rejeitar  as  relações  propostas.  De  um  ponto  de  vista  prá¬ 
tico,  o  pesquisador  pode  examinar  o  impacto  das  covariá¬ 
veis  e  eliminar  aquelas  com  pouco  ou  nenhum  efeito. 

Avaliação  dos  efeitos  sobre  a 
variável  estatística  dependente 

Com  os  eventuais  impactos  das  covariáveis  explicadas  na 
análise,  o  próximo  passo  é  examinar  os  impactos  de  cada 
tratamento  (variável  independente)  sobre  as  variáveis  de¬ 
pendentes.  Ao  fazer  isso,  primeiro  discutimos  como  avaliar 
as  diferenças  atribuíveis  a  cada  tratamento.  Com  os  efeitos 
de  tratamento  estabelecidos,  avaliamos  em  seguida  se  eles 
são  independentes  no  caso  de  dois  ou  mais  tratamentos.  Fi¬ 
nalmente,  examinamos  se  os  efeitos  dos  tratamentos  se  es¬ 
tendem  para  o  conjunto  inteiro  de  medidas  dependentes  ou 
se  são  refletidos  apenas  em  um  subconjunto  de  medidas. 

Efeitos  principais  dos  tratamentos 

Já  discutimos  as  medidas  disponíveis  para  avaliar  a  signi- 
ficância  estatística  de  um  tratamento.  Quando  um  efeito 
significante  é  encontrado,  chamamos  o  mesmo  de  efeito 
principal,  o  que  significa  que  diferenças  significantes  entre 
dois  ou  mais  grupos  são  definidas  pelo  tratamento.  Com 
dois  níveis  no  tratamento,  um  efeito  principal  significante 
garante  que  os  dois  grupos  são  significantemente  diferen¬ 
tes.  Com  três  ou  mais  níveis,  porém,  um  efeito  principal 
significante  não  garante  que  todos  os  três  grupos  sejam 
significantemente  distintos,  mas  que  pelo  menos  uma  di¬ 
ferença  significante  está  presente  em  um  par  de  grupos. 
Como  vemos  na  próxima  seção,  muitos  testes  estatísticos 
estão  disponíveis  para  avaliar  quais  grupos  diferem  quanto 
à  variável  estatística  e  quanto  a  cada  variável  dependente. 


Assim,  como  retratamos  um  efeito  principal?  Um  efei¬ 
to  principal  é  tipicamente  descrito  pela  diferença  entre 
grupos  nas  variáveis  dependentes  na  análise.  Considere 
que  sexo  tem  um  efeito  principal  significante  sobre  uma 
escala  de  satisfação  de  10  pontos.  Podemos  então  obser¬ 
var  diferença  em  médias  como  uma  maneira  de  descre¬ 
ver  o  impacto.  Se  o  grupo  de  mulheres  tivesse  um  escore 
médio  de  7,5  e  os  homens  6,0,  poderíamos  dizer  que  a 
diferença  devido  a  sexo  foi  de  1,5.  Logo,  se  todo  o  resto 
for  igual,  espera-se  que  mulheres  marquem  1,5  pontos  a 
mais  do  que  os  homens. 


No  entanto,  definir  um  efeito  principal  nesses  termos 
exige  duas  análises  adicionais: 

1.  Se  a  análise  incluir  mais  de  um  tratamento,  o  pesquisador 
deve  examinar  os  termos  de  interação  para  saber  se  eles  são 
significantes  e,  em  caso  positivo,  se  eles  permitem  uma  in¬ 
terpretação  dos  efeitos  principais. 

2.  Se  um  tratamento  envolve  mais  de  dois  níveis,  então  o  pes¬ 
quisador  deve  executar  uma  série  de  testes  adicionais  nos 
grupos  para  ver  quais  pares  são  significantemente  diferentes. 

Discutimos  a  interpretação  de  termos  de  interação  na 
próxima  seção  e  em  seguida  examinamos  os  tipos  de  tes¬ 
tes  estatísticos  disponíveis  para  avaliação  de  diferenças  de 
grupos  quando  a  análise  envolve  mais  de  dois  grupos. 

Impactos  dos  termos  de  interação 

O  termo  de  interação  representa  o  efeito  conjunto  de 
dois  ou  mais  tratamentos.  Sempre  que  um  planejamento 
de  pesquisa  tiver  dois  ou  mais  tratamentos,  o  pesquisa¬ 
dor  deve  primeiramente  examinar  as  interações  antes  que 
qualquer  declaração  possa  ser  feita  sobre  os  efeitos  prin¬ 
cipais.  Primeiro,  discutimos  como  identificar  interações 
significantes.  Em  seguida,  discutimos  como  classificá-las  a 
fim  de  interpretar  o  impacto  das  mesmas  sobre  os  efeitos 
principais  das  variáveis  de  tratamento. 

Avaliação  de  sígnificância  estatística.  Efeitos  de  inte¬ 
ração  são  avaliados  com  os  mesmos  critérios  dos  efeitos 
principais,  a  saber,  testes  estatísticos  multivariados  e  uni- 
variados  e  poder  estatístico.  Programas  de  computador 
fornecem  um  conjunto  completo  de  resultados  para  cada 
termo  de  interação  além  dos  efeitos  principais.  Todos  os 
critérios  discutidos  anteriormente  se  aplicam  na  avaliação 
de  interações  e  de  efeitos  principais. 

Testes  estatísticos  que  indicam  que  a  interação  é  não- 
significante  denotam  os  efeitos  independentes  dos  trata¬ 
mentos.  Independência  em  planejamentos  fatoriais  signi¬ 
fica  que  o  efeito  de  um  tratamento  (ou  seja,  diferenças  de 
grupos)  é  o  mesmo  para  cada  nível  dos  demais  tratamentos 
e  que  os  efeitos  principais  podem  ser  diretamente  interpre¬ 
tados.  Aqui  podemos  descrever  as  diferenças  entre  grupos 
como  constantes  quando  consideradas  em  combinação  com 
o  segundo  tratamento.  Discutimos  interpretação  do  efeito 
principal  em  um  exemplo  simples  numa  seção  adiante. 
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Se  as  interações  são  consideradas  estatisticamente 
significantes,  é  crucial  que  o  pesquisador  identifique  o 
tipo  de  interação  (ordinal  ou  desordinal),  pois  ela  tem 
impacto  direto  sobre  a  conclusão  que  pode  ser  extraída 
a  partir  dos  resultados.  Como  vemos  na  próxima  seção, 
interações  podem  potencialmente  confundir  qualquer 
descrição  dos  efeitos  principais  dependendo  da  sua  na¬ 
tureza. 

Tipos  de  interações  significantes.  A  significância  estatís¬ 
tica  de  um  termo  de  interação  é  feita  com  os  mesmos  cri¬ 
térios  estatísticos  usados  para  avaliar  o  impacto  de  efeitos 
principais.  Ao  avaliar  a  significância  do  termo  de  intera¬ 
ção,  o  pesquisador  deve  examinar  efeitos  do  tratamento 
(ou  seja,  as  diferenças  entre  grupos)  para  determinar  o 
tipo  de  interação  e  o  impacto  da  mesma  sobre  a  interpre¬ 
tação  do  efeito  principal.  Interações  significantes  podem 
ser  classificadas  em  dois  tipos:  interações  ordinais  e  não- 
ordinais  (ou  desordinais). 

Interações  ordinais.  Quando  os  efeitos  de  um  tra¬ 
tamento  não  são  iguais  em  todos  os  níveis  de  outro  tra¬ 
tamento,  mas  as  diferenças  de  grupos  estão  sempre  na 
mesma  direção,  chamamos  isso  de  interação  ordinal.  Em 
outras  palavras,  as  médias  de  grupos  para  um  nível  são 
sempre  maiores/menores  do  que  outro  nível  do  mesmo 
tratamento,  não  importando  como  elas  são  combinadas 
com  o  outro  tratamento. 


Considere  que  dois  tratamentos  (sexo  e  idade)  são  usa¬ 
dos  para  examinar  satisfação.  Uma  interação  ordinal 
acontece,  por  exemplo,  quando  mulheres  estão  sempre 
mais  satisfeitas  do  que  homens,  mas  a  diferença  entre 
homens  e  mulheres  difere  de  acordo  com  a  faixa  etária 
do  grupo. 


Quando  interações  significantes  são  ordinais,  o  pes¬ 
quisador  deve  interpretar  o  termo  de  interação  para  ga¬ 
rantir  que  seus  resultados  sejam  conceitualmente  acei¬ 
táveis.  Aqui  o  pesquisador  deve  identificar  onde  ocorre 
a  variação  em  diferenças  de  grupos  e  como  a  mesma  se 
relaciona  com  o  modelo  conceituai  inerente  à  análise.  Se 
assim  for,  então  os  efeitos  de  cada  tratamento  devem  ser 
descritos  em  termos  dos  outros  tratamentos  com  os  quais 
interage. 


No  exemplo  anterior,  podemos  fazer  a  afirmação  gerai 
de  que  sexo  afeta  satisfação  no  sentido  de  que  mufheres 
estão  sempre  mais  satisfeitas  do  que  homens.  No  entan¬ 
to,  o  pesquisador  não  pode  estabelecer  a  diferença  em 
termos  simples  como  poderia  ser  feito  com  um  efeito 
principal  simples.  Ao  invés  disso,  as  diferenças  em  sexo 
devem  ser  descritas  para  cada  categoria  etária,  pois  as 
diferenças  homem/mulher  variam  com  a  idade. 


Interações  não-ordinais.  Quando  as  diferenças  en¬ 
tre  níveis  trocam,  dependendo  de  como  elas  são  combina¬ 
das  com  níveis  de  outro  tratamento,  isso  passa  a  se  chamar 
de  interação  desordinal.  Aqui  os  efeitos  de  um  tratamento 
são  positivos  para  alguns  níveis  e  negativos  para  outros  do 
outro  tratamento. 


Em  nosso  exemplo  de  exame  de  satisfação  por  sexo  e 
idade,  acontece  uma  interação  desordinal  quando  mu¬ 
lheres  têm  maior  satisfação  do  que  homens  em  algumas 
categorias  etárias,  mas  homens  são  mais  satisfeitos  em 
outras  categorias  de  idade. 


Se  a  interação  significante  é  considerada  não-ordinal, 
então  os  efeitos  principais  dos  tratamentos  envolvidos  na 
interação  não  podem  ser  interpretados  e  o  estudo  deve  ser 
refeito.  Esta  sugestão  provém  do  fato  de  que,  com  intera¬ 
ções  não-ordinais,  os  efeitos  principais  variam  não  apenas 
nos  níveis  de  tratamento,  mas  também  na  direção  (posi¬ 
tiva  ou  negativa).  Logo,  os  tratamentos  não  representam 
um  efeito  consistente. 

Um  exemplo  de  interpretação  de  interações.  Interações 
representam  as  diferenças  entre  médias  de  grupos  quan¬ 
do  reunidas  por  níveis  de  outra  variável  de  tratamento. 
Mesmo  que  pudéssemos  interpretar  interações  vendo 
uma  tabela  de  valores,  representações  gráficas  são  muito 
efetivas  na  identificação  do  tipo  de  interação  entre  dois 
tratamentos.  Q  resultado  é  um  gráfico  de  múltiplas  linhas, 
com  níveis  de  um  tratamento  representados  sobre  o  eixo 
horizontal.  Cada  linha  representa,  desse  modo,  um  nível 
da  segunda  variável  de  tratamento. 


A  Figura  6-5  retrata  cada  tipo  de  interação  usando  o 
exemplo  de  interações  entre  dois  tratamentos:  formas  e 
cores  de  cereal.  Formas  de  cereal  têm  três  níveis  (bolas, 
cubos  e  estrelas)  e  cores  também  (vermelho,  azul  e  ver¬ 
de).  O  eixo  vertical  representa  as  avaliações  médias  (a 
variável  dependente)  de  cada  grupo  de  respondentes  ao 
longo  das  combinações  de  níveis  de  tratamento.  O  eixo 
X  representa  as  três  categorias  para  cor  (vermelho,  azul 
e  verde).  As  linhas  conectam  as  médias  de  categoria  para 
cada  forma  nas  três  cores.  Por  exemplo,  no  gráfico  supe¬ 
rior  o  valor  para  bolas  vermelhas  é  de  aproximadamente 
4,0,  o  valor  para  bolas  azuis  fica  em  torno  de  5,0,  e  o  valor 
aumenta  um  pouco  para  5,5  no  caso  de  bolas  verdes. 

Como  os  gráficos  identificam  o  tipo  de  interação? 
Como  discutimos  adiante,  cada  uma  das  três  interações 
tem  um  padrão  específico: 

•  Sem  interações.  Mostrado  pelas  retas  paralelas  represen¬ 
tando  as  diferenças  das  várias  formas  ao  longo  dos  níveis 
de  cor  (o  mesmo  efeito  seria  visto  se  as  diferenças  em  cor 
fossem  graficamente  representadas  nos  três  tipos  de  for¬ 
ma).  No  caso  de  ausência  de  interação,  os  efeitos  de  cada 
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tratamento  (as  diferenças  entre  grupos)  são  constantes 
em  cada  nível  e  as  retas  são  mais  ou  menos  paralelas. 

•  Interação  ordinal.  Os  efeitos  de  cada  tratamento  não 
são  constantes,  e  assim  as  retas  não  são  paralelas.  As  di¬ 
ferenças  para  vermelho  são  grandes,  mas  elas  diminuem 
suavemente  para  cereal  azul  e  até  mais  para  cereal  ver¬ 
de.  Logo,  as  diferenças  por  cor  variam  ao  longo  das  for¬ 
mas.  A  ordem  relativa  entre  níveis  de  forma  é  a  mesma, 
porém,  com  estrelas  sempre  acima,  seguidas  por  cubos  e 
então  por  bolas.* 

•  Interação  desordinal.  As  diferenças  em  cor  variam  não 
apenas  em  magnitude  mas  também  em  direção.  Esta  in¬ 
teração  é  exibida  pelas  retas  que  não  são  paralelas  e  que 
cruzam  entre  níveis.  Por  exemplo,  bolas  têm  uma  avalia¬ 
ção  maior  do  que  cubos  e  estrelas  quando  a  cor  é  verme¬ 
lha,  mas  a  avaliação  é  menor  para  as  cores  azul  e  verde.** 


Os  gráficos  complementam  os  testes  de  significância  esta¬ 
tística  permitindo  que  o  pesquisador  classifique  rapidamen¬ 
te  a  interação,  especialmente  determinando  se  interações 
significantes  recaem  nas  categorias  ordinal  ou  desordinal. 

Identificação  de  diferenças 
entre  grnpos  individnais 

Apesar  de  os  testes  univariados  e  multivariados  de  ANO- 
VA  e  MANOVA  nos  permitirem  rejeitar  a  hipótese  nula 
de  que  as  médias  de  grupos  são  todas  iguais,  eles  não 
apontam  com  precisão  onde  estão  as  diferenças  signifi¬ 
cantes  quando  há  mais  de  dois  grupos.  Múltiplos  testes  t 
sem  qualquer  forma  de  ajuste  não  são  apropriados  para 
avaliar  a  significância  de  diferenças  entre  as  médias  de 
pares  de  grupos  porque  a  probabilidade  de  um  erro  Tipo 
I  aumenta  com  o  número  de  comparações  entre  grupos 
realizadas  (semelhante  ao  problema  de  usar  múltiplas 
ANOVAs  univariadas  versus  MANOVA).  Muitos  proce¬ 
dimentos  estão  disponíveis  para  uma  maior  investigação 
de  diferenças  específicas  de  médias  de  grupos  que  sejam 
de  interesse,  usando  diferentes  abordagens  para  controlar 
taxas  de  erro  Tipo  I  ao  longo  de  múltiplos  testes. 

Múltiplos  testes  univariados  ajustando 
a  taxa  de  erro  experimental 

Muitas  vezes  o  método  mais  simples  é  executar  uma  série  de 
testes  univariados  com  alguma  forma  de  ajuste  manual  feito 
pelo  pesquisador  para  explicar  a  taxa  de  erro  experimental. 
Pesquisadores  podem  fazer  tais  ajustes  procurando  saber  se 
os  tratamentos  envolvem  dois  ou  mais  níveis  (grupos). 

Análises  de  dois  grupos.  Tratamentos  de  dois  grupos 
se  reduzem  a  uma  série  de  testes  t  ao  longo  das  medidas 


*  N.  de  R.  T.:  A  frase  correta  seria  “...com  bolas  sempre  acima,  segui¬ 
das  por  cubos  e  então  por  estrelas”. 

**  N.  de  R.  T.:  A  frase  correta  seria  “as  bolas  têm  uma  avaliação  mais  alta  do 
que  os  cubos  e  as  estrelas  para  as  cores  vermelha  e  azul,  mas  a  avaliação  é 
menor  para  a  cor  verde”. 


dependentes  especificadas.  No  entanto,  os  pesquisadores 
devem  estar  cientes  de  que,  quando  o  número  desses  tes¬ 
tes  aumenta,  um  dos  maiores  benefícios  da  abordagem 
multivariada  para  os  testes  de  significância  -  controle  da 
taxa  de  erro  Tipo  I  -  é  negado,  a  menos  que  sejam  reali¬ 
zados  ajustes  específicos  na  estatística  T~  para  controlar  a 
inflação  do  erro  Tipo  I. 

Se  desejamos  testar  as  diferenças  de  grupos  individu¬ 
almente  para  cada  uma  das  variáveis  dependentes,  pode¬ 
mos  usar  a  raiz  quadrada  de  (ou  seja,  como  o  va¬ 
lor  crítico  necessário  para  estabelecer  significância.  Esse 
procedimento  garantiria  que  a  probabilidade  de  qualquer 
erro  Tipo  I  ao  longo  de  todos  os  testes  se  manteria  em  a 
(onde  a  é  especificado  no  cálculo  de  [11]- 

Análises  de  k  grupos.  Poderíamos  fazer  testes  semelhan¬ 
tes  para  situações  com  k  grupos  ajustando  o  nível  a  pela 
desigualdade  de  Bonferroni,  a  qual  estabelece  que  o  nível 
alfa  deve  ser  ajustado  para  o  número  de  testes  em  execu¬ 
ção.  O  nível  alfa  ajustado  usado  em  qualquer  teste  separa¬ 
do  é  definido  como  o  nível  alfa  geral  dividido  pelo  número 
de  testes  [alfa  ajustado  a  =  (a  geral)/(número  de  testes)]. 

Por  exemplo,  se  a  taxa  de  erro  geral  (a)  é  0,05  e 
cinco  testes  estatísticos  devem  ser  feitos,  então  um 
ajuste  Bonferroni  exigiria  um  nível  0,01  para  ser 
utilizado  para  cada  teste  individual. 

Testes  multigrupos  estruturados 

Os  procedimentos  descritos  na  seção  anterior  são  melhor 
usados  em  situações  simples  com  poucos  testes  sendo  con¬ 
siderados.  Se  o  pesquisador  deseja  examinar  sistematica¬ 
mente  diferenças  de  grupos  em  pares  específicos  quanto  a 
uma  ou  mais  medidas  dependentes,  mais  testes  estatísticos 
estruturados  devem  ser  usados.  Nesta  seção  examinamos 
dois  tipos  de  testes: 

•  Testes  post  hoc.  Testes  das  variáveis  dependentes  entre  to¬ 
dos  os  possíveis  pares  de  diferenças  de  grupos  que  são  exa¬ 
minados  depois  que  padrões  de  dados  são  estabelecidos. 

•  Testes  a  priori.  Testes  planejados  a  partir  de  um  ponto  de 
vista  teórico  ou  prático  anterior  ao  exame  dos  dados. 

A  principal  diferença  entre  os  dois  tipos  é  que  a  abor¬ 
dagem  post  hoc  testa  todas  as  possíveis  combinações,  via¬ 
bilizando  uma  maneira  simples  de  comparação  de  grupos 
mas  ao  custo  de  poder  menor.  Testes  a  priori  examinam 
apenas  comparações  especificadas,  de  modo  que  o  pes¬ 
quisador  deve  definir  explicitamente  a  comparação  a  ser 
feita,  mas  com  um  nível  maior  de  poder  como  resulta¬ 
do.  Qualquer  método  pode  ser  empregado  no  exame  de 
uma  ou  mais  diferenças  entre  grupos,  apesar  de  os  testes 
a  priori  também  fornecerem  ao  pesquisador  um  controle 
total  sobre  os  tipos  de  comparações  feitas  entre  grupos. 

Métodos  post  hoc.  Métodos  post  hoc  são  amplamen¬ 
te  usados  por  conta  da  facilidade  com  que  múltiplas 
comparações  são  executadas.  Entre  os  procedimentos 
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(a)  Sem  interação 


Cor 


(b)  Interação  ordinal 


Cor 


Cor 


FIGURA  6-5  Efeitos  de  interação  em  planejamentos  fatoriais. 
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post  hoc  mais  comuns  estão  (1)  o  método  Scheffé,  (2)  o 
método  da  diferença  honestamente  significante  (HSD) 
de  Tukey,  (3)  a  extensão  de  Tukey  para  a  abordagem 
da  mínima  diferença  significante  (LSD)  de  Fisher,  (4)  o 
teste  da  amplitude  múltipla  de  Duncan  e  (5)  o  teste  de 
Newman-Keuls. 

Cada  método  identifica  quais  comparações  entre  gru¬ 
pos  (p.ex.,  grupo  1  versus  grupos  2  e  3)  têm  diferenças 
significantes.  Apesar  de  simplificarem  a  identificação  de 
diferenças  de  grupos,  todos  esses  métodos  compartilham 
o  problema  de  ter  níveis  muito  baixos  de  poder  para  qual¬ 
quer  teste  individual,  pois  eles  examinam  todas  as  possí¬ 
veis  combinações.  Esses  cinco  testes  de  significância  post 
hoc  ou  de  comparação  múltipla  foram  comparados  quan¬ 
to  a  poder  [23],  e  diversas  conclusões  foram  obtidas. 

•  O  método  de  Scheffé  é  o  mais  conservador  em  relação 
ao  erro  Tipo  I,  e  os  demais  testes  são  classificados  nesta 
ordem:  HSD  de  Tukey,  LSD  de  Tukey,  Newman-Keuls  e 
Duncan. 

•  Se  os  tamanhos  de  efeitos  são  grandes  ou  o  número  de  gru¬ 
pos  é  pequeno,  os  métodos  post  hoc  podem  identificar  as 
diferenças  de  grupos.  Mas  o  pesquisador  também  deve  re¬ 
conhecer  as  limitações  desses  métodos  e  empregar  outras 
técnicas  se  for  possível  identificar  comparações  mais  espe¬ 
cíficas. 

Uma  discussão  sobre  as  opções  disponíveis  com  cada 
método  está  além  do  escopo  deste  capítulo.  Excelentes 
discussões  e  explicações  desses  procedimentos  podem  ser 
encontradas  em  outros  textos  [13,  27]. 

Comparações  a  priori  ou  planejadas.  O  pesquisador 
também  pode  fazer  comparações  específicas  entre  grupos 
usando  testes  a  priori  (também  conhecidos  como  compa¬ 
rações  planejadas).  Esse  método  é  semelhante  aos  testes 
post  hoc  nas  técnicas  estatísticas  para  realizar  compara¬ 
ções  de  grupos,  mas  difere  em  planejamento  e  controle 
pelo  pesquisador  em  três  aspectos: 

•  O  pesquisador  especifica  quais  comparações  de  grupos  de¬ 
vem  ser  feitas  versus  o  teste  do  conjunto  inteiro,  como  feito 
nos  testes  post  hoc. 

•  As  comparações  planejadas  são  mais  poderosas  porque  o 
número  de  comparações  é  menor,  mas  o  maior  poder  não  é 
muito  útil  se  o  pesquisador  não  testa  especificamente  com¬ 
parações  corretas  de  grupos. 

•  As  comparações  planejadas  são  mais  apropriadas  quando 
bases  conceituais  podem  apoiar  as  comparações  específicas 
a  serem  feitas.  No  entanto,  não  devem  ser  utilizadas  de  uma 
maneira  exploratória,  pois  elas  não  têm  controles  efetivos 
contra  o  aumento  de  níveis  experimentais  de  erro  Tipo  I. 

O  pesquisador  especifica  os  grupos  a  serem  compara¬ 
dos  por  meio  de  um  contraste,  o  qual  é  uma  combinação 
de  médias  de  grupos  que  representa  uma  comparação 
planejada  específica.  Os  contrastes  geralmente  podem  ser 
dados  como 

C  =  W,G,  +  W,G,  +  ...  +  W,G, 


onde 

C  =  valor  do  contraste 

W  =  pesos 

G  =  médias  de  grupos 

O  contraste  é  formulado  designando-se  pesos  positivos 
e  negativos  para  especificar  os  grupos  a  serem  compara¬ 
dos,  ao  mesmo  tempo  garantindo-se  que  os  pesos  somem 
zero. 


Por  exemplo,  considere  que  tenhamos  três  médias  de 
grupos  (Gj,  Gj  e  G3).  Para  testar  uma  diferença  entre  Gj 
e  Gj  (e  ignorando  Gj  para  esta  comparação),  o  contraste 
seria: 

C  =  (1)G,  +  (-l)G,  +  (0)G3 

Para  testar  se  a  média  de  Gj  e  Gj  difere  de  G3,  o  con¬ 
traste  é: 

C  =  (0,5)Gi  -t  (0,5)G2  -t  (-1)  G3 

Uma  estatística  F  separada  é  computada  para  cada 
contraste. 

Desse  modo,  o  pesquisador  pode  criar  quaisquer  com¬ 
parações  desejadas  e  testá-las  diretamente,  mas  a  proba¬ 
bilidade  de  um  erro  Tipo  I  para  cada  comparação  a  priori 
é  igual  a  a.  Assim,  diversas  comparações  planejadas  au¬ 
mentarão  o  nível  geral  de  erro  Tipo  I.  Todos  os  pacotes 
estatísticos  podem  executar  testes  a  priori  ou  post  hoc 
para  variáveis  dependentes  individuais  ou  para  a  variável 
estatística. 

Se  o  pesquisador  deseja  realizar  comparações  da  va¬ 
riável  estatística  dependente  inteira,  extensões  desses  mé¬ 
todos  estão  disponíveis.  Depois  de  concluir  que  os  vetores 
médios  de  grupos  não  são  equivalentes,  o  pesquisador 
pode  se  interessar  em  saber  se  há  diferenças  de  grupos  na 
variável  estatística  dependente  composta.  Uma  estatística 
F  ANO  VA  padrão  pode  ser  calculada  e  comparada  com 
^crit  =  (-V  -  k)gcx^J{k  -  1),  onde  o  valor  de  gcr^^j, é  obtido 
a  partir  da  distribuição  gcr  com  graus  de  liberdade  apro¬ 
priados.  Muitos  pacotes  computacionais  têm  a  habilidade 
de  realizar  comparações  planejadas  para  a  variável  esta¬ 
tística  dependente,  bem  como  para  variáveis  dependentes 
individuais. 

Avaliação  da  significância  em 
variáveis  dependentes  individnais 

Até  o  presente  momento  examinamos  apenas  os  testes 
multivariados  de  significância  para  o  conjunto  de  variá¬ 
veis  dependentes.  E  quanto  a  cada  uma  delas?  Uma  di¬ 
ferença  significante  com  um  teste  multivariado  garante 
que  cada  variável  dependente  também  é  significativa¬ 
mente  diferente?  Ou  um  efeito  não -significante  signifi¬ 
ca  que  todas  as  variáveis  dependentes  também  têm  dife- 
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renças  não-significantes?  Em  ambos  os  casos,  a  resposta 
é  negativa.  O  resultado  de  um  teste  multivariado  de  di¬ 
ferenças  no  conjunto  de  medidas  dependentes  não  se  es¬ 
tende  necessariamente  para  cada  variável  em  separado, 
mas  apenas  coletivamente.  Logo,  o  pesquisador  sempre 
deve  examinar  como  os  resultados  multivariados  se  es¬ 
tendem  para  medidas  dependentes  individuais. 

Testes  de  sígníficâncía  univariados.  O  primeiro  passo 
é  avaliar  quais  das  variáveis  dependentes  contribuem 
para  as  diferenças  gerais  indicadas  pelos  testes  estatís¬ 
ticos.  Este  passo  é  essencial  porque  um  subconjunto  de 
variáveis  no  conjunto  das  dependentes  pode  acentuar 
as  diferenças,  enquanto  outro  subconjunto  pode  ser 
não-significante  ou  mascarar  os  efeitos  significantes  das 
demais. 

A  maioria  dos  pacotes  estatísticos  fornece  testes  de 
significância  univariados  para  cada  medida  dependente, 
além  dos  testes  multivariados,  fornecendo  uma  avaliação 
individual  de  cada  variável.  O  pesquisador  pode  então  de¬ 
terminar  como  cada  variável  dependente  corresponde  aos 
efeitos  sobre  a  variável  estatística. 

Análise  stepdown.  Um  procedimento  conhecido  como 
análise  stepdown  [16,23]  também  pode  ser  usado  para 
avaliar  individualmente  as  diferenças  das  variáveis  de¬ 
pendentes.  Esse  procedimento  envolve  a  computação  de 
uma  estatística  F  univariada  para  uma  variável  depen¬ 
dente  depois  de  eliminar  os  efeitos  de  outras  variáveis 
dependentes  que  a  precedem  na  análise.  O  procedimen¬ 
to  é  um  pouco  semelhante  à  regressão  stepwise,  mas  aqui 
examinamos  se  uma  variável  dependente  em  particular 
contribui  com  informações  únicas  (não-correlacionadas) 
para  as  diferenças  de  grupos.  Os  resultados  stepdown  se¬ 
riam  exatamente  os  mesmos  se  hzéssemos  uma  análise 
covariada,  com  as  outras  variáveis  dependentes  prece¬ 
dentes  usadas  como  as  covariáveis. 

Uma  suposição  crítica  da  análise  stepdown  é  que  o 
pesquisador  deve  conhecer  a  ordem  na  qual  as  variáveis 
dependentes  devem  ser  introduzidas,  pois  as  interpreta¬ 
ções  podem  variar  dramaticamente  com  diferentes  or¬ 
dens  de  entrada.  Se  a  ordenação  tem  apoio  teórico,  en¬ 
tão  o  teste  stepdown  é  válido.  Variáveis  indicadas  como 
não-signihcantes  são  redundantes  em  relação  às  variáveis 
signihcantes  anteriores,  e  elas  não  acrescentam  informa¬ 
ções  referentes  a  diferenças  entre  grupos.  A  ordem  das 
variáveis  dependentes  pode  ser  mudada  para  testar  se  os 
efeitos  de  variáveis  são  redundantes  ou  particulares,  mas 
o  processo  hca  mais  complicado  quando  o  número  de  va¬ 
riáveis  dependentes  aumenta. 

Essas  duas  análises  são  direcionadas  para  auxiliar  o 
pesquisador  a  compreender  quais  variáveis  dependentes 
contribuem  para  as  diferenças  na  variável  estatística  de¬ 
pendente  ao  longo  do(s)  tratamento(s). 


ESTÁGIO  6:  VALIDAÇÃO 
DOS  RESULTADOS 

Análises  de  técnicas  de  variância  (ANOVA  e  MANOVA) 
foram  desenvolvidas  na  tradição  de  experimentação,  sendo 
a  repetição  o  principal  meio  de  validação.  A  especificidade 
de  tratamentos  experimentais  permite  um  amplo  uso  do 
mesmo  experimento  em  múltiplas  populações  para  avaliar 
a  generalidade  dos  resultados.  Apesar  de  este  ser  um  prin¬ 
cípio  fundamental  do  método  científico,  em  pesquisas  de 
ciências  sociais  e  nos  negócios,  a  verdadeira  experimenta¬ 
ção  muitas  vezes  é  substituída  por  testes  estatísticos  em  si¬ 
tuações  não-experimentais,  como  sondagens.  A  habilidade 
de  validar  os  resultados  nessas  situações  é  baseada  na  repe- 
titividade  dos  tratamentos.  Em  muitos  casos,  características 
demográficas  como  idade,  sexo,  renda  e  outras  são  usadas 
como  tratamentos.  Esses  tratamentos  podem  parecer  aten¬ 
der  à  exigência  de  comparabilidade,  mas  o  pesquisador 
deve  garantir  que  o  elemento  adicional  de  se  designar  alea¬ 
toriamente  a  uma  célula  também  seja  atendido;  no  entanto, 
em  pesquisas,  isso  muitas  vezes  não  acontece. 


Por  exemplo,  ter  idade  e  sexo  como  as  variáveis  inde¬ 
pendentes  é  um  exemplo  comum  do  uso  de  ANOVA 
ou  MANOVA  em  pesquisas.  Em  termos  de  validação, 
o  pesquisador  deve  ser  cuidadoso  ao  analisar  múltiplas 
populações  e  comparar  resultados  como  a  única  prova 
de  validade.  Como  os  respondentes,  em  um  certo  sen¬ 
tido,  selecionam  a  si  mesmos,  os  tratamentos  neste  caso 
não  podem  ser  designados  pelo  pesquisador,  e  assim  a 
designação  aleatória  é  impossível. 


Logo,  o  pesquisador  deve  considerar  seriamente  o  uso 
de  covariáveis  para  controlar  outras  características  que 
possam  ser  específicas  dos  grupos  de  idade  ou  sexo  e  que 
poderiam  afetar  as  variáveis  dependentes,  mas  não  são  in¬ 
cluídas  na  análise. 

Outra  questão  é  a  alegação  de  causa  quando  métodos 
ou  técnicas  experimentais  são  empregados.  Os  princípios 
de  causalidade  são  examinados  em  maiores  detalhes  no 
Capítulo  10.  Para  nossos  propósitos  aqui,  o  pesquisador 
deve  lembrar  que  em  todos  os  ambientes  de  pesquisa,  in¬ 
cluindo  experimentos,  certos  critérios  conceituais  (p.ex., 
ordem  temporal  de  efeitos  e  resultados)  devem  ser  esta¬ 
belecidos  antes  que  a  causalidade  possa  ser  apoiada.  Uma 
única  aplicação  de  uma  técnica  particular  usada  em  um 
experimento  não  garante  causalidade. 


RESUMO 

Discutimos  as  aplicações  apropriadas  e  considerações  im¬ 
portantes  de  MANOVA  ao  abordarmos  as  análises  mui- 
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tivariadas  com  medidas  dependentes  múltiplas.  Apesar 
de  haver  benefícios  consideráveis  em  seu  uso,  MANOVA 
deve  ser  cuidadosa  e  adequadamente  aplicada  à  questão  em 
mãos.  Quando  isso  é  feito,  os  pesquisadores  têm  à  sua  dis¬ 
posição  uma  técnica  com  flexibilidade  e  poder  estatístico. 
Agora  ilustramos  as  aplicações  de  MANOVA  (e  sua  con- 
traparte  univariada  ANOVA)  em  uma  série  de  exemplos. 


ILUSTRAÇÃO  DE  UMA 
ANÁLISE  MANOVA 

Análise  multivariada  de  variância  (MANOVA)  propor¬ 
ciona  aos  pesquisadores  a  habilidade  de  avaliar  diferenças 
em  uma  ou  mais  variáveis  independentes  não-métricas 
para  um  conjunto  de  variáveis  dependentes  métricas. 
Ela  proporciona  uma  maneira  para  determinar  a  exten¬ 
são  em  que  grupos  de  respondentes  (formados  por  suas 
características  nas  variáveis  independentes  não-métricas) 
diferem  em  termos  de  medidas  dependentes.  O  exame  de 
tais  diferenças  pode  ser  feito  separadamente  ou  em  com¬ 
binação.  Nas  seções  a  seguir,  detalhamos  a  análise  neces¬ 
sária  para  examinar  duas  características  (Aj  e  A^)  quanto 
a  seu  impacto  em  um  conjunto  de  resultados  de  compra 
(Ajg,  A2Q  e  A21).  Primeiro,  analisamos  cada  característica 
separadamente,  e  em  seguida  ambas  em  combinação.  O 
leitor  deve  notar  que  uma  versão  expandida  de  HBAT 
(HBAT200  com  uma  amostra  de  200)  é  usada  nesta  aná¬ 
lise  para  viabilizar  o  estudo  de  um  planejamento  de  dois 
fatores.  Este  conjunto  de  dados  está  disponível  na  Web 
em  www.bookman.com.br. 


Nos  últimos  anos  tem  crescido  a  atenção  para  a  área  de 
sistemas  de  distribuição.  Abastecida  pelo  amplo  uso  de 
sistemas  baseados  na  internet  para  integração  de  canais 
e  pelas  economias  de  custo  sendo  percebidas  por  siste¬ 
mas  logísticos  melhorados,  a  administração  da  HBAT 
está  interessada  em  avaliar  o  estado  atual  de  transações 
em  seu  sistema  de  distribuição,  o  qual  utiliza  canais  indi¬ 
retos  (via  corretores)  e  diretos.  No  canal  indireto,  produ¬ 
tos  são  vendidos  para  clientes  por  corretores  que  atuam 
como  equipe  de  venda  externa  e,  em  alguns  casos,  como 
atacadistas.  A  HBAT  também  emprega  uma  equipe  de 
venda  própria;  eles  contatam  e  atendem  clientes  direta¬ 
mente  a  partir  de  escritórios  da  corporação,  bem  como 
escritórios  externos. 

Surgiu  a  preocupação  de  que  mudanças  podem  ser 
necessárias  no  sistema  de  distribuição,  focando-se  par¬ 
ticularmente  o  sistema  de  corretores  que  é  observado 
como  tendo  um  desempenho  insatisfatório,  especial¬ 
mente  no  estímulo  de  relações  de  longo  prazo  com  a 
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-  REGRAS  PRÁTICAS  6-5  - 

Interpretação  e  validação  de  resultados 
de  MANOVA 

•  Quando  covariáveis  estão  envolvidas  em  um  modelo 
GLM: 

•  Analise  o  modelo  com  e  sem  as  covariáveis 

•  Se  as  covariáveis  não  melhoram  o  poder  estatístico 
ou  não  têm  qualquer  impacto  sobre  a  significância 
dos  efeitos  de  tratamento,  então  elas  podem  ser 
dispensadas  na  análise  final 

•  Sempre  que  duas  ou  mais  variáveis  independentes 
(tratamentos)  são  incluídas  na  análise,  interações 
devem  ser  examinadas  antes  de  se  tirarem  conclusões 
sobre  efeitos  principais  para  qualquer  variável 
independente 

•  Se  as  interações  não  são  estatisticamente 
significantes,  então  efeitos  principais  podem 
ser  diretamente  interpretados,  pois  a  diferença 
entre  tratamentos  é  considerada  constante  nas 
combinações  de  níveis 

•  Se  a  interação  é  estatisticamente  significante  e 
as  diferenças  não  são  constantes  ao  longo  das 
combinações  de  níveis,  então  a  interação  deve  ser 
determinada  como  sendo  ordinal  ou  desordinal: 

•  Interações  ordinais  significam  que  a  direção  de 
diferenças  não  varia  por  nível  (p.ex.,  homens 
sempre  menos  que  mulheres),  apesar  de  a 
diferença  entre  homens  e  mulheres  variar 

por  nível  no  outro  tratamento;  neste  caso,  o 
tamanho  do  efeito  principal  (p.ex.,  homens 
versus  mulheres)  deve  ser  descrito  apenas 
separadamente  para  cada  nível  do  outro 
tratamento 

•  Interações  significantes  não-ordinais  acontecem 
quando  a  direção  de  um  efeito  principal 
observado  muda  com  o  nível  de  outro  tratamento 
(p.ex.,  homens  maiores  do  que  mulheres 

para  um  nível  e  menores  que  mulheres  para 
outro);  interações  não-ordinais  interferem  na 
interpretação  de  efeitos  principais 

•  Quando  a  variável  independente  tem  mais  de  dois 
grupos,  dois  tipos  de  procedimentos  podem  ser  usados 
para  isolar  a  fonte  de  diferenças: 

•  Testes  post  hoc  examinam  potenciais  diferenças 
estatísticas  entre  todas  as  possíveis  combinações  de 
médias  de  grupos;  testes  post  hoc  têm  poder  limitado 
e,  por  isso,  são  mais  adequados  para  identificar 
grandes  efeitos 

•  Comparações  planejadas  são  adequadas  quando 
motivos  teóricos  a  priori  sugerem  que  certos  grupos 
diferem  de  um  outro  ou  mesmo  dos  demais;  erro 
Tipo  I  aumenta  quando  o  número  de  comparações 
planejadas  sobe 
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{Conlimmção) 

HBAT.  Para  tratar  dessas  preocupações,  três  questões 
foram  colocadas: 

1.  Quais  diferenças  estão  presentes  em  satisfação  de 
clientela  e  outros  resultados  de  compra  entre  os 
dois  canais  no  sistema  de  distribuição? 

2.  A  HBAT  está  estabelecendo  relações  melhores  com 
seus  clientes  ao  longo  do  tempo,  como  refletida  na  sa¬ 
tisfação  da  clientela  e  outros  resultados  de  compras? 

3.  Qual  é  o  entrosamento  entre  o  sistema  de  distribui¬ 
ção  e  essas  relações  com  clientes  em  termos  de  re¬ 
sultados  de  compras? 


Com  as  questões  de  pesquisa  definidas,  o  pesquisador 
agora  volta  sua  atenção  para  definir  variáveis  dependen¬ 
tes  e  independentes  e  as  correspondentes  exigências  sobre 
tamanho  de  amostra. 


Para  examinar  essas  questões,  pesquisadores  decidiram 
empregar  MANQVA  para  examinar  o  efeito  de  (Sis¬ 
tema  de  distribuição)  e  (Tipo  de  cliente)  sobre  três 
medidas  de  Resultado  de  compra  (X^g,  Satisfação;  JTjq, 
Probabilidade  de  recomendar  HBAT;  e  Ajj,  Probabili¬ 
dade  de  futura  compra).  Apesar  de  uma  amostra  de  100 
observações  ser  suficiente  para  qualquer  das  análises 
sobre  as  variáveis  individuais,  ela  não  seria  apropriada 
para  abordá-las  em  combinação.  Um  cálculo  rápido  de 
tamanhos  de  grupos  para  essa  análise  de  dois  fatores 
(ver  Tabela  6-4)  identificou  pelo  menos  um  grupo  com 
menos  de  10  observações  e  outros  com  menos  de  20. 

Como  tais  tamanhos  de  grupos  não  viabilizam  a  ha¬ 
bilidade  para  detectar  tamanhos  de  efeitos  médios  ou 
pequenos  com  um  nível  desejado  de  poder  estatístico 
(ver  Tabela  6-2*),  uma  decisão  foi  tomada  para  reunir 
respostas  adicionais  para  complementar  as  100  obser¬ 
vações  já  disponíveis.  Um  segundo  esforço  de  pesquisa 
acrescentou  mais  100  observações  para  uma  amostra  que 
agora  tem  200.  Este  novo  conjunto  de  dados  se  chama 
HBAT200  e  será  usado  para  a  análise  MANQVA  que 
segue  adiante.  Análises  preliminares  indicaram  que  o 
conjunto  complementado  de  dados  tinha  as  mesmas  ca¬ 
racterísticas  da  HBAT,  eliminando  assim  a  necessidade 
de  exame  adicional  deste  novo  conjunto  de  dados  para 
determinar  suas  propriedades  básicas. 


discussão  com  um  dos  planejamentos  mais  conhecidos:  o 
planejamento  de  dois  grupos,  no  qual  cada  respondente  é 
classificado  com  base  nos  níveis  (grupos)  do  tratamento 
(variável  independente).  Se  essa  análise  estivesse  sendo 
executada  em  um  ambiente  experimental,  respondentes 
seriam  aleatoriamente  designados  a  grupos  (p.ex.,  depen¬ 
dendo  se  eles  assistem  um  anúncio  ou  qual  tipo  de  cereal 
que  experimentam).  Muitas  vezes,  porém,  os  grupos  são 
formados  não  por  designação  ao  acaso,  mas  com  base  em 
alguma  característica  do  respondente  (p.ex.,  idade,  sexo, 
ocupação  etc.). 

Em  muitos  contextos  de  pesquisa,  no  entanto,  não  é 
realista  assumir  que  uma  diferença  entre  dois  grupos  ex¬ 
perimentais  quaisquer  será  manifestada  em  apenas  uma 
variável  dependente.  Por  exemplo,  dois  anúncios  podem 
não  apenas  produzir  diferentes  níveis  de  intenção  de 
compra,  mas  também  podem  afetar  diversos  outros  (po¬ 
tencialmente  correlacionados)  aspectos  da  resposta  ao 
anúncio  (p.ex.,  avaliação  geral  do  produto,  credibilidade 
do  anúncio,  interesse,  atenção). 

Muitos  pesquisadores  lidam  com  esta  situação  de  múl¬ 
tiplos  critérios  com  repetida  aplicação  de  testes  t  univaria- 
dos  até  que  todas  as  variáveis  dependentes  tenham  sido 
analisadas.  No  entanto,  esta  abordagem  têm  sérios  pro¬ 
blemas: 

•  Inflação  na  taxa  de  erro  Tipo  I  sobre  testes  t  múltiplos 

•  Incapacidade  de  pares  de  testes  t  detectarem  diferenças 
entre  combinações  das  variáveis  dependentes  invisíveis  em 
testes  univariados 

Para  superar  esses  problemas,  MANQVA  pode  ser 
empregada  para  controlar  a  taxa  de  erro  geral  do  Tipo 
I,  ao  mesmo  tempo  que  ainda  fornece  uma  maneira  de 
avaliar  as  diferenças  em  cada  variável  dependente  tanto 
coletiva  quanto  individualmente. 

Estágio  1:  Objetivos  da  análise 

O  primeiro  passo  envolve  a  identificação  das  variáveis 
dependentes  e  independentes  adequadas.  Como  ante¬ 
riormente  discutido,  a  HBAT  identificou  o  sistema  de 
distribuição  como  um  elemento  chave  em  sua  estratégia 
de  relação  com  cliente  e  precisa  primeiramente  com¬ 
preender  o  impacto  do  sistema  de  distribuição  sobre  os 
clientes. 


EXEMPLO  1:  DIEERENÇA  ENTRE 
DOIS  GRUPOS  INDEPENDENTES 

Para  introduzir  os  benefícios  práticos  de  uma  análise 
multivariada  de  diferenças  de  grupos,  começamos  nossa 


Questão  de  pesquisa.  A  HBAT  está  comprometida 
com  o  fortalecimento  de  sua  estratégia  de  relaciona¬ 
mento  com  clientela,  com  um  aspecto  focalizado  sobre  o 
sistema  de  distribuição.  Surge  a  preocupação  com  as  di¬ 
ferenças  devido  a  sistema  de  canais  de  distribuição  (V^), 
que  é  composto  de  dois  canais  (direto  através  da  equipe 
de  venda  da  HBAT,  ou  indireto  via  corretor).  Três  resul¬ 
tados  de  compra  {X^g,  Satisfação;  Ajq,  Probabilidade  de 

(Continua) 


*  N.  de  R.  T.:  A  frase  correta  seria  ver  “Tabela  6-3”. 
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TABELA  6-4  Tamanhos  de  grupos  para  uma  análise  de  dois  fatores  usando  os  dados  da 
HBAT  (100  observações) 


Xg  Sistema  de  distribuição 


Indireto  via  corretor 

Direto  ao  cliente 

Total 

Menos  de  1  ano 

23 

9 

32 

Cliente 

De  1  a  5  anos 

16 

19 

35 

Tipo 

Mais  de  5  anos 

18 

15 

33 

Total 

57 

43 

100 

(Continuação) 

recomendação  da  HBAT;  e  Ajj,  Probabilidade  de  futura 
compra)  foram  identificados  como  as  questões  mais  im¬ 
portantes  na  avaliação  dos  impactos  dos  dois  sistemas  de 
distribuição.  A  tarefa  é  identificar  se  existem  diferenças 
entre  esses  dois  sistemas  ao  longo  de  todos  os  resultados 
de  compra  ou  de  um  subconjunto  destes. 


Exame  de  perfis  de  grupos.  A  Tabela  6-5  fornece  um 
resumo  dos  perfis  de  grupos  sobre  cada  resultado  de 
compra  ao  longo  dos  dois  grupos  (sistema  de  distribui¬ 
ção  direto  versus  indireto).  Uma  inspeção  visual  revela 
que  o  canal  de  distribuição  direta  apresenta  os  maiores 
escores  médios  para  cada  resultado  de  compra.  A  tarefa 
de  MANOVA  é  examinar  essas  diferenças  e  avaliar  a 
extensão  em  que  as  mesmas  são  significantemente  dife¬ 
rentes,  tanto  coletiva  quanto  individualmente. 


Estágio  2:  Projeto  de  pesquisa  em  MANOVA 

A  principal  consideração  no  delineamento  da  MANOVA 
de  dois  grupos  é  o  tamanho  amostrai  em  cada  célula,  o 
que  afeta  diretamente  o  poder  estatístico.  Como  é  o  caso 
na  maioria  das  pesquisas,  os  tamanhos  das  células  são 
desiguais,  tornando  os  testes  estatísticos  mais  sensíveis  a 
violações  das  suposições,  especialmente  o  teste  para  ho¬ 
mogeneidade  de  variância  da  variável  dependente.  Am¬ 
bos  os  problemas  devem  ser  considerados  na  avaliação  do 
planejamento  de  pesquisa  usando  X^. 


Como  anteriormente  discutido,  a  preocupação  com  ta¬ 
manhos  amostrais  adequados  em  toda  a  análise  MANO¬ 
VA  resultou  no  acréscimo  de  100  casos  adicionais  aos 
dados  originais  de  HBAT  (ver  Tabela  6-4).  Com  base 
neste  conjunto  de  dados  maior,  108  firmas  usaram  o  sis¬ 
tema  indireto  de  corretores  e  92  respondentes  utilizaram 
o  sistema  direto  da  HBAT. 

Esses  tamanhos  de  grupos  oferecem  poder  estatístico 
mais  do  que  adequado  a  uma  probabilidade  de  80%  de 
detectar  tamanhos  médios  de  efeitos,  e  quase  alcançam 
os  níveis  necessários  para  identificação  de  pequenos  ta¬ 
manhos  de  efeitos  (ver  Tabela  6-3).  O  resultado  é  um 
planejamento  de  pesquisa  com  tamanhos  de  grupos  re¬ 
lativamente  equilibrados  e  poder  estatístico  suficiente 
para  identificar  diferenças  em  qualquer  nível  significati¬ 
vo  em  termos  gerenciais. 


Estágio  3:  Suposições  em  MANOVA 

As  premissas  mais  críticas  relativas  a  MANOVA  são  a 
independência  de  observações,  homocedasticidade  nos 
grupos,  e  normalidade.  Cada  uma  dessas  suposições  é 
abordada  em  relação  a  cada  um  dos  resultados  de  com¬ 
pra.  Preocupa  também  a  presença  de  observações  atípicas 
e  sua  potencial  influência  sobre  as  médias  de  grupos  para 
as  variáveis  de  resultado  de  compra. 


*  N.  de  R.  T.:  A  frase  correta  seria  “ver  Tabela  6-5’’. 


TABELA  6-5  Estatísticas  descritivas  de  medidas  de  resultado  de  compra  (X,9,  X^o  e  Xj,)  para  grupos  de  X^  (Sistema  de  distribuição) 


X5  Sistema  de  distribuição 

Média 

Desvio  padrão 

N 

X,9  Satisfação 

Indireto  via  corretor 

6,325 

1,033 

108 

Direto  ao  cliente 

7,688 

1,049 

92 

Total 

6,952 

1,241 

200 

X20  Probabilidade  de  recomendar 

Indireto  via  corretor 

6,488 

0,986 

108 

Direto  ao  cliente 

7,498 

0,930 

92 

Total 

6,953 

1,083 

200 

X2,  Probabilidade  de  compra 

Indireto  via  corretor 

7,336 

0,880 

108 

Direto  ao  cliente 

8,051 

0,745 

92 

Total 

7,665 

0,893 

200 
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Independência  de  observações.  A  independência  dos 
respondentes  foi  garantida  tanto  quanto  possível  pelo 
plano  de  amostragem  aleatória.  Se  o  estudo  tivesse  sido 
feito  em  um  ambiente  experimental,  a  designação  ao 
acaso  de  indivíduos  teria  garantido  a  necessária  inde¬ 
pendência  de  observações. 

Homocedasticidade.  Uma  segunda  suposição  crítica  se 
refere  à  homogeneidade  das  matrizes  de  variância-cova- 
riância  entre  os  dois  grupos.  A  primeira  análise  avalia  a 
homogeneidade  univariada  de  variância  nos  dois  grupos. 
Como  se  vê  na  Tabela  6-6,  testes  univariados  (teste  de 
Levene)  para  todas  as  três  variáveis  são  não-significantes 
(ou  seja,  significância  maior  que  0,05).  O  próximo  passo  é 
avaliar  coletivamente  as  variáveis  dependentes  testando 
a  igualdade  das  matrizes  de  variância-covariância  entre 
os  grupos.  Novamente,  na  Tabela  6-6,  o  teste  M  de  Box 
para  igualdade  das  matrizes  de  covariância  mostra  um 
valor  não-significante  (0,607),  indicando  nenhuma  dife¬ 
rença  signiíicante  entre  os  dois  grupos  nas  três  variáveis 
dependentes  como  um  todo.  Assim,  a  suposição  de  ho¬ 
mocedasticidade  é  atendida  para  cada  variável  individual 
separadamente  e  para  as  três  coletivamente. 

Correlação  e  normalidade  de  variáveis  dependen¬ 
tes.  Outro  teste  deve  ser  feito  para  determinar  se  as 
medidas  dependentes  são  significativamente  correlacio¬ 
nadas.  O  teste  mais  empregado  para  esta  finalidade  é  o 
teste  de  esfericidade  de  Bartlett.  Ele  examina  as  corre¬ 
lações  entre  todas  as  variáveis  dependentes  e  avalia  se, 


coletivamente,  existe  inter-correlação  significante.  Em 
nosso  exemplo,  há  um  grau  significante  de  inter-correla¬ 
ção  (significância  =  0,000)  (ver  Tabela  6-6). 

A  suposição  de  normalidade  para  as  variáveis  de¬ 
pendentes  {X^g,  Ajq  e  X21)  foi  examinada  no  Capítulo  2 
e  tida  como  aceitável.  Isso  apóia  os  resultados  de  teste 
de  igualdade  das  matrizes  de  variância-covariância  entre 
grupos. 

Observações  atípicas.  A  última  questão  a  ser  levantada 
é  a  presença  de  observações  atípicas.  Um  método  simples 
que  identifica  pontos  extremos  para  cada  grupo  é  o  uso  de 
gráficos  de  caixas  (ver  Figura  6-6).  Examinando-se  o  grá¬ 
fico  de  caixas  para  cada  medida  dependente,  percebem-se 
poucos,  se  existirem,  pontos  extremos  nos  grupos.  Nenhum 
ponto  extremo  para  X^g,  um  para  Ajq  (observação  38*)  e 
quatro  para  (observações  22, 38, 74  e  187).  Quando  es¬ 
tudamos  tais  pontos  extremos  nas  três  medidas  dependen¬ 
tes,  nenhuma  observação  foi  um  valor  extremo  sobre  todas 
as  três  medidas,  e  nenhuma  observação  tem  valor  tão  ex¬ 
tremado  a  ponto  de  justificar  exclusão.  Logo,  todas  as  200 
observações  serão  mantidas  para  análise  posterior. 


Estágio  4:  Estimação  do  modelo 
MANOVA  e  avaliação  do  ajuste  geral 

O  próximo  passo  é  avaliar  se  os  dois  grupos  exibem  di¬ 
ferenças  estatisticamente  significantes  para  as  três  variá- 

*  N.  de  R.  T.:  A  frase  correta  seria  “...  uma  para  X  20  (observação  86) 
e  dois  para  Xjj  (observações  86  e  187). 


TABELA  6-6  Medidas  multivariadas  e  univariadas  para  teste  de  homocedasticidade  de 

Teste  multivariado  de  homocedasticidade 

Teste  de  igualdade  de  matrizes  de  covariância  de  Box 

M  de  Box  4,597 

F  0,753 

dfí  6 

df2  265275,824 

Sig. 0,607 

Testes  univariados  de  homocedasticidade 


Teste  de  igualdade  de  variâncias  de  erro  de  Levene 


Variávei  dependente 

F 

dfí 

df2 

Sig. 

X,g  Satisfação 

0,001 

1 

198 

0,978 

X20  Probabiiidade  de  recomendar 

0,643 

1 

198 

0,424 

Xj,  Probabiiidade  de  compra 

2,832 

1 

198 

0,094 

Teste  para  correiação  entre  as  variáveis  dependentes 


Teste  de  esfericidade  de  Bartlett 

Razão  de  probabiiidade 

0,000 

Qui-quadrado  aproximado 

260,055 

df 

5 

Sig. 

0,000 
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X  Satisfação 


11 

10 

9 

8 

7 

6 

5 

4 

3 


N=  108  92 

Indireto  via  corretor  Direto  com  o  cliente 

Xj  Sistema  de  distribuição 


X,„  Probabiiidade  de  recomendar 


11 

10 

9 

8 

7 

6 

5 

4 

3 


N=  108  92 

Indireto  via  corretor  Direto  com  o  cliente 

Xj  Sistema  de  distribuição 


Xj,  Probabiiidade  de  compra 


N=  108  92 

Indireto  via  corretor  Direto  com  o  cliente 

Xj  Sistema  de  distribuição 


FiGURA  6-6  Gráficos  de  caixas  de  medidas  de  resultados  de  compra  (X,9,  e  Xj,)  para  grupos  de  X^  (Sistema  de  distribuição). 

veis  de  resultado  de  compra,  primeiro  coletivamente  e  100  podemos  concluir  que  o  tipo  de  canal  de  distribuição 
em  seguida  individualmente.  Para  conduzir  o  teste,  antes  tem  um  impacto  sobre  as  variáveis  de  resultado  de  com- 
de  mais  nada  especificamos  a  taxa  máxima  de  erro  Tipo  I  pra  quando  de  fato  não  tem. 
permitida.  Fazendo  isso,  aceitamos  que  5  vezes  em  cada 
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Teste  estatístico  multivariado  e  análise  de  poder 

Uma  vez  estabelecida  a  taxa  aceitável  de  erro  Tipo  I,  pri¬ 
meiramente  usamos  os  testes  multivariados  para  avaliar 
o  conjunto  de  variáveis  dependentes  quanto  a  diferenças 
entre  os  dois  grupos,  e  então  promovemos  testes  univaria- 
dos  sobre  cada  resultado  de  compra.  Por  fim,  os  níveis  de 
poder  são  avaliados. 


Testes  estatísticos  multivariados.  A  Tabela  6-7  contém 
os  quatro  testes  multivariados  mais  comumente  usados 
(critério  de  Pillai,  lambda  de  Wilks,  traço  de  Hotelling 
e  maior  raiz  de  Roy).  Cada  uma  das  quatro  medidas  in¬ 
dica  que  o  conjunto  de  resultados  de  compra  tem  uma 
elevada  diferença  significante  (0,000)  entre  os  dois  tipos 
de  canal  de  distribuição.  Isso  confirma  as  diferenças  de 
grupos  percebidas  na  Tabela  6-5  e  o  gráfico  de  caixas  da 
Figura  6-6. 

Testes  estatísticos  univariados.  Apesar  de  podermos 
mostrar  que  o  conjunto  de  resultados  de  compra  difere 
nos  grupos,  precisamos  também  examinar  cada  resulta¬ 
do  de  compra  individualmente  em  busca  de  diferenças 
nos  dois  tipos  de  canal  de  distribuição.  A  Tabela  6-7  con¬ 
tém  também  os  testes  univariados  para  cada  resultado  de 
compra.  Como  podemos  ver,  todos  os  testes  individuais 
apresentam  igualmente  elevada  significância  (0,000),  o 
que  indica  que  cada  variável  também  segue  o  mesmo  pa¬ 
drão  de  maiores  resultados  de  compra  daqueles  servidos 
pelo  sistema  de  distribuição  direta. 

Poder  estatístico.  O  poder  para  os  testes  estatísticos  foi 
1,0,  o  que  indica  que  os  tamanhos  amostrais  e  o  tama¬ 
nho  de  efeito  foram  suficientes  para  garantir  que  as  dife¬ 


renças  significantes  seriam  detectadas  se  eles  existissem 
além  das  diferenças  devido  a  erro  amostrai. 


Estágio  5:  Interpretação  dos  resultados 

A  presença  de  apenas  dois  grupos  elimina  a  necessidade 
de  qualquer  tipo  de  teste  post  hoc.  A  significância  estatís¬ 
tica  dos  testes  multivariados  e  univariados  indicando  dife¬ 
renças  de  grupos  na  variável  estatística  dependente  (vetor 
de  médias)  e  nos  resultados  individuais  de  compras  con¬ 
duz  o  pesquisador  a  um  exame  dos  resultados  para  avaliar 
sua  consistência  lógica. 


Como  anteriormente  notado,  firmas  usando  o  tipo  dire¬ 
to  de  distribuição  marcaram  uma  pontuação  considera¬ 
velmente  maior  do  que  aquelas  atendidas  por  meio  do 
canal  de  distribuição  indireta  baseado  em  corretores. 
As  médias  de  grupos  mostradas  na  Tabela  6-5,  basea¬ 
das  em  respostas  a  uma  escala  de  10  pontos,  indicam 
que  os  clientes  usando  o  canal  de  distribuição  direta 
estão  mais  satisfeitos  (-h1,36),  com  maior  disposição 
de  recomendar  a  HBAT  (-h1,01)  e  de  comprar  no  fu¬ 
turo  (-h0,72).  Tais  diferenças  são  refletidas  também  nos 
gráficos  de  caixas  para  os  três  resultados  de  compra  na 
Figura  6-6. 


Esses  resultados  confirmam  que  o  tipo  de  canal  de  dis¬ 
tribuição  afeta  as  percepções  de  clientes  em  termos  dos 
três  resultados  de  compra.  Tais  diferenças  estatisticamen¬ 
te  significantes,  que  são  de  magnitude  suficiente  para  tam¬ 
bém  denotar  significância  gerencial,  mostram  que  o  canal 
de  distribuição  direta  é  mais  efetivo  na  criação  de  percep- 


TABELA  6-7  Testes  multivariados  e  univariados  para  diferenças  de  grupos  em  medidas  de  resultado  de  compra  (X,g,  Xjg  e  Xg,)  em 
grupos  de  Xg  (Sistema  de  distribuição) 

Testes  multivariados 


Hipóteses 


Teste  estatístico 

Valor 

F 

df 

dfde  erro 

Sig. 

2 

Poder  observado" 

Critério  de  Pillai 

0,307 

28,923 

3 

196 

0,000 

0,307 

1,00 

Lambda  de  Wilks 

0,693 

28,923 

3 

196 

0,000 

0,307 

1,00 

Traço  de  Hotelling 

0,443 

28,923 

3 

196 

0,000 

0,307 

1,00 

Maior  raiz  de  Roy 

0,443 

28,923 

3 

196 

0,000 

0,307 

1,00 

“Computado  usando  alfa  =  0,05 

Testes  univariados  (efeitos  entre  sujeitos) 

Soma  de 

Quadrado 

Variável  dependente 

quadrados 

df 

médio 

F 

Sig. 

2 

r\ 

Poder  observado" 

X,g  Satisfação 

92,300'’ 

1 

92,300 

85,304 

0,000 

0,301 

1,00 

Xgg  Probabilidade  de  recomendar 

50,665“ 

1 

50,665 

54,910 

0,000 

0,217 

1,00 

Xg,  Probabilidade  de  compra 

25,396“ 

1 

25,396 

37,700 

0,000 

0,160 

1,00 

“Computado  usando  alfa  =  0,05 
“tf  =  0,301  ajustado  =  0,298) 
‘Ff  =  0,217  (R''  ajustado  =  0,213) 
“Ff  =  0,160  (R""  ajustado  =  0,156) 
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ções  positivas  por  parte  da  clientela  em  uma  grande  gama 
de  resultados  de  compras. 


EXEMPLO  2:  DIEERENÇA  ENTRE 
K  GRUPOS  INDEPENDENTES 

O  planejamento  de  dois  grupos  (exemplo  1)  é  um  caso 
especial  do  delineamento  mais  geral  de  k  grupos.  No  caso 
mais  abrangente,  cada  respondente  é  um  membro  ou  é 
aleatoriamente  designado  a  um  dos  k  níveis  (grupos)  do 
tratamento  (variável  independente).  Em  um  caso  univa- 
riado,  uma  única  variável  dependente  métrica  é  medida,  e 
a  hipótese  nula  é  que  todas  as  médias  de  grupos  são  iguais 
(i.e.,  pj  =  P2  =  bs  =•  •  •  =  M/fc)-  No  caso  multivariado,  múl¬ 
tiplas  variáveis  dependentes  métricas  são  medidas,  e  a  hi¬ 
pótese  nula  é  a  de  que  todos  os  vetores  de  escores  médios 
de  grupo  são  iguais  (i.e.,  Vj  =  Vj  =  ^3  =•  •  •  ^t);  onde  v  se 
refere  a  um  vetor  ou  conjunto  de  escores  médios. 

Em  planejamentos  de  k  grupos  nos  quais  múltiplas  va¬ 
riáveis  dependentes  são  medidas,  muitos  pesquisadores 
prosseguem  com  uma  série  de  testes  F  individuais  (ANO- 
VAs)  até  que  todas  as  variáveis  dependentes  tenham  sido 
analisadas.  Como  o  leitor  deve  suspeitar,  esta  abordagem 
sofre  das  mesmas  deficiências  de  uma  série  de  testes  t  ao 
longo  de  múltiplas  variáveis  dependentes;  ou  seja,  uma  sé¬ 
rie  de  testes  Ecom  ANOVA: 

•  Resulta  em  uma  taxa  inflacionada  de  erro  Tipo  I 

•  Ignora  a  possibilidade  de  que  alguma  composição  das  variá¬ 
veis  dependentes  possa  fornecer  alguma  evidência  confiável 
de  diferenças  gerais  de  grupos 

Além  disso,  como  testes  F  individuais  ignoram  corre¬ 
lações  entre  as  variáveis  independentes,  eles  usam  menos 
do  que  o  total  de  informação  disponível  para  a  avaliação 
de  diferenças  gerais  de  grupos. 

MANO  VA  novamente  fornece  uma  solução  para  esses 
problemas.  MANOVA  resolve  o  problema  da  taxa  de  erro 
do  Tipo  I  oferecendo  um  único  teste  geral  de  diferenças  de 
grupos  em  um  nível  a  especificado.  Ela  resolve  o  proble¬ 
ma  da  variável  composta  via  formação  implícita  e  teste  das 
combinações  lineares  das  variáveis  dependentes  que  forne¬ 
cem  a  mais  forte  evidência  de  diferenças  gerais  de  grupos. 

Estágio  1:  Objetivos  de  MANOVA 

No  exemplo  anterior,  a  HBAT  avaliou  seu  desempenho 
entre  clientes  com  base  nos  dois  canais  de  sistema  de  dis¬ 
tribuição  (V5)  empregados.  MANOVA  foi  utilizada  devi¬ 
do  à  vontade  de  examinar  um  conjunto  de  três  variáveis 
de  resultado  de  compra  representando  o  desempenho  da 
HBAT.  Um  segundo  objetivo  de  pesquisa  foi  determinar 
se  as  três  variáveis  de  resultado  de  compra  foram  afetadas 
pela  extensão  de  sua  relação  com  a  HBAT  (AJ.  A  hipóte¬ 
se  nula  que  a  HBAT  deseja  agora  testar  é  a  de  que  os  três 
vetores  amostrais  de  escores  médios  (um  vetor  para  cada 
categoria  de  relação  com  cliente)  são  equivalentes. 


Questões  de  pesquisa.  Além  de  examinar  o  papel  do 
sistema  de  distribuição,  a  HBAT  também  manifestou 
um  desejo  de  avaliar  se  as  diferenças  nos  resultados  de 
compra  são  atribuíveis  apenas  ao  tipo  de  canal  de  dis¬ 
tribuição  ou  se  outros  fatores  não-métricos  podem  ser 
identificados  como  mostrando  diferenças  significantes 
também.  A  HBAT  especificamente  selecionou  (Tipo 
de  cliente)  para  determinar  se  a  extensão  da  relação  da 
HBAT  com  o  cliente  tem  algum  impacto  sobre  esses  re¬ 
sultados  de  compra. 

Exame  de  perfis  de  grupos.  Como  pode  ser  percebido 
na  Tabela  6-8,  os  escores  médios  de  todas  as  três  variá¬ 
veis  de  resultado  de  compra  aumentam  quando  a  exten¬ 
são  da  relação  com  a  clientela  cresce.  A  questão  a  ser 
tratada  nesta  análise  é  a  magnitude  em  que  essas  dife¬ 
renças  como  um  todo  podem  ser  consideradas  estatis¬ 
ticamente  significantes  e  se  tais  diferenças  se  estendem 
a  cada  diferença  entre  grupos.  Em  uma  segunda  análise 
MANOVA,  Aj  (Tipo  de  cliente)  é  examinada  quanto  a 
diferenças  em  resultados  de  compra. 


Estágio  2:  Projeto  de  pesquisa  em  MANOVA 

Como  foi  a  situação  na  análise  anterior  de  dois  grupos,  ta¬ 
manho  amostrai  do  grupo  é  uma  consideração  prioritária 
em  planejamento  de  pesquisa.  Mesmo  quando  todos  os 
casos  de  tamanhos  de  grupos  excedem  de  longe  o  mínimo 
necessário,  o  pesquisador  sempre  deve  estar  comprometi¬ 
do  em  atingir  o  poder  estatístico  exigido  para  a  questão  de 
pesquisa  em  mãos. 


A  análise  do  impacto  de  agora  demanda  que  anali¬ 
semos  os  tamanhos  amostrais  para  os  três  grupos  de  ex¬ 
tensão  de  relação  com  clientela  (menos  de  1  ano,  de  1 
a  5  anos,  e  mais  de  5  anos).  Na  amostra  HBAT,  os  200 
respondentes  são  quase  igualmente  divididos  nos  três 
grupos  com  amostras  de  68,  64  e  68  (ver  Tabela  6-8).  Os 
tamanhos  amostrais  ainda  fornecem  poder  estatístico  su¬ 
ficiente  para  identificar  tamanhos  de  efeitos  médios  ou 
grandes  (olhar  Tabela  6-3),  enquanto  ainda  estão  aquém 
dos  tamanhos  necessários  para  identificação  de  pequenos 
tamanhos  de  efeitos  com  um  poder  de  0,80.  Assim,  quais¬ 
quer  resultados  não-significantes  devem  ser  examinados 
de  perto  para  se  avaliar  se  o  tamanho  de  efeito  tem  signi- 
ficância  gerencial,  pois  o  baixo  poder  estatístico  impede 
de  designá-los  como  estatisticamente  significantes. 


Estágio  3:  Suposições  em  MANOVA 

Uma  vez  que  já  foram  examinadas  as  questões  de  nor¬ 
malidade  (ver  Capítulo  2)  e  de  inter-correlação  (teste 
de  esfericidade  de  Bartlett  na  Tabela  6-6)  das  variáveis 
dependentes  no  exemplo  anterior,  a  única  preocupação 
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TABELA  6-8  Estatísticas  descritivas  de  medidas  de  resuitado  de  compra  (X,g,  e  Xg,)  para  grupos  de  X,  (Tipo  de  ciiente) 


X,  Tipo  de  cliente 

Média 

Desvio  padrão 

N 

X|9  Satisfação 

Menos  de  1  ano 

5,729 

0,764 

68 

De  1  a  5  anos 

7,294 

0,708 

64 

Mais  de  5  anos 

7,853 

1,033 

68 

Total 

6,952 

1,241 

200 

Xgo  Probabilidade  de  recomendar 

Menos  de  1  ano 

6,141 

0,995 

68 

De  1  a  5  anos 

7,209 

0,714 

64 

Mais  de  5  anos 

7,522 

0,976 

68 

Total 

6,953 

1,083 

200 

Xg,  Probabilidade  de  comprar 

Menos  de  1  ano 

6,962 

0,760 

68 

De  1  a  5  anos 

7,883 

0,643 

64 

Mais  de  5  anos 

8,163 

0,777 

68 

Total 

7,665 

0,893 

200 

remanescente  repousa  na  homocedasticidade  dos  resul¬ 
tados  de  compra  nos  grupos  formados  por  Xj  e  na  iden¬ 
tificação  de  observações  atípicas.  Primeiro,  examinamos 
essa  homocedasticidade  no  nível  multivariado  (todas  as 
três  variáveis  de  resultado  de  compra  coletivamente),  e 
em  seguida  para  cada  variável  dependente  em  separado. 
O  teste  multivariado  para  homogeneidade  de  variância 
dos  três  resultados  de  compra  é  realizado  com  o  teste  M 
de  Box,  enquanto  o  teste  de  Levene  é  empregado  para 
avaliar  cada  variável  de  resultado  de  compra  individual¬ 
mente. 


Homocedasticidade.  A  Tabela  6-9  contém  os  resul¬ 
tados  dos  testes  multivariado  e  univariado  de  homoce¬ 
dasticidade.  O  teste  M  de  Box  indica  ausência  de  hete- 
roscedasticidade  (significância  =  0,069).  Nos  testes  de 
Levene  para  igualdade  de  variâncias  de  erro,  dois  dos 
resultados  de  compra  (Xjq  e  Xjj)  mostraram  resultados 
não-significantes  e  confirmaram  homocedasticidade. 
No  caso  de  X^g,  o  nível  de  significância  foi  de  0,001, 
indicando  a  possível  existência  de  heteroscedasticida- 
de  para  esta  variável.  No  entanto,  dados  os  tamanhos 
amostrais  relativamente  grandes  em  cada  grupo  e  a 
presença  de  homocedasticidade  para  os  outros  dois  re¬ 
sultados  de  compra,  ações  corretivas  não  foram  neces¬ 
sárias  para  X^g. 

Observações  atípicas.  O  exame  do  gráfico  de  caixas 
para  cada  variável  de  resultado  de  compra  (ver  Figura 
6-7)  revela  um  pequeno  número  de  pontos  extremos 
para  cada  medida  dependente  (observação  184*  para 
Xj^g,  observações  38*,  104,  119  e  149  para  X^g,  e  obser¬ 
vações  104  e  187  para  Xjj).  Como  foi  o  caso  do  exemplo 
anterior  envolvendo  X^,  nenhuma  observação  demons¬ 
trou  valores  extremos  em  todas  as  três  medidas  depen- 


*  N.  de  R.  T.:  A  frase  correta  seria  “(observação  104  para  Xj,;  obser¬ 
vações  86, 104, 118  e  149  para  Xjg; ...)”. 


dentes,  e  também  não  houve  valores  tão  extremos  em 
qualquer  dos  casos  a  ponto  de  visivelmente  afetar  os 
valores  de  grupo.  Assim,  nenhuma  observação  foi  classi¬ 
ficada  como  atípica  designada  para  exclusão,  e  todas  as 
200  observações  foram  empregadas  na  análise. 


Estágio  4:  Estimação  do  modelo 
MANO  VA  e  avaliação  do  ajuste  geral 

O  uso  de  MANOVA  para  examinar  uma  variável  inde¬ 
pendente  com  três  ou  mais  níveis  revela  as  diferenças 
ao  longo  dos  níveis  para  as  medidas  dependentes  com 
os  testes  estatísticos  multivariados  e  univariados  ilus¬ 
trados  no  exemplo  anterior.  Em  tais  situações,  os  testes 
estatísticos  estão  avaliando  a  significância  de  um  efeito 
principal,  o  que  significa  que  as  diferenças  entre  grupos, 
quando  vistas  coletivamente,  são  substanciais  o  bastan¬ 
te  para  serem  consideradas  estatisticamente  significan- 
tes.  Deve  ser  observado  que  significância  estatística  do 
efeito  principal  não  garante  que  cada  grupo  também  seja 
significantemente  distinto  de  cada  um  dos  demais  gru¬ 
pos.  Em  vez  disso,  testes  separados  descritos  na  próxima 
seção  podem  examinar  quais  grupos  exibem  diferenças 
significantes. 


Todas  as  três  medidas  dependentes  mostram  um  padrão 
definido  de  aumento  quando  a  extensão  da  relação  com 
clientela  cresce  (ver  Tabela  6-8  e  Figura  6-7).  O  primei¬ 
ro  passo  é  utilizar  os  teste  multivariados  e  avaliar  se  o 
conjunto  de  resultados  de  compra,  no  qual  cada  um  de 
seus  elementos  parece  seguir  um  padrão  semelhante  de 
aumento  ã  medida  que  o  tempo  avança,  varia  de  uma 
maneira  estatisticamente  significante  (isto  é,  um  efeito 
principal  significante).  A  Tabela  6-10  contém  os  quatro 
testes  multivariados  mais  comumente  usados,  e,  como 
vemos,  todos  os  quatro  testes  indicam  uma  diferença  es- 

{Continua) 


342 


Análise  Multivariada  de  Dados 


TABELA  6-9  Medidas  multivariadas  e  univariadas  para  testar  homocedasticidade  de  X, 

Teste  multivariado  de  homocedasticidade 

Teste  de  Box  para  igualdade  de  matrizes  de  covariãncia 

M  de  Box 
F 
dfí 
df2 
Sig. 

Testes  univariados  de  homocedasticidade 


Teste  de  Levene  para  igualdade  de  variâncias  de  erro 


Variável  dependente 

F 

dfí 

df2 

Sig. 

X,g  Satisfação 

6,871 

2 

197 

0,001 

Xjo  Probabilidade  de  recomendar 

2,951 

2 

197 

0,055 

Xj,  Probabilidade  de  compra 

0,800 

2 

197 

0,451 

20,363 

1,659 

12 

186673,631 

0,069 


(Continuação) 

tatisticamente  significante  do  conjunto  coletivo  de  medi¬ 
das  dependentes  nos  três  grupos. 

Além  dos  multivariados,  testes  univariados  para 
cada  medida  dependente  apontam  que  todas  as  três 
medidas  dependentes,  quando  consideradas  individu¬ 
almente,  também  apresentam  efeitos  principais  signi- 
ficantes.  Logo,  tanto  coletiva  quanto  individualmente, 
os  três  resultados  de  compra  {X^g,  Ajq  e  Xjj)  variam  em 
um  nível  estatisticamente  significante  ao  longo  dos  três 
grupos  de  X^. 


Estágio  5:  Interpretação  dos  resultados 

A  interpretação  de  uma  análise  MANOVA  com  uma  va¬ 
riável  independente  de  três  ou  mais  níveis  exige  um  pro¬ 
cesso  de  dois  passos: 

•  Exame  do  efeito  principal  da  variável  independente  (nes¬ 
te  caso,  Xj)  sobre  as  três  medidas  dependentes 

•  Identificação  das  diferenças  entre  grupos  individuais  para 
cada  uma  das  medidas  dependentes  com  comparações 
planejadas  ou  testes  post  hoc 

A  primeira  análise  examina  as  diferenças  gerais  nos 
níveis  para  as  medidas  dependentes,  enquanto  a  segun- 


TABELA  6-10  Testes  multivariados  e  univariados  para  diferenças  de  grupos  em  medidas  de  resultado  de  compra  (X,ç 
grupos  de  X,  (Tipo  de  cliente) 

„  Xgg  e  Xg,)  COS 

Testes  multivariados 

Teste  estatístico 

Valor 

F 

df  de  hipótese 

dfde  erro 

Sig. 

2 

■n 

Poder  observado“ 

Critério  de  Piliai 

0,543 

24,368 

6 

392 

0,000 

0,272 

1,000 

Lambda  de  Wilks 

0,457 

31,103 

6 

390 

0,000 

0,324 

1,000 

Traço  de  Hoteiling 

1,184 

38,292 

6 

388 

0,000 

0,372 

1,000 

Maior  raiz  de  Roy 

1,183 

77,280 

3 

196 

0,000 

0,542 

1,000 

“Computado  usando  alfa  =  0,05 

Testes  univariados  (efeitos  entre  sujeitos) 

Soma  de 

quadrados 

Quadrado 

Variável  dependente 

Tipo  III 

df 

médio 

F 

Sig. 

'n 

Poder  observado® 

X,g  Satisfação 

164,311'’ 

2 

82,156 

113,794 

0,000 

0,536 

1,00 

Xgg  Probabilidade  de  recomendar 

71 ,043“ 

2 

35,521 

43,112 

0,000 

0,304 

1,00 

Xg,  Probabilidade  de  compra 

53,545“ 

2 

26,773 

50,121 

0,000 

0,337 

1,00 

‘Computado  usando  alfa  =  0,05 
“Ff  =  0,536  (Ff  ajustado  =  0,531) 
‘Ff  =  0,304  (Ff  ajustado  =  0,297) 
“Ff  =  0,337  (Ff  ajustado  =  0,331) 
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Satisfação 


N=  68  64  68 

Menos  de  1  ano  De  1  a  5  anos  Mais  de  5  anos 

X,  Tipo  de  ciiente 


Xjg  Probabiiidade  de  recomendar 


N=  68  64  68 

Menos  de  1  ano  De  1  a  5  anos  Mais  de  5  anos 

X,  Tipo  de  ciiente 


Xj^  Probabiiidade  de  comprar 


N=  68  64  68 

Menos  de  1  ano  De  1  a  5  anos  Mais  de  5  anos 

X,  Tipo  de  ciiente 


FiGURA  6-7  Gráficos  de  caixas  de  medidas  de  resuitados  de  compras  (X,g,  Xgg  e  Xg,)  para  grupos  de  X,  (Tipo  de  ciiente). 
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da  análise  avalia  as  diferenças  entre  grupos  individuais 
(p.ex.,  grupos  1  e  2,  grupos  2  e  3,  grupos  1  e  3  etc.)  para 
identificar  aquelas  comparações  de  grupos  com  diferenças 
significantes. 


Avaliação  do  efeito  principal  de  Xg.  Todos  os  testes 
multivariados  e  univariados  indicaram  um  efeito  princi¬ 
pal  significante  de  (Tipo  de  cliente)  sobre  cada  variá¬ 
vel  dependente  individual  bem  como  o  conjunto  das  va¬ 
riáveis  dependentes  quando  consideradas  coletivamente. 
O  efeito  principal  significante  corresponde  a  dizer  que 
as  variáveis  dependentes  variam  bastante  entre  os  três 
grupos  de  clientes  com  base  na  extensão  da  relação  com 
clientela.  Como  podemos  ver  na  Tabela  6-8  e  na  Figu¬ 
ra  6-7,  o  padrão  de  compras  aumenta  em  cada  medida 
dependente  quando  a  relação  com  clientela  amadurece. 
Por  exemplo,  satisfação  do  cliente  (Aj,)  é  menor  (5,729) 
para  aqueles  com  menos  de  1  ano  de  relação,  aumen¬ 
tando  (7,294)  para  aqueles  clientes  entre  1  e  5  anos,  até 
alcançar  o  mais  alto  nível  (7,853)  para  aqueles  que  se 
relacionam  há  mais  de  5  anos.  Padrões  semelhantes  são 
vistos  para  as  outras  duas  medidas  dependentes. 


Realização  de  comparações  post  hoc 

Como  já  observado,  um  efeito  principal  significante  indica 
que  o  conjunto  total  de  diferenças  de  grupos  (p.ex.,  gru¬ 
pos  1  e  2  etc.)  é  de  elementos  que  são  grandes  o  bastante 
para  serem  considerados  estatisticamente  significantes. 
Também  deve  ser  notado  que  um  efeito  principal  signifi¬ 
cante  não  garante  que  todas  as  diferenças  de  grupos  sejam 
igualmente  significantes.  Podemos  descobrir  que  um  efei¬ 
to  principal  significante  é  na  verdade  devido  a  uma  úni¬ 
ca  diferença  de  grupos  (p.ex.,  grupos  1  e  2),  enquanto  as 
outras  comparações  (grupos  1  e  3  e  grupos  2  e  3)  não  são 
significativamente  diferentes. 

A  questão  passa  a  ser  a  seguinte:  como  essas  diferenças 
individuais  de  grupos  são  avaliadas  enquanto  se  mantém 
um  nível  aceitável  de  taxa  geral  de  erro  do  Tipo  I?  Este 
mesmo  problema  é  encontrado  quando  se  consideram 
múltiplas  medidas  dependentes,  mas  neste  caso  fazendo- 
se  comparações  para  uma  única  variável  dependente  ao 
longo  de  múltiplos  grupos.  Esse  tipo  de  questão  pode  ser 
testada  com  um  dos  procedimentos  a  priori.  Se  o  contras¬ 
te  é  usado,  uma  comparação  específica  é  feita  entre  dois 
grupos  (ou  conjuntos  de  grupos)  para  ver  se  eles  são  signi¬ 
ficativamente  diferentes.  Outra  abordagem  é  usar  um  dos 
procedimentos  post  hoc  que  testa  todas  as  diferenças  de 
grupos  e  então  identifica  aquelas  que  são  estatisticamente 
significantes. 


A  Tabela  6-11  contém  três  métodos  de  comparação  post 
hoc  (FISD  de  Tukey,  Scheffé  e  LSD)  aplicados  em  to¬ 
dos  os  três  resultados  de  compra  nos  três  grupos  de  X^. 
Quando  examinamos  X^g  (Satisfação),  primeiro  perce¬ 


bemos  que  apesar  de  o  efeito  principal  geral  ser  signi¬ 
ficante,  as  diferenças  entre  grupos  adjacentes  não  são 
constantes.  A  diferença  entre  clientes  de  menos  de  1  ano 
e  aqueles  entre  1  e  5  anos  é  de  -1,564  (o  sinal  negativo 
indica  que  os  clientes  com  menos  de  1  ano  têm  o  menor 
valor).  Quando  examinamos  a  diferença  de  grupos  en¬ 
tre  clientes  de  1  a  5  anos  e  aqueles  com  mais  de  5  anos, 
porém,  a  diferença  é  reduzida  para  -0,559  (aproximada¬ 
mente  um  terço  da  diferença  anterior). 

Desse  modo,  o  pesquisador  está  interessado  em  saber 
se  ambas  as  diferenças  são  significantes,  ou  se  há  signi- 
ficância  apenas  entre  os  dois  primeiros  grupos.  Quando 
olhamos  para  as  últimas  três  colunas  da  Tabela  6-11,  po¬ 
demos  ver  que  todas  as  diferenças  separadas  de  grupos 
para  X^g  são  significantes,  o  que  aponta  para  o  fato  de 
que  a  diferença  de  -0,559,  apesar  de  ser  muito  menor  do 
que  a  outra,  ainda  é  estatisticamente  significante. 

Quando  examinamos  as  comparações  para  os  outros 
dois  resultados  de  compra  {X^g  e  AjJ,  surge  um  outro  pa¬ 
drão.  Novamente,  as  diferenças  entre  os  dois  primeiros 
grupos  (menos  de  1  ano  e  entre  1  e  5  anos)  são  todas  esta¬ 
tisticamente  significantes  em  todos  os  três  testes  post  hoc. 
No  entanto,  quando  examinamos  a  próxima  comparação 
(clientes  de  1  a  5  anos  versus  aqueles  com  mais  de  5  anos 
como  clientes),  dois  dos  três  testes  indicam  que  os  dois 
grupos  não  são  distintos.  Em  tais  testes,  os  resultados  de 
compra  de  X^g  e  Ajj  para  clientes  de  1  a  5  anos  não  são 
significativamente  distintos  daqueles  com  mais  de  5  anos. 
Este  resultado  é  contrário  àquilo  que  foi  descoberto  para 
satisfação,  na  qual  esta  diferença  era  significante. 


Quando  a  variável  independente  tem  três  ou  mais  ní¬ 
veis,  o  pesquisador  deve  se  empenhar  neste  segundo  nível 
de  análise  além  da  avaliação  de  efeitos  principais  signifi¬ 
cantes.  Aqui  o  pesquisador  não  está  interessado  no  efei¬ 
to  coletivo  da  variável  independente,  mas  nas  diferenças 
entre  grupos  específicos.  As  ferramentas  de  comparações 
planejadas  ou  métodos  post  hoc  fornecem  uma  maneira 
poderosa  de  se  fazerem  estes  testes  de  diferenças  de  grupos 
enquanto  também  mantêm  a  taxa  geral  de  erro  Tipo  I. 


EXEMPLO  3:  UM  DELINEAMENTO 
EATORIAL  PARA  MANOVA  COM 
DUAS  VARIÁVEIS  INDEPENDENTES 

Nos  dois  exemplos  anteriores,  as  análises  MANOVA  fo¬ 
ram  extensões  de  análises  univariadas  de  dois  e  três  gru¬ 
pos.  Neste  exemplo,  exploramos  um  experimento  fatorial 
multivariado:  duas  variáveis  independentes  usadas  como 
tratamentos  para  analisar  diferenças  do  conjunto  de  va¬ 
riáveis  dependentes.  No  curso  de  nossa  discussão,  ava¬ 
liamos  os  efeitos  interativos  ou  conjuntos  entre  os  dois 
tratamentos  sobre  variáveis  dependentes  separada  e  co¬ 
letivamente. 
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TABELA  6-1 1  Comparações  post  hoc  para  diferenças  individuais  de  grupos  em  medidas  de  resultado  de  compra  (X,9,  e  Xj,)  nos 
grupos  de  X,  (Tipo  de  cliente) 

Diferença  média  entre  Significância  estatística  de 

Grupos  a  serem  comparados  grupos  (i  -  J)  comparação  post  hoc 

Diferença  HSD  de 


Variável  dependente  Grupo  1 

Grupo  J 

média 

Erro  padrão 

Tukey 

Scheffé 

LSD 

X,g  Satisfação 

Menos  de  1  ano 

De  1  a  5  anos 

-1 ,564 

0,148 

0,000 

0,000 

0,000 

Menos  de  1  ano 

Mais  de  5  anos 

-2,124 

0,146 

0,000 

0,000 

0,000 

De  1  a  5  anos 

Mais  de  5  anos 

-0,559 

0,148 

0,000 

0,001 

0,000 

Xjg  Probabilidade  de  recomendar 

Menos  de  1  ano 

De  1  a  5  anos 

-1 ,068 

0,158 

0,000 

0,000 

0,000 

Menos  de  1  ano 

Mais  de  5  anos 

-1,381 

0,156 

0,000 

0,000 

0,000 

De  1  a  5  anos 

Mais  de  5  anos 

-0,313 

0,158 

0,118 

0,144 

0,049 

Xj,  Probabilidade  de  comprar 

Menos  de  1  ano 

De  1  a  5  anos 

-0,921 

0,127 

0,000 

0,000 

0,000 

Menos  de  1  ano 

Mais  de  5  anos 

-1,201 

0,125 

0,000 

0,000 

0,000 

De  1  a  5  anos 

Mais  de  5  anos 

-0,280 

0,127 

0,071 

0,091 

0,029 

Estágio  1:  Objetivos  de  MANO  VA 

Nas  questões  de  pesquisa  multivariadas  prévias,  a  HBAT 
considerou  o  efeito  de  apenas  uma  variável  de  tratamento 
sobre  as  variáveis  dependentes.  Aqui,  a  possibilidade  de 
efeitos  conjuntos  entre  duas  ou  mais  variáveis  indepen¬ 
dentes  deve  ser  igualmente  considerada.  Deste  modo,  a 
interação  entre  as  variáveis  independentes  pode  ser  ava¬ 
liada  com  seus  efeitos  principais. 


Questões  de  pesquisa.  As  duas  primeiras  questões  de 
pesquisa  que  examinamos  se  referem  ao  impacto  de 
dois  fatores  -  sistema  de  distribuição  e  duração  da  re¬ 
lação  com  clientes  -  sobre  um  conjunto  de  resultados 
de  compra.  Em  cada  caso,  os  fatores  foram  mostrados 
como  tendo  impactos  significantes  (isto  é,  resultados  de 
compra  mais  favoráveis  para  firmas  no  sistema  direto  de 
distribuição  ou  aquelas  com  fidelidade  mais  duradoura 
como  cliente  da  HBAT). 

Há  ainda  uma  terceira  questão  não  resolvida:  como 
esses  dois  fatores  operam  quando  considerados  simul¬ 
taneamente?  Estamos  aqui  interessados  em  saber 
como  as  diferenças  entre  sistemas  de  distribuição  se 
mantêm  nos  grupos  com  base  na  duração  da  relação 
com  a  HBAT.  Vimos  que  clientes  no  sistema  direto 
de  distribuição  tinham  resultados  de  compra  signifi¬ 
cativamente  maiores  (maior  satisfação  etc.),  mas  tais 
diferenças  estão  sempre  presentes  para  cada  grupo  de 
clientes  com  base  em  X^l  O  que  segue  adiante  é  ape¬ 
nas  uma  amostra  dos  tipos  de  questão  que  podemos 
levantar  quando  se  consideram  as  duas  variáveis  jun¬ 
tas  em  uma  análise: 

•  O  sistema  de  distribuição  direta  é  mais  efetivo  para 
clientes  mais  novos? 


•  Os  dois  sistemas  de  distribuição  mostram  diferenças 
para  clientes  com  5  anos  ou  mais? 

•  O  sistema  de  distribuição  direta  é  sempre  preferencial 
em  relação  ao  indireto  nos  grupos  de  clientela  de  Xjl 

Combinando  ambas  as  variáveis  independentes  {X^ 
e  Aj)  em  um  planejamento  fatorial,  criamos  seis  grupos 
de  clientes:  os  três  grupos  baseados  em  duração  de  suas 
relações  com  a  HBAT  separados  naqueles  grupos  em 
cada  sistema  de  distribuição.  Conhecidos  como  um  pla¬ 
nejamento  3  X  2,  os  três  níveis  de  X^  separados  para  cada 
nível  de  X^  formam  um  grupo  separado  para  cada  tipo 
de  cliente  dentro  de  cada  canal  de  distribuição. 

Exames  de  perfis  de  grupos.  A  Tabela  6-12  fornece  um 
perfil  de  cada  grupo  para  o  conjunto  de  resultados  de 
compra.  Muitas  vezes,  uma  perspectiva  mais  simples  é 
através  de  uma  representação  gráfica.  Uma  opção  é  for¬ 
mar  um  gráfico  de  linhas,  e  ilustramos  isso  quando  ve¬ 
mos  os  termos  de  interação  em  uma  seção  adiante.  Po¬ 
demos  utilizar  também  gráficos  de  caixas  para  mostrar 
não  apenas  as  diferenças  entre  médias  de  grupos,  mas 
a  superposição  do  domínio  de  valores  em  cada  grupo. 
A  Figura  6-8  ilustra  tal  gráfico  para  Ajg  (Satisfação)  nos 
seis  grupos  de  nosso  planejamento  fatorial.  Como  pode¬ 
mos  perceber,  a  satisfação  aumenta  quando  o  tempo  de 
relação  com  a  HBAT  cresce,  mas  as  diferenças  entre  os 
dois  sistemas  de  distribuição  não  são  sempre  constantes 
(p.ex.,  elas  parecem  mais  próximas  para  clientes  de  1  a 
5  anos). 


O  objetivo  da  inclusão  de  múltiplas  variáveis  indepen¬ 
dentes  em  uma  MANOVA  é  avaliar  seus  efeitos  “con¬ 
tingentes”  ou  “controladores”  sobre  as  demais  variáveis. 
Neste  caso,  podemos  ver  como  a  duração  da  relação  com 
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Satisfação 


Menos  de  1  ano 


De  1  a  5  anos 

Tipo  de  cliente 


Mais  de  5  anos 


Xj  Distribuição 

Indireta  via  corretor 

I  I  Direta  ao  cliente 


FIGURA  6-8  Gráfico  de  caixas  de  medida  de  resultado  de  compra  (X,g)  para  grupos  de  (Sistema  de  distribuição)  por  X,  (Tipo  de  cliente). 


a  HBAT  muda  com  mais  percepções  positivas  geralmente 
vistas  para  o  sistema  de  distribuição  direta. 

Estágio  2:  Projeto  de  pesquisa  em  MANO  VA 

Qualquer  plano  fatorial  de  duas  ou  mais  variáveis  inde¬ 
pendentes  levanta  a  questão  de  tamanho  de  amostra  ade¬ 
quado  nos  vários  grupos.  O  pesquisador  deve  garantir,  na 
criação  do  planejamento  fatorial,  que  cada  grupo  tenha 
tamanho  de  amostra  suficiente  para: 

1.  Atender  às  exigências  mínimas  de  que  os  tamanhos  de  gru¬ 
pos  excedam  o  número  de  variáveis  dependentes 

2.  Fornecer  o  poder  estatístico  para  avaliar  diferenças  conside¬ 
radas  significantes  na  prática. 


Considerações  sobre  tamanho  de  amostra.  Como  ob¬ 
servado  na  seção  anterior,  esta  análise  é  chamada  de 
planejamento  2x3  por  incluir  dois  níveis  de  (distri¬ 
buição  direta  versus  indireta)  e  três  níveis  de  (menos 
de  1  ano,  de  f  a  5  anos  e  mais  de  5  anos).  O  problema  de 
tamanho  amostrai  por  grupo  foi  de  tamanha  preocupa¬ 
ção  para  os  pesquisadores  da  HBAT  que  o  levantamento 
original  da  HBAT  de  100  observações  foi  complemen¬ 
tado  com  100  respondentes  adicionais  apenas  para  esta 
análise  (ver  discussão  mais  detalhada  na  seção  anterior 
aos  exemplos).  Mesmo  com  os  respondentes  adicionais, 
a  amostra  de  200  observações  deve  ser  dividida  nos  seis 
grupos,  preferencialmente  de  uma  maneira  equilibrada. 

Os  tamanhos  amostrais  por  célula  são  mostrados  na 
Tabela  6-12  e  podem  ser  vistos  da  seguinte  maneira  sim¬ 
plificada: 


Vj  Tipo  de  cliente 

Aj  Sistema  de  distribuição 

Indireto 

Direto 

Menos  de  1  ano 

52 

16 

De  1  a  5  anos 

25 

39 

Mais  de  5  anos 

31 

37 

Adequação  de  poder  estatístico.  Os  tamanhos  amos¬ 
trais  em  todas  as  células,  exceto  uma,  fornecem  poder 
estatístico  suficiente  para  identificar  pelo  menos  tama¬ 
nhos  de  efeito  grandes  com  uma  probabilidade  de  80%. 
Contudo,  a  amostra  menor  de  16  para  clientes  com  me¬ 
nos  de  1  ano  atendidos  pelo  canal  de  distribuição  direta 
deve  preocupar  um  pouco.  Assim,  devemos  reconhecer 
que,  a  menos  que  os  tamanhos  de  efeitos  sejam  substan¬ 
ciais,  os  limitados  tamanhos  amostrais  em  cada  grupo, 
mesmo  desta  amostra  de  200  observações,  podem  evitar 
a  identificação  de  diferenças  significantes.  Esta  questão 
se  torna  especialmente  crítica  quando  se  examina  uma 
diferença  não-significante  na  qual  o  pesquisador  deve 
determinar  se  o  resultado  não-significante  é  devido  a  ta¬ 
manho  de  efeito  insuficiente  ou  baixo  poder  estatístico. 


Estágio  3:  Suposições  em  MANOVA 

Como  nas  análises  MANOVA  anteriores,  a  suposição  de 
maior  importância  é  a  homogeneidade  das  matrizes  de 
variância-covariância  nos  grupos.  Satisfazer  tal  suposição 
viabiliza  interpretação  direta  dos  resultados  sem  ter  que 
considerar  tamanhos  de  grupos,  nível  de  covariâncias  no 
grupo  e  assim  por  diante.  Suposições  estatísticas  adicio- 
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TABELA  6-12  Estatísticas  descritivas  de  medidas  de  resuitado  de  compra  (X,g,  e  Xg,)  para  grupos  de  X,  (Tipo  de  ciiente)  por  Xg 
(Sistema  de  distribuição) 


Variável  dependente 

X^Tipo  de  cliente 

Xg  Sistema  de  distribuição 

Média 

Desvio  padrão 

N 

X,g  Satisfação 

Menos  de  1  ano 

Indireto  via  corretor 

5,462 

0,499 

52 

Direto  ao  cliente 

6,600 

0,839 

16 

Total 

5,729 

0,764 

68 

De  1  a  5  anos 

Indireto  via  corretor 

7,120 

0,551 

25 

Direto  ao  cliente 

7,405 

0,779 

39 

Total 

7,294 

0,708 

64 

Mais  de  5  anos 

Indireto  via  corretor 

7,132 

0,803 

31 

Direto  ao  cliente 

8,457 

0,792 

37 

Total 

7,853 

1,033 

68 

Total 

Indireto  via  corretor 

6,325 

1,033 

108 

Direto  ao  cliente 

7,688 

1,049 

92 

Total 

6,952 

1,241 

200 

Xjg  Probabilidade  de  recomendar 

Menos  de  1  ano 

Indireto  via  corretor 

5,883 

0,773 

52 

Direto  ao  cliente 

6,981 

1,186 

16 

Total 

6,141 

0,995 

68 

De  1  a  5  anos 

Indireto  via  corretor 

7,144 

0,803 

25 

Direto  ao  cliente 

7,251 

0,659 

39 

Total 

7,209 

0,714 

64 

Mais  de  5  anos 

Indireto  via  corretor 

6,974 

0,835 

31 

Direto  ao  cliente 

7,981 

0,847 

37 

Total 

7,522 

0,976 

68 

Total 

Indireto  via  corretor 

6,488 

0,986 

108 

Direto  ao  cliente 

7,498 

0,930 

92 

Total 

6,953 

1,083 

200 

Xg,  Probabilidade  de  comprar 

Menos  de  1  ano 

Indireto  via  corretor 

6,763 

0,702 

52 

Direto  ao  cliente 

7,606 

0,569 

16 

Total 

6,962 

0,760 

68 

De  1  a  5  anos 

Indireto  via  corretor 

7,804 

0,710 

25 

Direto  ao  cliente 

7,933 

0,601 

39 

Total 

7,883 

0,643 

64 

Mais  de  5  anos 

Indireto  via  corretor 

7,919 

0,648 

31 

Direto  ao  cliente 

8,368 

0,825 

37 

Total 

8,163 

0,777 

68 

Total 

Indireto  via  corretor 

7,336 

0,880 

108 

Direto  ao  cliente 

8,051 

0,745 

92 

Total 

7,665 

0,893 

200 

nais  relacionadas  às  variáveis  dependentes  (normalidade 
e  correlação)  já  foram  abordadas  nos  exemplos  anteriores. 
Uma  questão  final  é  a  presença  de  observações  atípicas  e  a 
necessidade  de  eliminação  de  quaisquer  observações  que 
possam  distorcer  os  valores  médios  de  qualquer  grupo. 


Homocedasticidade.  Para  este  planejamento  fatorial, 
seis  grupos  estão  envolvidos  no  teste  da  suposição  de  ho¬ 
mocedasticidade  (ver  Tabela  6-13).  O  teste  multivariado 
(M  de  Box)  tem  um  valor  não-significante  (0,153),  que 
nos  permite  aceitar  a  hipótese  nula  de  homogeneidade 
das  matrizes  de  variância-covariância  no  nível  0,05. 

Os  testes  univariados  para  as  três  variáveis  de  resul¬ 
tado  de  compra  separadamente  são  também  não-signi- 


ficantes.  Com  os  testes  multivariados  e  univariados  exi¬ 
bindo  não-significância,  o  pesquisador  pode  prosseguir 
sabendo  que  a  suposição  de  homocedasticidade  foi  com¬ 
pletamente  atendida. 

Observações  atípicas.  A  segunda  questão  envolve  o 
exame  de  observações  com  valores  extremos  e  a  pos¬ 
sível  designação  de  observações  como  atípicas  com 
eliminação  da  análise.  Curiosamente,  o  exame  dos 
gráficos  de  caixas  para  os  três  resultados  de  compras 
identifica  um  número  menor  de  observações  com  valo¬ 
res  extremos  do  que  os  encontrados  para  a  própria  X^. 
A  variável  dependente  com  os  valores  mais  extremos 
é  X21,  com  somente  três,  enquanto  as  outras  medidas 

(Continua) 
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TABELA  6-13  Medidas  multivariadas  e  univariadas  para  teste  de  homocedasticidade  nos  grupos  de  X,  por 


Testes  multivariados  para  homocedasticidade 

Teste  de  Box  de  igualdade  de  matrizes  de  covariância 

M  de  Box 

39,721 

F 

1,263 

dfí 

30 

df2 

33214,450 

Sig. 

0,153 

Testes  univariados  de  homocedasticidade 
Teste  de  Levene  de  igualdade  de  variâncias  de  erro 


Variável  dependente  F  dt\  df2  Síg. 


X,g  Satisfação 

2,169 

5 

194 

0,059 

Xgg  Probabilidade  de  recomendar 

1,808 

5 

194 

0,113 

Xj,  Probabilidade  de  compra 

0,990 

5 

194 

0,425 

(Continuação) 

dependentes  apresentam  um  e  dois  valores  extremos. 
Além  disso,  nenhuma  observação  tem  valores  extremos 
em  mais  de  uma  medida  dependente  (Xjg,  observação 
184;  XjQ,  observações  7,  115  e  149;  e  X2J,  observações 
67  e  187).  Como  resultado,  todas  as  observações  foram 
mantidas  na  análise. 


Estágio  4:  Estimação  do  modelo 
MANO  VA  e  avaliação  do  ajuste  geral 

O  modelo  MANOVA  para  um  planejamento  fatorial 
testa  não  apenas  os  efeitos  principais  de  ambas  as  variá¬ 
veis  independentes,  mas  também  a  interação  ou  efeito 
conjunto  das  mesmas  sobre  as  variáveis  dependentes. 
O  primeiro  passo  é  examinar  o  efeito  de  interação  e  de¬ 
terminar  se  ele  é  estatisticamente  significante.  Se  for,  o 
pesquisador  deve  confirmar  que  o  efeito  de  interação 
é  ordinal.  Se  for  desordinal,  os  testes  estatísticos  dos 
efeitos  principais  não  são  válidos.  Assumindo  um  efeito 
de  interação  significante  ordinal  ou  não -significante,  os 
efeitos  principais  podem  ser  interpretados  diretamente 
sem  ajuste. 

Avaliação  do  efeito  de  interação 

Efeitos  de  interação  podem  ser  identificados  gráfica  e 
estatisticamente.  O  meio  gráfico  mais  comum  é  criar 
representações  com  linhas  que  retratam  pares  de  va¬ 
riáveis  independentes.  Como  ilustrado  na  Figura  6-5, 
efeitos  de  interação  significantes  são  representados  por 
retas  não-paralelas  (com  as  paralelas  retratando  ausên¬ 
cia  de  efeito  de  interação).  Se  as  retas  se  afastam  de  pa¬ 
ralelismo  mas  nunca  se  cruzam  de  maneira  significante, 
então  a  interação  é  considerada  ordinal.  Se  as  retas  se 
cruzam  a  ponto  de  que  pelo  menos  em  um  caso  a  ordem 
relativa  das  retas  é  invertida,  a  interação  é  tida  como 
desordinal. 


A  Figura  6-9  retrata  cada  variável  dependente  nos  seis 
grupos,  indicando  pelo  padrão  de  ausência  de  parale¬ 
lismo  que  pode  existir  uma  interação.  Como  podemos 
ver  em  cada  gráfico,  o  nível  médio  de  (de  1  a  5  anos 
com  a  HBAT)  tem  uma  diferença  substancialmente  me¬ 
nor  entre  as  duas  retas  (representando  os  dois  canais  de 
distribuição)  do  que  os  outros  dois  níveis  de  X^.  Pode¬ 
mos  confirmar  esta  observação  examinando  as  médias 
de  grupo  da  Tabela  6-12.  Usando  X^g  (Satisfação)  como 
um  exemplo,  percebemos  que  a  diferença  entre  canais 
de  distribuição  direta  e  indireta  é  de  1,138  para  clientes 
com  menos  de  1  ano,  o  que  é  bastante  semelhante  à  di¬ 
ferença  entre  canais  (1,325)  para  clientes  com  mais  de  5 
anos.  Não  obstante,  para  aqueles  atendidos  pela  HBAT 
no  período  de  1  a  5  anos,  a  diferença  entre  clientes  dos 
dois  canais  é  de  apenas  0,285.  Portanto,  as  diferenças  en¬ 
tre  os  dois  canais  de  distribuição,  apesar  de  terem  sido 
percebidas  como  significantes  em  exemplos  anteriores, 
podem  ser  evidenciadas  como  diferenciando  (interagin¬ 
do)  com  base  no  tempo  que  o  cliente  tem  sido  atendido 
pela  HBAT.  A  interação  é  considerada  ordinal  porque 
em  todos  os  casos  o  canal  de  distribuição  direta  tem 
maiores  escores  de  satisfação. 


Teste  dos  efeitos  de  interação  e  dos  efeitos  principais 

Além  da  solução  gráfica,  efeitos  de  interação  também  po¬ 
dem  ser  testados  da  mesma  maneira  que  os  efeitos  princi¬ 
pais.  Logo,  o  pesquisador  pode  fazer  tanto  uma  avaliação 
multivariada  quanto  univariada  do  efeito  de  interação  com 
os  testes  estatísticos  descritos  em  exemplos  anteriores. 


A  Tabela  6-14  contém  os  resultados  de  MANOVA  para 
testes  de  efeito  de  interação  e  de  efeitos  principais.  O 
teste  para  um  efeito  de  interação  significante  procede 
como  qualquer  outro  efeito.  Primeiro,  os  efeitos  mui  ti- 

(Continua) 
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Satisfação  Probabilidade  de  recomendar 
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Menos  de 

De  1  a  5 

Mais  de  5 
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X,  Tipo  de  cliente 

X,  Tipo  de  cliente 

Xj,  Probabilidade  de  comprar 


Menos  de  De  1  a  5  Mais  de  5 

1  ano  anos  anos 

X^  Tipo  de  cliente 


FIGURA  6-9  Representações  gráficas  de  efeitos  de  interação  de  medidas  de  resultado  de  compras  (X,9,  X^o  e  Xj,)  nos  grupos  de  X5  (Sistema 
de  distribuição)  por  X,  (Tipo  de  cliente). 


(Continuação) 

variados  são  examinados,  e  neste  caso  os  quatro  testes 
apresentam  significância  estatística.  Em  seguida,  testes 
univariados  para  cada  variável  dependente  são  execu¬ 
tados.  Novamente,  o  efeito  de  interação  é  considerado 
significante  para  cada  uma  das  três  variáveis  dependen¬ 
tes.  Os  testes  estatísticos  confirmam  o  que  foi  indicado 
nos  gráficos:  um  efeito  de  interação  ordinal  significante 
acontece  entre  e  X^. 


Estimação  de  efeitos  principais 

Se  o  efeito  de  interação  é  considerado  não-signiflcante  ou 
mesmo  significante  e  ordinal,  então  o  pesquisador  pode 
proceder  para  estimar  a  significância  dos  efeitos  princi¬ 


pais  para  suas  diferenças  nos  grupos.  Nos  casos  em  que 
um  efeito  de  interação  desordinal  é  descoberto,  os  efeitos 
principais  são  perturbados  pela  interação  desordinal  e  tes¬ 
tes  para  diferenças  não  devem  ser  realizados. 


Com  uma  interação  ordinal  significante,  podemos  proce¬ 
der  para  avaliarmos  se  ambas  as  variáveis  independentes 
ainda  têm  efeitos  principais  significantes  quando  consi¬ 
deradas  simultaneamente.  A  Tabela  6-14  também  con¬ 
tém  os  resultados  MANOVA  para  os  efeitos  principais 
de  Aj  e  X^  além  dos  testes  para  o  efeito  de  interação  já 
discutidos.  Como  descobrimos  ao  analisá-las  separada- 

{Continua) 
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TABELA  6-14  Testes  multivariados  e  univariados  para  diferenças  de  grupos  em  medidas  de  resultado  de  compra  (X,g,  Xgg  e  Xg,)  nos  grupos 
de  X,  por  Xg 


Testes  multivariados 

Efeito 

Teste  estatístico 

Valor 

F 

dfde  hipótese 

dfde  erro 

Sig. 

2 

'f] 

Poder  observado“ 

X 

Critério  de  Piliai 

0,488 

20,770 

6 

386 

0,000 

0,244 

1,000 

Lambda  de  Wilks 

0,512 

25,429 

6 

384 

0,000 

0,284 

1,000 

Traço  de  Hoteiling 

0,952 

30,306 

6 

382 

0,000 

0,322 

1,000 

Maior  raiz  de  Roy 

0,951 

61,211 

3 

193 

0,000 

0,488 

1,000 

X 

Critério  de  Piliai 

0,285 

25,500 

3 

192 

0,000 

0,285 

1,000 

Lambda  de  Wilks 

0,715 

25,500 

3 

192 

0,000 

0,285 

1,000 

Traço  de  Hoteiling 

0,398 

25,500 

3 

192 

0,000 

0,285 

1,000 

Maior  raiz  de  Roy 

0,398 

25,500 

3 

192 

0,000 

0,285 

1,000 

X,XXg 

Critério  de  Piliai 

0,124 

4,256 

6 

386 

0,000 

0,062 

0,980 

Lambda  de  Wilks 

0,878 

4,291 

6 

384 

0,000 

0,063 

0,981 

Traço  de  Hoteiling 

0,136 

4,327 

6 

382 

0,000 

0,064 

0,982 

Maior  raiz  de  Roy 

0,112 

7,194 

3 

193 

0,000 

0,101 

0,981 

“Computado  usando  alfa  =  0,05 

Testes  univariados  (efeitos  entre  sujeitos) 

Soma  de 

Quadrado 

Efeito 

Variável  dependente 

quadrados 

df 

médio 

F 

Sig. 

2 

Poder  observado“ 

Gerai 

X,9  Satisfação 

210,999'’ 

5 

42,200 

85,689 

0,000 

0,688 

1,000 

Xjo  Probabilidade  de  recomendar 

103,085'’ 

5 

20,617 

30,702 

0,000 

0,442 

1,000 

Xg,  Probabilidade  de  compra 

65,879“ 

5 

13,176 

27,516 

0,000 

0,415 

1,000 

X 

X,9  Satisfação 

89,995 

2 

44,998 

91,370 

0,000 

0,485 

1,000 

Xjo  Probabilidade  de  recomendar 

32,035 

2 

16,017 

23,852 

0,000 

0,197 

1,000 

Xj,  Probabilidade  de  compra 

26,723 

2 

13,362 

27,904 

0,000 

0,223 

1,000 

X 

X,9  Satisfação 

36,544 

1 

36,544 

74,204 

0,000 

0,277 

1,000 

Xjo  Probabilidade  de  recomendar 

23,692 

1 

23,692 

35,282 

0,000 

0,154 

1,000 

Xj,  Probabilidade  de  compra 

9,762 

1 

9,762 

20,386 

0,000 

0,095 

0,994 

X^X 

X,9  Satisfação 

9,484 

2 

4,742 

9,628 

0,000 

0,090 

0,980 

Xgo  Probabilidade  de  recomendar 

8,861 

2 

4,430 

6,597 

0,002 

0,064 

0,908 

Xj,  Probabilidade  de  compra 

3,454 

2 

1,727 

3,607 

0,029 

0,036 

0,662 

“Computado  usando  alfa  =  0,05 
=  0,688  (tf  ajustado  =  0,680) 
‘ff  =  0,442  (ff  ajustado  =  0,427) 
“tf  =  0,415  (ff  ajustado  =  0,400) 


(Continuação) 

mente,  (Tipo  de  cliente)  e  (Sistema  de  distribui¬ 
ção)  têm  um  impacto  significante  (efeito  principal)  sobre 
as  três  variáveis  de  resultados  de  compra,  tanto  em  con¬ 
junto  quanto  separadamente,  como  demonstrado  pelos 
testes  multivariados  e  univariados. 

O  impacto  de  duas  variáveis  independentes  pode  ser 
comparado  examinando-se  os  tamanhos  relativos  de  efei¬ 
to  mostrados  por  tj^  (eta  ao  quadrado).  Os  tamanhos  de 
efeitos  para  cada  variável  são  relativamente  semelhantes, 
indicando  um  impacto  similar  de  cada  um  sobre  as  variá¬ 
veis  dependentes.  Tal  comparação  dá  uma  avaliação  de 
significância  prática  separada  dos  testes  estatísticos  de 
significância.  Quando  comparado  com  qualquer  variável 
independente,  porém,  o  tamanho  de  efeito  atribuível  ao 
efeito  de  interação  é  muito  menor. 


Estágio  5:  Interpretação  dos  resultados 

A  interpretação  de  um  planejamento  fatorial  em  MANO- 
VA  é  uma  combinação  de  julgamentos  obtidos  de  testes  es¬ 
tatísticos  e  do  exame  dos  dados  básicos.  A  presença  de  um 
efeito  de  interação  pode  ser  avaliada  estatisticamente,  mas 
as  conclusões  resultantes  são  baseadas  principalmente  no 
julgamento  do  pesquisador.  Este  deve  examinar  as  diferen¬ 
ças  com  significância  prática,  além  daquelas  de  significân¬ 
cia  estatística.  Se  comparações  específicas  entre  os  grupos 
puderem  ser  formuladas,  então  comparações  planejadas 
podem  ser  especificadas  e  diretamente  testadas  na  análise. 

Interpretação  dos  efeitos  de  interação 
e  dos  efeitos  principais 

Significância  estatística  pode  ser  suportada  pelos  testes 
multivariados,  mas  o  exame  dos  testes  para  cada  variável 
dependente  fornece  uma  visão  crítica  sobre  os  efeitos  vis- 
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tos  nos  testes  multivariados.  Além  disso,  o  pesquisador 
pode  empregar  comparações  planejadas  ou  mesmo  testes 
post  hoc  para  determinar  a  verdadeira  natureza  de  dife¬ 
renças,  particularmente  quando  termos  de  interação  sig- 
nificantes  são  descobertos. 


Com  os  efeitos  de  interação  e  os  efeitos  principais  jul¬ 
gados  como  estatisticamente  significantes  tanto  pelos 
testes  multivariados  quanto  univariados,  a  interpreta¬ 
ção  ainda  é  fortemente  apoiada  nos  padrões  de  efeitos 
mostrados  nos  valores  dos  seis  grupos  (ver  Tabela  6-12 
e  Figura  6-9). 

Interação  de  por  Zj.  As  retas  não-paralelas  para 
cada  medida  dependente  retratam  notavelmente  o  es¬ 
treitamento  das  diferenças  em  canais  de  distribuição 
para  clientes  de  1  a  5  anos.  Apesar  de  os  efeitos  de  Xj  e 
Zj  ainda  estarem  presentes,  vemos  algumas  diferenças 
sensíveis  nestes  impactos  dependendo  de  quais  conjun¬ 
tos  específicos  de  clientes  examinamos. 

Efeito  principal  de  Zj.  Seu  efeito  principal  é  ilustrado 
para  todos  os  três  resultados  de  compra  inclinando-se 
para  cima  as  retas  através  dos  três  níveis  de  X^  sobre  o 
eixo  Z.  Aqui  podemos  ver  que  os  efeitos  são  consisten¬ 
tes  com  descobertas  anteriores  no  sentido  de  que  todos 
os  três  resultados  de  compra  aumentam  favoravelmen¬ 
te  quando  o  tempo  de  relacionamento  com  a  HBAT 
avança. 

Efeito  principal  de  Zj.  A  separação  das  duas  retas 
representando  os  dois  canais  de  distribuição  mostra 
que  o  canal  direto  gera  resultados  de  compra  mais  fa¬ 
voráveis. 


Covariáveis  potenciais 

O  pesquisador  dispõe  também  de  uma  ferramenta  adicio¬ 
nal  -  adição  de  covariáveis  -  para  melhorar  a  análise  e 
a  interpretação  das  variáveis  independentes.  O  papel  da 
covariável  é  controlar  os  efeitos  fora  do  escopo  da  análi¬ 
se  MANOVA  que  possam  afetar  as  diferenças  de  grupos 
de  alguma  forma  sistemática  (ver  discussão  anterior  para 
mais  detalhes).  Uma  covariável  é  mais  efetiva  quando 
ela  tem  correlação  com  as  variáveis  dependentes,  mas  é 
relativamente  pouco  correlacionada  com  as  independen¬ 
tes  em  uso.  Deste  modo,  isso  pode  explicar  variância  não 
atribuível  às  variáveis  independentes  (devido  à  pequena 
correlação  com  as  mesmas),  mas  ainda  assim  reduzir  a 
magnitude  da  variação  geral  a  ser  explicada  (a  correlação 
com  as  medidas  dependentes). 


Os  pesquisadores  FIBAT  tinham  opções  limitadas  na  es¬ 
colha  de  covariáveis  para  essas  análises  MANOVA.  O 


único  candidato  possível  era  Zjj,  representando  o  per¬ 
centual  de  compras  de  clientes  vindas  da  FIBAT.  O  mo¬ 
tivo  seria  controlar  a  dependência  percebida  ou  real  de 
firmas  sobre  a  FIBAT,  como  represenfado  em  Zjj.  Fir¬ 
mas  com  maior  dependência  podem  reagir  de  maneira 
bastanfe  diferenfe  às  variáveis  sendo  consideradas. 

Confudo,  Z22  é  um  candidato  pobre  para  se  tornar 
uma  covariável  apesar  de  atender  ao  critério  de  ser  cor¬ 
relacionada  com  as  variáveis  dependentes.  Sua  falha  fa¬ 
tal  é  o  elevado  grau  de  diferenças  percebidas  sobre  Zj 
e  Z5.  Tais  diferenças  sugerem  que  os  efeitos  de  Z^  e  Zj 
seriam  severamente  perturbados  pelo  uso  de  Z22  como 
covariável.  Logo,  nenhuma  covariável  será  empregada 
nesta  análise. 


Resumo 

Os  resultados  refletidos  nos  efeitos  principal  e  de  inte¬ 
ração  apresentam  uma  convincente  evidência  de  que  as 
reações  pós-compras  de  clientes  de  HBAT  são  influencia¬ 
das  pelo  tipo  de  sistema  de  distribuição  e  pelo  tempo  de 
relacionamento. 


O  sistema  de  distribuição  direta  é  associado  com  níveis 
maiores  de  satisfação  de  clientela,  bem  como  probabili¬ 
dade  de  novas  compras  futuras  e  de  recomendação  de 
HBAT  para  outros.  Analogamente,  clientes  com  rela¬ 
cionamentos  mais  longos  também  relatam  níveis  maio¬ 
res  nas  três  variáveis  dependentes.  As  diferenças  entre 
as  variáveis  dependentes  são  menores  entre  aqueles 
clientes  que  têm  feito  negócios  com  a  HBAT  entre  1  e 
5  anos. 


O  uso  de  MANOVA  neste  processo  permite  ao  pes¬ 
quisador  controlar  em  maior  extensão  a  taxa  de  erro  Tipo 
I  do  que  no  caso  de  comparações  individuais  serem  feitas 
sobre  cada  variável  dependente.  As  interpretações  per¬ 
manecem  válidas  mesmo  depois  que  o  impacto  de  outras 
variáveis  dependentes  tenha  sido  levado  em  conta.  Esses 
resultados  confirmam  as  diferenças  encontradas  entre  os 
efeitos  das  duas  variáveis  independentes. 


UMA  VISÃO  GERENCIAL 
DOS  RESULTADOS 

Os  pesquisadores  da  HBAT  fizeram  várias  ANOVAs  e 
MANOVAs  na  tentativa  de  compreender  como  os  três 
resultados  de  compra  (Z^,,  Satisfação;  Z2Q,  Probabilidade 
de  recomendar;  e  X21,  Probabilidade  de  futura  compra) 
variam  ao  longo  das  características  de  firmas  envolvidas, 
como  sistema  de  distribuição  (Z5)  e  tipo  de  cliente  (ZJ. 
Em  nossa  discussão,  concentramo-nos  sobre  os  resultados 
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multivariados,  uma  vez  que  eles  se  sobrepõem  aos  resul¬ 
tados  univariados. 


A  primeira  análise  MANO  VA  é  direta:  o  tipo  de  canal 
de  distribuição  tem  efeito  sobre  os  resultados  de  com¬ 
pra?  Nesse  caso,  o  pesquisador  testa  se  os  conjuntos  de 
escores  médios  (ou  seja,  as  médias  dos  três  resultados 
de  compra)  para  cada  grupo  de  distribuição  são  equiva¬ 
lentes.  Depois  de  garantir  que  todas  as  suposições  são 
atendidas,  percebemos  que  os  resultados  revelam  uma 
diferença  significante  no  sentido  de  que  as  empresas  no 
sistema  direto  de  distribuição  apresentam  resultados  de 
compra  mais  favoráveis  quando  comparadas  com  aque¬ 
las  atendidas  via  corretores.  Nos  resultados  gerais,  a  ad¬ 
ministração  também  precisava  saber  se  essa  diferença 
existe  não  apenas  para  a  variável  estatística,  mas  tam¬ 
bém  para  as  variáveis  individuais.  Testes  univariados 
revelaram  que  também  havia  diferenças  univariadas  sig- 
nificantes  para  cada  resultado  de  compra.  Os  resultados 
multivariados  e  univariados  significantes  indicam  à  ad¬ 
ministração  que  o  sistema  direto  de  distribuição  atende 
melhor  os  clientes,  como  indicado  pelas  medidas  de  re¬ 
sultados  mais  favoráveis.  Logo,  os  administradores  po¬ 
dem  se  concentrar  na  extensão  dos  benefícios  do  sistema 
direto  enquanto  trabalham  em  melhorias  no  sistema  de 
distribuição  via  corretores. 

A  próxima  MANOVA  segue  a  mesma  abordagem, 
mas  substitui  uma  nova  variável  independente,  o  tipo  de 
cliente  (ou  seja,  o  tempo  em  que  a  firma  tem  sido  um 
cliente),  que  tem  três  grupos  (menos  de  1  ano,  de  1  a  5 
anos,  e  mais  de  5  anos).  Mais  uma  vez,  a  administração 
se  concentra  nas  três  medidas  de  resultado  para  avaliar 
se  diferenças  significantes  são  encontradas  no  tempo  de 
relação  com  a  clientela.  Ambos  os  testes  univariado  e 
multivariado  apontam  diferenças  nas  variáveis  de  resul¬ 
tado  de  compra  nos  três  grupos  de  clientes.  No  entanto, 
uma  questão  permanece:  cada  grupo  é  diferente  do  ou¬ 
tro?  Perfis  de  grupos  mostram  substanciais  distinções,  e 
testes  post  hoc  indicam  que  para  (Satisfação)  cada 
grupo  de  clientes  é  diferente  dos  demais.  Para  as  demais 
medidas  de  resultado,  os  grupos  2  e  3  (clientes  de  1  a  5 
anos  e  clientes  com  mais  de  5  anos)  não  são  diferentes 
entre  si,  apesar  de  ambos  serem  diferentes  dos  clientes 
com  menos  de  1  ano.  A  implicação  disto  é  que  para  Ajq  e 
X21  as  melhoras  em  resultados  de  compra  são  significan¬ 
tes  nos  primeiros  anos,  mas  não  crescem  além  daquele 
período.  De  um  ponto  de  vista  administrativo,  a  duração 
do  relacionamento  com  a  clientela  afeta  positivamente 
as  percepções  das  firmas  sobre  resultados  de  compras. 
Ainda  que  aumentos  na  medida  básica  de  satisfação 
sejam  percebidos  através  da  relação,  o  único  aumento 
significante  nos  outros  dois  resultados  é  percebido  após 
o  primeiro  ano. 

O  terceiro  exemplo  aborda  a  questão  do  impacto 
combinado  dessas  duas  características  de  firmas  (Aj, 


sistema  de  distribuição;  e  Aj,  duração  da  relação  com  o 
cliente)  sobre  os  resultados  de  compra.  As  três  catego¬ 
rias  de  Aj  são  combinadas  com  as  duas  de  Aj  para  for¬ 
mar  seis  grupos.  A  meta  é  estabelecer  se  as  diferenças 
significantes  vistas  para  cada  uma  das  duas  característi¬ 
cas,  quando  analisadas  separadamente,  são  também  evi¬ 
dentes  quando  estudadas  simultaneamente.  O  primeiro 
passo  é  rever  os  resultados  para  interações  significantes: 
os  resultados  de  compra  retratam  as  mesmas  diferenças 
entre  os  dois  tipos  de  sistema  de  distribuição  quando  vis¬ 
tas  por  duração  do  relacionamento?  As  três  interações 
foram  percebidas  como  significantes,  o  que  significa  que 
as  diferenças  entre  os  sistemas  direto  e  via  corretor  não 
foram  constantes  nos  três  grupos  de  clientes  baseados 
em  duração  de  relacionamento  com  clientela.  O  exame 
dos  resultados  revelou  que  o  grupo  do  meio  (clientes  de 
1  a  5  anos)  tem  diferenças  sensivelmente  menores  entre 
os  dois  sistemas  de  distribuição  do  que  clientes  com  re¬ 
lações  mais  curtas  ou  mais  longas.  Embora  este  padrão 
seja  válido  para  os  três  resultados  de  compra,  e  sistemas 
diretos  sejam  sempre  avaliados  mais  favoravelmente 
(mantendo  interações  ordinais),  a  HBAT  deve  perce¬ 
ber  que  as  vantagens  do  sistema  de  distribuição  direta 
são  contingentes  em  relação  à  extensão  da  relação  com 
clientes.  Dadas  essas  interações,  descobriu-se  ainda  que 
cada  característica  de  firma  exibia  impactos  significantes 
sobre  o  resultado,  como  foi  descoberto  ao  se  analisar  se¬ 
paradamente.  Além  disso,  quando  consideradas  simulta¬ 
neamente,  o  impacto  de  cada  uma  sobre  os  resultados  de 
compra  era  relativamente  igual. 


Esses  resultados  permitem  que  os  gerentes  da  HBAT 
identifiquem  os  efeitos  significantes  dessas  características 
de  firmas  sobre  os  resultados  de  compras,  não  apenas  in¬ 
dividualmente  mas  também  quando  combinadas. 

Resumo 

Análise  multivariada  de  variância  (MANOVA)  é  uma 
extensão  da  análise  de  variância  (ANO VA)  para  acomo¬ 
dar  mais  de  uma  variável  dependente.  Trata-se  de  uma 
técnica  de  dependência  que  mede  as  diferenças  para  duas 
ou  mais  variáveis  dependentes  métricas,  com  base  em  um 
conjunto  de  variáveis  categóricas  (não-métricas)  atuando 
como  variáveis  independentes.  Este  capítulo  ajuda  o  lei¬ 
tor  a  fazer  o  seguinte: 

Explicar  a  diferença  entre  a  hipótese  nnia  nnivariada  de 
ANOVA  e  a  correspondente  de  MANOVA.  Assim 
como  ANOVA,  MANOVA  está  preocupada  com  di¬ 
ferenças  entre  grupos  (ou  tratamentos  experimentais). 
ANOVA  é  chamada  de  procedimento  univariado  porque 
é  usada  para  avaliar  diferenças  de  grupos  em  uma  única 
variável  dependente  métrica.  A  hipótese  nula  é  que  as 
médias  de  grupos  para  uma  única  variável  dependen¬ 
te  são  iguais  (não  estatisticamente  diferentes).  Métodos 
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univariados  para  avaliação  de  diferenças  de  grupos  são  o 
teste  t  (dois  grupos)  e  a  análise  de  variância  (ANOVA) 
para  dois  ou  mais  grupos.  O  teste  t  é  muito  usado  porque 
funciona  com  grupos  pequenos  e  é  muito  fácil  de  aplicar 
e  interpretar.  Mas  suas  limitações  incluem:  (1)  acomoda 
apenas  dois  grupos;  e  (2)  pode  avaliar  apenas  uma  variá¬ 
vel  independente  por  vez.  Apesar  de  um  teste  t  poder  ser 
realizado  com  ANOVA,  a  estatística  Ftem  a  habilidade 
de  testar  diferenças  entre  mais  de  dois  grupos,  bem  como 
incluir  mais  de  uma  variável  independente.  Além  disso, 
variáveis  independentes  não  são  limitadas  a  apenas  dois 
níveis,  mas  podem  ter  tantos  níveis  (grupos)  quanto  se 
queira.  MANO  VA  é  considerada  um  procedimento  mul- 
tivariado  por  ser  utilizado  para  avaliar  diferenças  de  gru¬ 
pos  em  múltiplas  variáveis  dependentes  métricas  simulta¬ 
neamente.  Em  MANOVA,  cada  grupo  de  tratamento  é 
observado  quanto  a  duas  ou  mais  variáveis  dependentes. 
Assim,  a  hipótese  nula  é  que  o  vetor  de  médias  para  múl¬ 
tiplas  variáveis  dependentes  é  igual  ao  longo  dos  grupos. 
Os  procedimentos  multivariados  para  teste  de  diferenças 
de  grupos  são  o  7^  de  Hotelling  e  a  análise  multivariada 
de  variância,  respectivamente.* 

Discutir  as  vantagens  de  uma  abordagem  multivariada 
para  teste  de  significância  em  comparação  com  os  méto¬ 
dos  univariados  mais  tradicionais.  Como  procedimentos 
de  inferência  estatística,  as  técnicas  univariadas  (teste  t  e 
ANOVA)  e  suas  extensões  multivariadas  (7^  de  Hotelling 
e  MANOVA)  são  empregadas  para  avaliação  da  signifi¬ 
cância  estatística  de  diferenças  entre  grupos.  No  caso  uni- 
variado,  uma  única  medida  dependente  é  testada  quanto 
a  igualdade  ao  longo  dos  grupos.  No  caso  multivariado, 
uma  variável  estatística  é  testada  quanto  a  igualdade. 
Em  MANOVA,  na  realidade  o  pesquisador  tem  duas  va¬ 
riáveis  estatísticas,  uma  para  as  variáveis  dependentes  e 
outra  para  as  independentes.  A  variável  estatística  de  va¬ 
riáveis  dependentes  é  de  maior  interesse,  pois  as  medidas 
métricas  dependentes  podem  ser  concatenadas  em  uma 
combinação  linear,  como  já  vimos  em  regressão  múltipla 
e  análise  discriminante.  O  aspecto  ímpar  de  MANOVA  é 
que  a  variável  estatística  combina  de  maneira  otimizada 
as  múltiplas  medidas  dependentes  em  um  único  valor  que 
maximiza  as  diferenças  nos  grupos.  Para  analisar  dados 
sobre  múltiplos  grupos  e  variáveis  usando  métodos  uni¬ 
variados,  o  pesquisador  poderia  ficar  tentado  a  conduzir 
testes  t  separados  para  as  diferenças  entre  cada  par  de  mé¬ 
dias  (ou  seja,  grupo  1  versus  2;  grupo  1  versus  3;  e  grupo  2 
versus  3).  Mas  múltiplos  testes  t  inflacionam  a  taxa  geral 
de  erro  Tipo  I.  ANOVA  e  MANOVA  evitam  esta  infla¬ 
ção  de  erro  tipo  I  devido  a  múltiplas  comparações  de  gru¬ 
pos  de  tratamento,  determinando  em  um  único  teste  se  o 
conjunto  inteiro  de  médias  amostrais  sugere  que  as  amos¬ 
tras  foram  extraídas  da  mesma  população  geral.  Ou  seja. 


*  N.  de  R.  T.:  A  frase  correta  seria  “Os  procedimentos  multivariados 
para  teste  de  diferenças  de  dois  grupos  ou  mais  de  dois  são  o  de 
Hotelling  e  a  análise  multivariada  de  variância,  respectivamente. 


ambas  as  técnicas  são  usadas  para  determinar  a  probabi¬ 
lidade  de  que  diferenças  em  médias  ao  longo  de  diversos 
grupos  são  devidas  apenas  a  erro  amostrai. 

Estabelecer  as  suposições  para  o  uso  de  MANOVA.  Os 

procedimentos  de  teste  de  ANOVA  são  válidos  em  um 
sentido  prático  se  consideramos  que  a  variável  dependen¬ 
te  é  normalmente  distribuída,  os  grupos  são  independen¬ 
tes  em  suas  respostas  sobre  a  variável  dependente,  e  que 
variâncias  são  iguais  para  todos  os  grupos  de  tratamento. 
No  entanto,  há  evidência  de  que  testes  Fem  ANOVA  são 
robustos  com  relação  a  essas  suposições,  exceto  em  casos 
extremos.  Para  os  procedimentos  de  teste  de  MANOVA 
serem  válidos,  três  suposições  devem  ser  atendidas:  (1) 
as  observações  devem  ser  independentes,  (2)  as  matrizes 
de  variância-covariância  devem  ser  iguais  para  todos  os 
grupos  de  tratamento  e  (3)  o  conjunto  de  variáveis  depen¬ 
dentes  deve  seguir  uma  distribuição  normal  multivariada. 
Além  de  tais  promissas,  o  pesquisador  deve  considerar 
dois  aspectos  que  influenciam  os  possíveis  efeitos  -  a  line¬ 
aridade  e  a  multicolinearidade  da  variável  estatística  das 
variáveis  dependentes. 

Compreender  como  interpretar  resultados  MANO¬ 
VA.  Se  os  tratamentos  resultam  em  diferenças  estatis¬ 
ticamente  signiflcantes  no  vetor  de  médias  de  variáveis 
dependentes,  o  pesquisador  então  examina  os  resultados 
para  entender  como  cada  tratamento  impacta  as  medidas 
dependentes.  Três  passos  estão  envolvidos:  (1)  interpretar 
os  efeitos  de  covariáveis,  se  incluídas;  (2)  avaliar  quais  va¬ 
riáveis  dependentes  exibem  diferenças  nos  grupos  de  cada 
tratamento;  e  (3)  identificar  se  os  grupos  diferem  em  uma 
só  variável  dependente  ou  na  variável  estatística  depen¬ 
dente  inteira.  Quando  um  efeito  signiflcante  é  descoberto, 
dizemos  que  existe  um  efeito  principal,  o  que  significa  que 
há  diferenças  signiflcantes  entre  as  variáveis  dependentes 
dos  dois  ou  mais  grupos  definidos  pelo  tratamento.  Com 
dois  níveis  de  tratamento,  um  efeito  principal  signiflcante 
garante  que  os  dois  grupos  são  signiflcativamente  distin¬ 
tos.  Com  três  ou  mais  níveis,  porém,  um  efeito  principal 
signiflcante  não  garante  que  todos  os  três  grupos  sejam 
substancialmente  distintos,  mas  apenas  que  existe  pelo 
menos  uma  diferença  signiflcante  em  um  par  de  grupos. 
Se  existe  mais  de  um  tratamento  na  análise,  o  pesquisa¬ 
dor  deve  examinar  os  termos  de  interação  para  ver  se  eles 
são  signiflcantes,  e,  assim  sendo,  se  eles  permitem  ou  não 
uma  interpretação  dos  efeitos  principais.  Se  houver  mais 
de  dois  níveis  para  um  tratamento,  o  pesquisador  deve 
executar  uma  série  de  testes  adicionais  entre  os  grupos 
para  ver  quais  pares  dos  mesmos  são  signiflcantemente 
diferentes. 

Descrever  o  objetivo  de  testes  post  hoc  em  ANOVA  e 
MANOVA.  Apesar  de  os  testes  univariados  e  multiva¬ 
riados  de  ANOVA  e  MANOVA  permitirem  rejeitar  a  hi¬ 
pótese  nula  de  que  as  médias  de  grupos  são  todas  iguais, 
eles  não  apontam  onde  estão  as  diferenças  signiflcantes 
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se  houver  mais  de  dois  grupos.  Testes  t  múltiplos  sem 
qualquer  forma  de  ajuste  não  são  adequados  para  testar 
a  significância  de  diferenças  entre  as  médias  de  pares  de 
grupos  porque  a  probabilidade  de  um  erro  Tipo  I  aumen¬ 
ta  com  o  número  de  comparações  realizadas  entre  grupos 
(semelhante  ao  problema  de  se  usar  múltiplas  ANOVAs 
univariadas  no  lugar  de  MANO  VA).  Se  o  pesquisador 
quer  sistematicamente  examinar  diferenças  de  grupos  nos 
pares  específicos  dos  mesmos  quando  há  uma  ou  mais  me¬ 
didas  dependentes,  dois  tipos  de  testes  estatísticos  devem 
ser  usados:  post  hoc  e  a  priori.  Testes  post  hoc  examinam 
as  variáveis  dependentes  entre  todos  os  possíveis  pares  de 
diferenças  de  grupos  que  são  testados  depois  que  os  pa¬ 
drões  de  dados  foram  estabelecidos.  Testes  a  priori  são 
planejados  de  um  ponto  de  vista  teórico  ou  prático  (to¬ 
madas  de  decisão)  antes  de  olhar  os  dados.  A  principal 
diferença  entre  os  dois  tipos  de  teste  é  que  a  abordagem 
post  hoc  avalia  todas  as  possíveis  combinações,  fornecen¬ 
do  uma  maneira  simples  de  comparações  entre  grupos, 
mas  ao  custo  de  menor  poder.  Testes  a  priori  examinam 
apenas  comparações  especificadas,  de  modo  que  o  pes¬ 
quisador  deve  definir  explicitamente  a  comparação  a  ser 
feita,  mas  com  um  nível  de  poder  resultante  maior.  Qual¬ 
quer  método  pode  ser  usado  para  examinar  uma  ou  mais 
diferenças  de  grupo,  apesar  de  os  testes  a  priori  também 
viabilizarem  ao  pesquisador  controle  sobre  os  tipos  de 
comparações  feitas  entre  grupos. 

Interpretar  resultados  de  interação  quando  mais  de  uma 
variável  independente  é  empregada  em  MANOVA.  O 

termo  de  interação  representa  o  efeito  conjunto  de  dois 
ou  mais  tratamentos.  Sempre  que  um  planejamento  de 
pesquisa  tem  dois  ou  mais  tratamentos,  o  pesquisador 
deve  primeiramente  examinar  as  interações  antes  que 
qualquer  declaração  possa  ser  feita  sobre  os  efeitos  prin¬ 
cipais.  Efeitos  de  interação  são  avaliados  com  os  mesmos 
critérios  dos  efeitos  principais.  Se  os  testes  estatísticos  in¬ 
dicam  que  a  interação  é  não-significante,  isso  denota  que 
os  efeitos  dos  tratamentos  são  independentes.  Indepen¬ 
dência  em  planejamentos  fatoriais  significa  que  o  efeito 
de  um  tratamento  (diferenças  de  grupos)  é  o  mesmo  para 
cada  nível  do(s)  outro(s)  tratamento(s)  e  que  os  efeitos 
principais  podem  ser  diretamente  interpretados.  Se  as  in¬ 
terações  são  consideradas  estatisticamente  significantes,  é 
crucial  que  o  pesquisador  identifique  o  tipo  de  interação 
(ordinal  versus  desordinal),  pois  isso  tem  impacto  direto 
sobre  a  conclusão  que  pode  ser  extraída  dos  resultados. 
Interação  ordinal  ocorre  quando  os  efeitos  de  um  trata¬ 
mento  não  são  iguais  nos  níveis  de  outro  tratamento,  mas 
as  diferenças  de  grupos  estão  sempre  na  mesma  direção. 
Interação  desordinal  acontece  quando  as  diferenças  entre 
níveis  “mudam  de  direção”  dependendo  da  maneira  como 
eles  estão  combinados  com  níveis  de  outro  tratamento. 
Aqui  os  efeitos  de  um  tratamento  são  positivos  para  al¬ 
guns  níveis  e  negativos  para  outros  do  outro  tratamento. 


Descrever  o  propósito  da  análise  multivariada  de  cova- 
riância  (MANCOVA).  Covariáveis  podem  desempe¬ 
nhar  um  importante  papel  ao  incluir  variáveis  métricas  em 
um  planejamento  MANOVA  ou  ANOVA.  No  entanto, 
uma  vez  que  covariáveis  atuam  como  medidas  “de  contro¬ 
le”  sobre  a  variável  estatística  dependente,  elas  devem  ser 
avaliadas  antes  que  os  tratamentos  sejam  examinados.  O 
papel  mais  importante  das  covariáveis  é  o  impacto  geral 
nos  testes  estatísticos  para  os  tratamentos.  O  método  mais 
direto  para  avaliar  esses  impactos  é  fazer  a  análise  com  e 
sem  as  covariáveis.  Covariáveis  efetivas  melhoram  o  po¬ 
der  estatístico  dos  testes  e  reduzem  a  variância  interna  de 
grupos.  Se  o  pesquisador  não  perceber  qualquer  melhora 
substancial,  as  covariáveis  podem  ser  eliminadas,  pois  elas 
reduzem  os  graus  de  liberdade  disponíveis  para  os  testes 
de  efeitos  de  tratamento.  Esta  abordagem  pode  também 
identificar  aqueles  casos  nos  quais  a  covariável  é  “muito 
poderosa”  e  reduz  a  variância  a  um  ponto  em  que  os  tra¬ 
tamentos  são  todos  não-significantes.  Freqüentemente 
isso  acontece  quando  é  incluída  uma  covariável  que  é  cor¬ 
relacionada  com  uma  das  variáveis  independentes  e  assim 
“remove”  esta  variância,  reduzindo  desse  modo  o  poder 
explanatório  da  variável  independente.  Como  MANCO¬ 
VA  e  ANCOVA  são  aplicações  de  procedimentos  de  re¬ 
gressão  dentro  do  método  de  análise  de  variância,  avaliar 
o  impacto  das  covariáveis  sobre  as  variáveis  dependentes 
é  bastante  parecido  com  o  exame  de  equações  de  regres¬ 
são.  Se  o  impacto  geral  é  considerado  significante,  cada 
covariável  pode  ser  examinada  quanto  à  força  da  relação 
preditiva  com  as  medidas  dependentes.  Se  as  covariáveis 
representam  efeitos  teóricos,  então  tais  resultados  forne¬ 
cem  uma  base  objetiva  para  aceitar  ou  rejeitar  as  relações 
propostas.  Sob  uma  perspectiva  prática,  o  pesquisador 
pode  examinar  o  impacto  das  covariáveis  e  eliminar  aque¬ 
las  com  efeito  pequeno  ou  nulo. 

Freqüentemente  não  é  realista  considerar  que  uma 
diferença  entre  tratamentos  experimentais  se  manifeste 
apenas  em  uma  única  variável  dependente  medida.  Mui¬ 
tos  pesquisadores  lidam  com  situações  de  múltiplos  crité¬ 
rios  por  meio  da  aplicação  repetida  de  testes  univariados 
individuais  até  que  todas  as  variáveis  dependentes  tenham 
sido  analisadas.  Essa  abordagem  pode  aumentar  seria¬ 
mente  as  taxas  de  erro  Tipo  I,  e  ignora  a  possibilidade  de 
que  alguma  composição  das  variáveis  dependentes  possa 
fornecer  a  evidência  mais  forte  de  diferenças  de  grupos. 
MANOVA  pode  resolver  os  dois  problemas. 

Questões 

1.  Quais  são  as  diferenças  entre  MANOVA  e  análise  discrimi¬ 
nante?  Quais  situações  são  mais  adequadas  a  cada  técnica 
multivariada? 

2.  Planeje  um  experimento  MANOVA  fatorial  com  dois  fato¬ 
res.  Quais  são  as  diferentes  fontes  de  variância  em  seu  expe¬ 
rimento?  O  que  uma  interação  significante  diria  a  você? 
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3.  Além  da  significância  geral,  ou  global,  há  pelo  menos  três 
abordagens  para  fazer  testes  adicionais:  (a)  uso  de  procedi¬ 
mentos  de  contraste  de  Scheffé;  (b)  análise  stepdown,  que 
é  semelhante  à  regressão  stepwise,  no  sentido  de  que  cada 
estatística  F  sucessiva  é  computada  depois  de  se  eliminarem 
os  efeitos  das  variáveis  dependentes  prévias;  e  (c)  exame 
das  funções  discriminantes.  Faça  uma  lista  das  vantagens  e 
desvantagens  práticas  de  cada  abordagem. 

4.  Como  o  poder  estatístico  é  afetado  por  decisões  de  planeja¬ 
mento  estatístico  e  de  pesquisa?  Como  você  planejaria  um 
estudo  para  garantir  um  poder  adequado? 

5.  Descreva  algumas  situações  de  análise  de  dados  nas  quais 
MANOVA  e  MANCOVA  seriam  adequadas  em  suas 
áreas  de  interesse.  Quais  tipos  de  variáveis  ou  covariáveis 
não  controladas  poderiam  estar  operando  em  cada  situa¬ 
ção? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustram  aspectos  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 

Referêucias 

1.  Anderson,  T.  W.  2003.  Introdiiction  to  Multivariate 
Statistical  Analy sis,  3rd  ed.  New  York:  Wiley. 

2.  Cattell,  R.  B.  (ed.).  1966.  Handbook  o f  Multivariate 
Experimental  Psychology.  Chicago:  Rand  McNally. 

3.  Cohen,  J.  1988.  Statistical  Power  Analysis  for  the 
Behavioral  Sciences,  2nd  ed.  Hillsdale,  NJ:  Lawrence 
Erlbaum  Associates. 

4.  Cole,  D.  A.,  S.  E.  Maxwell,  R.  Avery,  and  E.  Salas.  1994. 
FIow  the  Power  of  MANOVA  Can  Both  Increase  and 
Decrease  as  a  Function  of  the  Intercorrelations  Among 
Dependent  Variables.  Psychological  Bulletin  115:  465- 
74. 

5.  Cooley,  W.  W.,  and  P.  R.  Lohnes.  1971.  Multivariate  Data 
Analysis.  New  York:  Wiley. 

6.  Gill,  J.  2000.  Generalized  Linear  Models:  A  Unified 
Approach,  Sage  University  Papers  Series  on  Quantitative 
Applications  in  the  Social  Sciences,  #07-134.  Thousand 
Oaks,  CA:  Sage. 

7.  Green,  P.  E.  1978.  Analy zing  Multivariate  Data.  Flinsdale, 
IL:  Flolt,  Rinehart  and  Winston. 

8.  Green,  P.  E.,  and  J.  Douglas  Carroll.  1978.  Mathematical 
Tools  for  Applied  Multivariate  Analysis.  New  York: 
Academic  Press. 


9.  Green,  P.  E.,  and  D.  S.  Tull.  1979.  Research  for  Marketing 
Decisions,  3rd  ed.  Upper  Saddle  River,  NJ:-Prentice  Flall. 

10.  Hand,  D.  J.,  and  C.  C.  Taylor.  1987.  Multivariate  Analysis 
of  Variance  and  Repeated  Measures.  London:  Chapman 
and  Flall. 

11.  Flarris,  R.  J.  2001.  A  Primer  of  Multivariate  Statistics,  3rd 
ed.  Flillsdale,  NJ:  Lawrence  Erlbaum  Associates. 

12.  Hubert,  C.  J.,  and  J.  D.  Morris.  1989.  Multivariate  Analysis 
Versus  Multiple  Univariate  Analyses.  Psychological 
Bulletin  105:  302-8. 

13.  Huitema,  B.  1980.  The  Analysis  of  Covariance  and 
Alternatives.  New  York:  Wiley. 

14.  Hutcheson,  G.,  and  N.  Sofroniou.  1999.  The  Multivariate 
Social  Scientist:  Introductory  Statistics  Using  Generalized 
Linear  Models.  Thousand  Oaks,  CA:  Sage. 

15.  Kirk,  R.  E.  1994.  Experimental  Design:  Procedures  for  the 
Behavioral  Sciences,  3rd  ed.  Belmont,  CA:  Wadsworth 
Publishing. 

16.  Koslowsky,  M.,  and  T.  Caspy.  1991.  Stepdown  Analysis 
of  Variance:  A  Refinement.  Journal  of  Organizational 
Behavior  12:  555-59. 

17.  Lãuter,  J.  1978.  Sample  Size  Requirements  for  the  T^ 

Test  of  MANOVA  (Tables  for  One-Way  Classification). 
Biometrical  Journal  20:  389^06. 

18.  McCullagh,  P.,  and  J.  A.  Nelder.  1989.  Generalized  Linear 
Models,  2nd  ed.  New  York:  Chapman  and  Hall. 

19.  Meyers,  J.  L.  1979.  Lundamentals  o f  Experimental  Design. 
Boston:  Allyn  &  Bacon. 

20.  Morrison,  D.  F.  2002.  Multivariate  Statistical  Methods,  4th 
ed.  Belmont,  CA:  Duxbury  Press. 

21.  Nelder,  J.  A.,  and  R.  W.  M.  Wedderburn.  1972.  Generalized 
Linear  Models.  Journal  ofthe  Royal  Statistical  Society,  A, 
135:  370-84. 

22.  Rao,  C.  R.  1978.  Linear  Statistical  Inference  and  Its 
Application,  2nd  ed.  New  York:  Wiley. 

23.  Stevens,  J.  P.  1972.  Four  Methods  of  Analyzing  Between 
Variations  for  the  L-Group  MANOVA  Problem. 
Multivariate  Behavioral  Research  1  (October):  442-54. 

24.  Stevens,  J.  P.  1980.  Power  of  the  Multivariate  Analysis  of 
Variance  Tests.  Psychological  Bulletin  88:  728-37. 

25.  Tatsuoka,  M.  M.  1988.  Multivariate  Analysis:  Techniques 
for  Education  and  Psychological  Research,  2nd  ed.  New 
York:  Macmillan. 

26.  Wilks,  S.  S.  1932.  Certain  Generalizations  in  the  Analysis 
of  Variance.  Biometrika  24:  471-94. 

27.  Winer,  B.  J.,  D.  R.  Brown,  and  K.  M.  Michels.  1991. 
Statistical  Principies  in  Experimental  Design,  3rd  ed.  New 
York:  McGraw-Hill. 


CAPITULO 


Análise  Conjunta 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Explicar  os  muitos  usos  administrativos  da  análise  conjunta. 

■  Conhecer  as  orientações  para  a  seleção  das  variáveis  a  serem  examinadas  pela  análise 
conjunta 

■  Formular  o  plano  experimental  para  uma  análise  conjunta. 

■  Entender  como  criar  planejamentos  fatoriais. 

■  Explicar  o  impacto  da  escolha  de  ordenamento  versus  avaliações  como  a  medida  de 
preferência. 

■  Avaliar  a  importância  relativa  das  variáveis  preditoras  e  cada  um  dos  níveis  em  que  elas 
afetam  os  julgamentos  de  consumidores. 

■  Aplicar  um  simulador  de  escolha  a  resultados  da  análise  conjunta  para  a  previsão  de 
julgamentos  de  consumidores  de  novas  combinações  de  atributos. 

■  Comparar  um  modelo  de  efeitos  principais  e  um  modelo  que  envolva  termos  de  interação  e 
mostrar  como  avaliar  a  validade  de  um  modelo  versus  o  outro. 

■  Reconhecer  as  limitações  da  análise  conjunta  tradicional  e  selecionar  a  metodologia  alternativa 
adequada  (p.ex.,  análise  conjunta  adaptativa  ou  baseada  em  escolhas)  quando  necessário. 


Apresentação  do  capítulo 

Desde  meados  da  década  de  1970,  a  análise  conjunta  tem  atraído  considerável  atenção  como  um  mé¬ 
todo  que  retrata  de  forma  realista  decisões  de  consumidores,  como  trocas  entre  produtos  ou  serviços 
de  múltiplos  atributos  [35].  A  análise  conjunta  ganhou  ampla  aceitação  e  uso  em  muitas  indústrias,  com 
taxas  de  uso  crescentes  em  mais  de  dez  vezes  na  década  de  1980  [114].  Durante  a  década  de  1990, 
a  aplicação  da  análise  conjunta  aumentou  ainda  mais,  se  espalhando  por  quase  todos  os  campos  de 
estudo.  A  crescente  utilização  da  análise  conjunta  em  marketing  no  desenvolvimento  de  novos  pro¬ 
dutos  para  consumidores  levou  á  sua  adoção  em  muitas  outras  áreas,  como  segmentação,  marketing 
industrial,  preços  e  anúncios  [31, 61].  Essa  ascensão  de  uso  nos  Estados  Unidos  também  tem  ocorrido 
paralelamente  em  outras  partes  do  mundo,  particularmente  na  Europa  [119]. 

Coincidiu  com  esse  contínuo  crescimento  o  desenvolvimento  de  métodos  alternativos  para  construir 
as  tarefas  de  escolha  para  consumidores  e  estimar  os  modelos  conjuntos.  A  maioria  das  técnicas  multi- 
variadas  que  discutimos  neste  texto  estabeleceram-se  no  campo  estatístico.  A  análise  conjunta,  porém, 
continuou  e  continuará  a  se  desenvolver  em  termos  de  seu  planejamento,  estimação  e  aplicações  den¬ 
tro  de  muitas  áreas  de  pesquisa  [14]. 

O  uso  de  análise  conjunta  acelerou  com  a  ampla  introdução  de  programas  de  computador  que 
integram  o  processo  inteiro,  desde  a  geração  de  combinações  de  valores  de  variáveis  independentes 
a  serem  avaliados  até  a  criação  de  simuladores  de  escolha  para  prever  escolhas  de  consumidores  em 
muitas  formulações  alternativas  de  produtos  e  serviços.  Eloje  diversos  pacotes  de  grande  uso  podem 
ser  acessados  por  qualquer  pesquisador  que  tenha  um  computador  pessoal  [9,  10,  1 1 , 41 , 86,  87,  88, 
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92,  96,  97],  Além  disso,  a  conversão  do  desenvolvimento  de  pesquisas  em  programas  disponíveis  em 
computadores  pessoais  continua  [14],  e  0  interesse  nesses  softwares  é  crescente  [13,  69,  70]. 

Em  termos  do  modelo  de  dependência  básico  discutido  no  Capítulo  1,  a  análise  conjunta  pode  ser 
expressa  como 

T,  =Xi +X2  +  X3+ ... +X„ 

(não-métrica  ou  métrica)  (não-métricas) 

Com  0  uso  de  variáveis  independentes  não-métricas,  análise  conjunta  faz  lembrar  da  análise  de 
variância  (ANOVA),  que  tem  uma  fundamentação  na  análise  de  experimentos.  Como  tal,  a  análise  con¬ 
junta  é  fortemente  relacionada  com  a  experimentação  tradicional.  Comparemos  um  experimento  tradi¬ 
cional  com  uma  análise  conjunta. 

•  Experimento  tradicional:  Um  químico  em  uma  fábrica  de  sabão  pode  querer  saber  0  efeito  da  tempera¬ 
tura  e  pressão  nos  tambores  de  sabão  sobre  a  densidade  do  produto  final  resultante.  O  químico  poderia 
conduzir  múltiplos  experimentos  laboratoriais  para  medir  essas  relações.  Uma  vez  que  os  experimentos 
fossem  realizados,  eles  poderiam  ser  analisados  com  procedimentos  de  ANOVA  (análise  de  variância) 
como  os  discutidos  no  Capítulo  6. 

•  Análise  conjunta:  Em  situações  que  envolvem  comportamento  humano,  freqüentemente  precisamos 
também  conduzir  "experimentos”  com  os  fatores  que  controlamos.  Por  exemplo,  a  barra  de  sabão  deve 
ser  leve  ou  fortemente  aromatizada?  Ela  deve  ser  promovida  como  cosmética,  ou  limpante  e/ou  deso- 
dorizadora?  Qual  entre  três  preços  deveria  ser  cobrado?  Deveríamos  usar  nossa  marca  de  família  ou 
um  nome  genérico?  A  técnica  de  análise  conjunta  desenvolveu-se  a  partir  da  necessidade  de  analisar 
os  efeitos  dos  fatores  que  controlamos  (variáveis  independentes)  mas  que  são  freqüentemente  especi¬ 
ficados  em  termos  qualitativos  ou  medidos  aproximadamente  [28,  30]. 

Nas  duas  situações,  0  pesquisador  tem  um  número  limitado  de  atributos  que  podem  ser  sistema¬ 
ticamente  variados  em  quantia  ou  caráter  (p.ex.,  temperatura  alta  ou  baixa,  quantia  de  fragrância). 
Apesar  de  podermos  tentar  usar  0  formato  experimental  tradicional  para  compreender  preferências 
de  clientes,  isso  requer  grandes  quantias  de  respondentes  e  só  faz  comparações  entre  grupos  (rever 
0  Capítulo  6  quanto  a  considerações  de  planejamento).  Como  opção,  a  análise  conjunta  oferece  ao 
pesquisador  uma  técnica  que  pode  ser  aplicada  a  um  único  indivíduo  ou  a  um  grupo  de  indivíduos  e 
fornecer  uma  perspectiva  não  apenas  sobre  as  preferências  para  cada  atributo  (p.ex.,  fragrância),  mas 
também  a  quantia  do  mesmo  (leve  ou  alta). 

A  análise  conjunta  é  na  verdade  uma  família  de  técnicas  e  métodos  especificamente  desenvolvidos 
para  entender  preferências  individuais  que  compartilham  uma  fundamentação  teórica  com  base  nos 
modelos  de  integração  de  informação  e  medição  funcional  [58j.  Ela  é  mais  adequada  para  compreen¬ 
der  reações  de  consumidores  e  avaliações  de  combinações  pré-determinadas  de  atributos  que  repre¬ 
sentam  produtos  ou  serviços  potenciais.  A  flexibilidade  e  a  peculiaridade  da  análise  conjunta  surgem  a 
partir  do  que  se  segue: 

•  Uma  habilidade  em  acomodar  tanto  uma  variável  dependente  métrica  quanto  não-métrica 

•  O  uso  de  variáveis  preditoras  categóricas 

•  Suposições  muito  gerais  sobre  as  relações  de  variáveis  independentes  com  a  dependente 

Como  vemos  nas  seções  adiante,  a  análise  conjunta  fornece  ao  pesquisador  uma  visão  substancial  da 
composição  de  preferências  de  consumidores  ao  mesmo  tempo  que  mantém  um  alto  grau  de  realismo. 


Termos-chave 

Antes  de  começar  0  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque  no  capítulo  e  referências  cru¬ 
zadas  nos  termos-chave  estão  em  itálico.  Exemplos  ilustrati¬ 
vos  estão  em  quadros. 

Abordagem  conjunta  baseada  em  escolha  Forma  alternativa 
de  tarefa  conjunta  para  coleta  de  respostas  e  estimação  do 
modelo  conjunto.  A  principal  diferença  é  que  os  respondentes 
selecionam  um  único  estímulo  de  perfil  completo  a  partir  de  um 
conjunto  de  estímulos  (conhecido  como  conjunto  de  escolhas), 
em  vez  de  avaliar  ou  ordenar  cada  estímulo  separadamente. 


Análise  Bayesiana  Procedimento  alternativo  de  estimação  ba¬ 
seado  em  estimativas  de  probabilidade  a  partir  de  casos  in¬ 
dividuais  e  da  população  de  amostra*  que  são  combinadas 
para  estimar  0  modelo  conjunto. 

Análise  conjunta  adaptativa  Metodologia  para  conduzir  uma 
análise  conjunta  que  conta  com  informações  adicionais  de 
respondentes  não  presentes  na  tarefa  conjunta  real  (p.ex., 
importância  de  atributos).  Tal  informação  é  então  usada  para 
adaptar  e  simplificar  a  tarefa  conjunta.  Exemplos  são  os  mo¬ 
delos  auto-explicados  e  adaptativos  ou  híbridos. 


*  N.  de  R.  T:  A  frase  correta  seria  "a  partir  de  observações  de  dados 
reais  e  da  ocorrência  do  conjunto  de  observações  na  população". 


358  Análise  Multivariada  de  Dados 


Análise  conjunta  tradicional  Metodologia  que  emprega  os 
princípios  “clássicos”  da  análise  conjunta  na  tarefa  conjunta, 
usando  um  modelo  aditivo  da  preferência  de  consumidor  e 
métodos  de  apresentação  de  comparação  pareada  ou  de 
perfil  completo. 

Conjunto  de  escolhas  Conjunto  de  estímulos  de  perfil  comple¬ 
to  construído  por  meio  de  princípios  de  delineamento  experi¬ 
mental  e  usado  na  abordagem  baseada  em  esoolha. 

Correlação  ambiental  Ver  correlação  inter-atributos. 

Correlação  inter-atributo  Também  conhecida  como  correla¬ 
ção  ambiental,  é  a  correlação  entre  atributos  que  torna  as 
combinações  de  atributos  inacreditáveis  ou  redundantes. 
Uma  correlação  negativa  descreve  a  situação  na  qual  se 
considera  que  dois  atributos  naturalmente  operam  em  dife¬ 
rentes  direções,  como  potência  e  desempenho  em  termos  de 
quilômetros  percorridos  por  litro  de  gasolina  de  um  veículo. 
Quando  um  aumenta,  o  outro  naturalmente  diminui.  Assim, 
por  conta  dessa  correlação,  todas  as  combinações  desses 
dois  atributos  (p.ex.,  alto  desempenho  e  alta  potência)  são 
inacreditáveis.  Os  mesmos  efeitos  podem  ser  vistos  para  cor¬ 
relações  positivas,  nas  quais  talvez  preço  e  qualidade  são 
considerados  como  positivamente  correlacionados.  Pode  ser 
inacreditável  encontrar  um  produto  de  elevado  preço  e  baixa 
qualidade  em  tal  situação.  A  presença  de  fortes  correlações 
inter-atributos  exige  que  o  pesquisador  examine  cuidadosa¬ 
mente  os  estímulos  apresentados  aos  respondentes  e  evite 
combinações  inacreditáveis  que  não  são  úteis  na  estimação 
das  utilidades  parciais. 

Efeitos  de  interação  Efeitos  de  uma  combinação  de  caracte¬ 
rísticas  relacionadas  (variáveis  independentes),  também  co¬ 
nhecidas  como  termos  de  interação.  Ao  avaliar  o  valor,  uma 
pessoa  pode  designar  um  único  valor  a  combinações  especí¬ 
ficas  de  características  que  vai  contra  a  regra  de  composição 
aditiva.  Por  exemplo,  considere  que  uma  pessoa  está  ava¬ 
liando  produtos  bucais  descritos  pelos  dois  fatores  (atributos) 
de  cor  e  marca.  Considere  ainda  que  essa  pessoa  tem  uma 
preferência  média  pelos  atributos  vermelho  e  marca  X,  quan¬ 
do  considerados  separadamente.  Assim,  quando  essa  com¬ 
binação  específica  de  níveis  (vermelho  e  marca  X)  é  avaliada 
com  a  regra  de  composição  aditiva,  o  produto  vermelho  de 
marca  X  tem  uma  avaliação  de  preferência  geral  esperada  em 
algum  lugar  no  meio  de  todos  os  possíveis  estímulos.  Se,  po¬ 
rém,  a  pessoa  realmente  prefere  o  produto  bucal  vermelho  de 
marca  X  mais  do  que  qualquer  outro  estímulo,  mesmo  algum 
que  esteja  acima  de  outras  combinações  de  atributos  (cor  e 
marca)  que  tenham  melhores  avaliações  das  características 
individuais,  então  uma  interação  é  percebida.  Essa  avaliação 
única  de  uma  combinação  que  é  maior  (ou  poderia  ser  me¬ 
nor)  do  que  o  esperado  com  base  nos  julgamentos  separados 
indica  uma  interação  em  dois  sentidos.  Interações  de  ordem 
mais  alta  (três  sentidos  ou  mais)  podem  ocorrer  entre  mais 
combinações  de  níveis. 

Efeitos  principais  Efeito  direto  de  cada  fator  (variável  indepen¬ 
dente)  sobre  a  variável  dependente.  Pode  ser  complementa¬ 
do  por  efeitos  de  interação  em  situações  específicas. 

Eficiência  de  pianejamento  Grau  em  que  um  planejamento 
condiz  com  um  planejamento  ortogonal.  Essa  medida  é  usada 
principalmente  para  avaliar  e  comparar  planejamentos  quase 


ortogonais.  Os  valores  da  eficiência  de  planejamento  variam 
de  0  a  100,  0  qual  denota  um  planejamento  ótimo. 

Estímuio  Conjunto  específico  de  nivels  (um  por  fator)  avaliado 
por  respondentes  (também  conhecido  como  um  tratamento). 
Os  estímulos  tomam  diferentes  formas  dependendo  do  tipo 
de  apresentação  {perfil  completo,  comparação  pareada  ou 
troca).  Um  método  de  definir  planejamento  de  estímulos  é  o 
planejamento  fatorial,  que  cria  estímulos  separados  para  cada 
combinação  de  todos  os  níveis.  Por  exemplo,  três  fatores  com 
dois  níveis  cada  criariam  oito  (2x2x2)  estímulos.  No  entanto, 
em  muitas  análises  conjuntas,  o  número  total  de  combinações 
é  muito  grande  para  um  respondente  avaliar  todas.  Nesses 
casos,  alguns  subconjuntos  de  estímulos  são  criados  de  acor¬ 
do  com  um  plano  sistemático,  geralmente  um  planejamento 
fatorial  fracionário. 

Estímulos  de  validação  Conjunto  de  estímulos  que  não  são 
usados  na  estimação  de  utilidades  parciais.  As  utilidades 
parciais  estimadas  são  então  usadas  para  prever  a  prefe¬ 
rência  pelos  estímulos  de  validação  para  avaliar  a  validade 
e  a  confiabilidade  das  estimativas  originais.  É  semelhante  em 
conceito  à  amostra  de  validação  de  respondentes  em  análise 
discriminante. 

Estímulos  de  validação  Conjunto  de  estímulos  que  não  são 
usados  na  estimação  de  utilidades  parciais.  Utilidades  par¬ 
ciais  estimadas  são  então  usadas  para  prever  preferência  a 
estímulo  de  validação  para  avaliar  validade  e  confiabilidade 
das  estimativas  originais.  Conceitualmente  semelhante  à 
amostra  de  validação  de  respondentes  em  análise  discri¬ 
minante. 

Estrutura  de  preferência  Representação  da  importância  ou  uti¬ 
lidade  relativa  de  cada  fator e  do  impacto  de  níveis  individuais 
que  afetam  a  utilidade. 

Fator  Variável  Independente  que  o  pesquisador  manipula  e  que 
representa  um  atributo  específico.  Na  análise  conjunfa,  os  fa¬ 
tores  são  não-mêtricos.  Os  fatores  devem  ser  representados 
por  dois  ou  mais  valores  (também  conhecidos  como  níveis), 
os  quais  também  são  especificados  pelo  pesquisador. 

Heterogeneidade  de  respondente  A  variação  em  utilidades 
parciais  ao  longo  de  Indivíduos  específicos  encontrados  em 
modelos  desagregados.  Quando  modelos  agregados  são 
estimados,  modificações  no  processo  de  estimação  podem 
diminuir  esta  variação  esperada  em  utilidades  parciais. 

Inversão  Uma  violação  de  uma  relação  monotõnica,  na  qual  a 
utilidade  parcial  estimada  para  um  nível  é  maior/menor  do  que 
deveria  ser  em  relação  a  outro  nível.  Por  exemplo,  em  distân¬ 
cias  percorridas  a  lojas,  aquelas  mais  próximas  são  imagina¬ 
das  como  tendo  maior  utilidade  do  que  aquelas  mais  afasta¬ 
das.  Uma  inversão  aconteceria  quando  uma  distância  maior 
tiver  uma  utilidade  parcial  maior  do  que  uma  distância  menor. 

Método  de  comparação  pareada  (ou  aos  pares)  Método  de 
apresentar  um  par  de  estímulos  a  um  respondente  para  ava¬ 
liação  em  que  o  respondente  seleciona  um  estímulo  como 
preferido. 

Método  de  perfil  completo  Método  para  reunir  avaliações  de 
respondentes  apresentando  estímulos  que  são  descritos 
em  termos  de  todos  os  fatores.  Por  exemplo,  considere  que 
um  doce  tenha  sido  descrito  por  três  fatores  com  dois  níveis 
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cada:  preço  (15  ou  25  centavos),  sabor  (cítrico  ou  caramelo) 
e  cor  (branco  ou  vermelho).  Um  estímulo  de  perfil  completo 
seria  definido  por  um  nível  de  cada  fator.  Um  exemplo  de  estí¬ 
mulo  de  perfil  completo  seria  um  doce  vermelho  de  caramelo 
que  custasse  15  centavos. 

Método  de  troca*  Método  para  apresentar  estímulos  a  respon- 
dentes  no  qual  fatores  (atributos)  são  descritos  dois  por  vez  e 
os  respondentes  ordenam  todas  as  combinações  dos  níveis 
em  termos  de  preferência. 

Modelo  adaptativo  Técnica  para  simplificar  a  análise  conjunta 
combinando  os  modelos  conjuntos  auto-explicadose  tradicio¬ 
nais.  O  exemplo  mais  comum  é  a  Análise  Conjunta  Adaptativa 
(ACA)  da  Sawtooth  Software. 

Modelo  aditivo  Modelo  baseado  na  regra  de  composição  aditi¬ 
va,  que  oonsidera  que  indivíduos  simplesmente  “adicionam” 
as  utilidades  parciais  para  calcular  um  escore  geral  ou  valor 
total  que  indica  utilidade  ou  preferência.  É  também  conhecido 
como  um  modelo  de  efeitos  principais  e  é  0  modelo  conjunto 
mais  simples  em  termos  do  número  de  avaliações  e  do  proce¬ 
dimento  de  estimação  necessários. 

Modelo  auto-explicado  Técnica  composicional  para  executar 
análise  conjunta  na  qual  0  respondente  fornece  as  estimativas 
das  utilidades  parciais  diretamente,  sem  fazer  escolhas. 

Modelo  composicional  Classe  de  modelos  multivariados  que 
estima  a  relação  de  dependência  com  base  em  observações 
do  respondente  referentes  ãs  variáveis  dependente  e  inde¬ 
pendentes.  Esses  modelos  calculam  ou  “compõem"  a  variável 
dependente  a  partir  dos  valores  fornecidos  pelo  respondente 
para  todas  as  variáveis  independentes.  Os  principais  entre 
esses  métodos  são  a  análise  de  regressão  e  a  análise  dis¬ 
criminante.  Esses  modelos  estão  em  contraste  direto  com  os 
modelos  decomposicionais. 

Modelo  decomposicional  Classe  de  modelos  multivariados 
que  decompõem  as  respostas  individuais  para  estimar  a  rela¬ 
ção  de  dependência.  Essa  classe  de  modelos  apresenta  ao 
respondente  um  conjunto  pré-definido  de  objetos  (p.ex.,  pro¬ 
dutos  ou  serviços  hipotéticos  ou  reais)  e  então  pede  uma  ava¬ 
liação  ou  preferência  geral  do  objeto.  Uma  vez  dada,  a  ava¬ 
liação/preferência  é  decomposta  relacionando-se  os  atributos 
conheoidos  do  objeto  (que  se  tornam  as  variáveis  indepen¬ 
dentes)  com  a  avaliação  (variável  dependente).  O  principal 
entre  esses  modelos  é  a  análise  conjunta  e  algumas  formas 
de  escalonamento  multidimensional  (ver  Capítulo  9). 

Modelo  híbrido  Ver  modelo  adaptativo. 

Nível  Valor  não-métrico  específico  que  descreve  um  fator.  Cada 
fator  deve  ser  representado  por  dois  ou  mais  níveis,  mas  0  nú¬ 
mero  de  níveis  normalmente  jamais  excede  quatro  ou  cinco. 
Se  0  fator  é  métrico,  deve  ser  reduzido  a  um  pequeno  núme¬ 
ro  de  níveis  não-métricos.  Por  exemplo,  os  inúmeros  valores 
possíveis  de  tamanho  e  preço  podem  ser  representados  por 
um  pequeno  número  de  níveis:  tamanho  (10,  12  ou  16  quilo¬ 
gramas);  ou  preço  ($1,19,  $1,39  ou  $1,99).  Se  0  fator  é  não- 
métrico,  os  valores  originais  podem  ser  usados  como  nesses 


*  N.deR.T:  A  palavra  írade-off  será  traduzida  como  troca,  para  simpli¬ 
ficação  do  texto.  A  troca,  no  contexto  da  análise  conjunta,  consiste  no 
processo  de  balancear  ou  comparar  situações  diferentes,  ou  mesmo 
opostas,  e  optar  por  uma  delas. 


exemplos:  cor  (vermelho  ou  azul);  marca  (X,  Y  ou  Z);  ou  aditi¬ 
vo  amaciante  de  fábrica  (presente  ou  ausente). 

Ortogonalidade  Restrição  matemátioa  que  exige  que  as  esti¬ 
mativas  das  utilidades  parciais  sejam  independentes  uma  da 
outra.  Na  análise  conjunta,  a  ortogonalidade  se  refere  à  habili¬ 
dade  de  medir  0  efeito  de  mudança  de  cada  nível  de  atributo 
e  de  sua  separação  dos  efeitos  de  mudança  de  outros  níveis 
de  atributo  e  de  erro  experimental. 

Par  proibido  Uma  combinação  específica  de  níveis  de  dois  fato¬ 
res  que  é  proibida  de  ocorrer  na  criação  de  estímulos.  A  causa 
mais  comum  é  a  correlação  inter-atributos  entre  os  fatores. 

Planejamento  Conjunto  específico  de  estímulos  conjuntos  cria¬ 
do  para  exibir  as  propriedades  estatísticas  de  ortogonalidade 
e  balanço  fou  equilíbrio). 

Planejamento  balanceado  Planejamento  de  estímulos  no  qual 
cada  nível  dentro  de  um  fator  aparece  um  número  igual  de 
vezes  nos  estímulos  da  tarefa  conjunta. 

Planejamento  de  ligação  Planejamento  de  estímulos  para  mui¬ 
tos  fatores  (atributos)  no  qual  os  atributos  são  transformados 
em  vários  grupos  menores.  Cada  grupo  de  atributo  tem  al¬ 
guns  atributos  contidos  em  outros  grupos,  de  modo  que  os 
resultados  de  cada  um  podem  ser  combinados  ou  ligados. 

Planejamento  fatorial  Método  para  planejar  estímulos  geran¬ 
do  todas  as  possíveis  combinações  de  níveis.  Por  exemplo, 
uma  análise  conjunta  de  três  fatores  com  três  níveis  por  fator 
(3x3x3)  resultaria  em  27  combinações  que  poderiam  atuar 
como  estímulos  na  tarefa  conjunta. 

Planejamento  fatorial  fracionário  Método  de  planejamento  de 
estímulos  (ou  seja,  uma  alternativa  a  um  planejamento  fatoriaf) 
que  emprega  apenas  um  subconjunto  dos  possíveis  estímulos 
necessários  para  estimar  os  resultados  com  base  na  regra  de 
composição  assumida.  Sua  tarefa  principal  é  reduzir  0  número 
de  avaliações  coletadas  enquanto  ainda  mantém  ortogonali¬ 
dade  entre  os  níveis  e  as  estimativas  subseqüentes  das  utili¬ 
dades  parciais.  Atinge-se  este  objetivo  pelo  delineamento  de 
estímulos  que  pode  estimar  só  um  subconjunto  de  todos  os 
efeitos  possíveis.  O  planejamento  mais  simples  é  um  modelo 
aditivo,  no  qual  apenas  efeitos  principais  são  estimados.  Se 
termos  de  interação  selecionados  são  incluídos,  estímulos  adi¬ 
cionais  são  criados.  O  delineamento  pode  ser  criado  consul¬ 
tando  fontes  publicadas  ou  usando  programas  de  computador 
que  acompanham  a  maioria  dos  paootes  de  análise  conjunta. 

Planejamento  ótimo  Delineamento  de  estímulos  que  é  ortogo¬ 
nal  e  balanceado. 

Quase  ortogonal  Característica  de  um  planejamento  de  estí¬ 
mulos  que  não  é  ortogonal,  mas  no  qual  os  desvios  da  orto¬ 
gonalidade  são  pequenos  e  cuidadosamente  controlados  na 
geração  dos  estímulos.  Esse  tipo  de  delineamento  pode  ser 
comparado  com  outros  delineamentos  de  estímulos  com  me¬ 
didas  de  eficiência  de  planejamento. 

Regra  de  composição  Regra  usada  para  representar  como  res¬ 
pondentes  combinam  atributos  para  produzir  um  julgamento 
de  valor  ou  utilidade  relativa  para  um  produto  ou  serviço.  Para 
fins  de  ilustração,  suponha  que  uma  pessoa  seja  solicitada  a 
avaliar  quatro  objetos.  Considera-se  que  a  pessoa  avalia  os 
atributos  dos  quatro  objetos  e  cria  algum  valor  relativo  geral 
para  cada  um.  A  regra  pode  ser  simples,  como  a  criação  de 
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um  peso  mental  para  cada  atributo  percebido  e  a  soma  de  pe¬ 
sos  para  um  escore  geral  {modelo  aditivo),  ou  pode  ser  um  pro¬ 
cedimento  mais  complexo  que  envolva  efeitos  de  interação. 

Relação  monotônica  Suposição  do  pesquisador  de  que  uma 
ordem  de  preferência  entre  níveis  deve  se  aplicar  às  estimati¬ 
vas  de  utilidades  parciais.  Exemplos  podem  incluir  fatores  ob¬ 
jetivos  (distância  menor  para  viagem  é  preferível  do  que  dis¬ 
tância  maior)  ou  mais  subjetivos  (qualidade  maior  é  preferível 
a  qualidade  inferior).  A  implicação  é  que  as  utilidades  parciais 
estimadas  devem  ter  alguma  ordenação  nos  valores,  e  viola¬ 
ções  (conhecidas  como  inversões)  devem  ser  abordadas. 

Simulador  de  escolha  Procedimento  que  permite  ao  pesquisa¬ 
dor  avaliar  diversos  cenários  do  tipo  "o  que  aconteceria  se”. 
Assim  que  as  utilidades  parciais  conjuntas  tenham  sido  esti¬ 
madas  para  cada  respondente,  o  simulador  de  escolha  anali¬ 
sa  um  conjunto  de  estímulos  de  perfil  completo  e  prevê  esco¬ 
lhas  individuais  e  agregadas  para  cada  estímulo  no  conjunto. 
Conjuntos  múltiplos  de  estímulos  podem  ser  analisados  para 
representar  qualquer  cenário  (p.ex.,  preferências  por  produto 
ou  configurações  de  serviços  hipotéticos  ou  por  interações 
competitivas  entre  estímulos  considerados  componentes  de 
um  mercado). 

Tarefa  conjunta  O  procedimento  para  reunir  julgamentos  sobre 
cada  estímulo  no  planejamento  conjunto  usando  um  dos  três 
tipos  de  método  de  apresentação  (ou  seja,  perfil  completo, 
comparação  aos  pares  ou  trocas). 

Tratamento  Ver  estímulo. 

Utilidade  parcial  Estimativa  da  análise  conjunta  da  preferência 
ou  utilidade  geral  associada  a  cada  nível  de  cada  fator  usado 
para  definir  o  produto  ou  serviço. 

Utilidade  Um  julgamento  subjetivo  de  preferência  por  indiví¬ 
duo  que  representa  o  valor  ou  utilidade  holística  de  um  objeto 
específico.  Em  análise  conjunta,  utilidade  é  assumida  como 
sendo  formada  pela  combinação  de  estimativas  de  utilidades 
parciais  para  qualquer  conjunto  especificado  de  níveis  com  o 
uso  de  um  modelo  aditivo,  talvez  em  conjunção  com  efeitos 
de  interação. 

Variável  estatística  conjunta  Combinação  de  variáveis  inde¬ 
pendentes  (conhecidas  como  fatores)  especificadas  pelo 
pesquisador  que  constituem  o  valor  ou  a  utilidade  total  dos 
estímulos. 


O  QUE  É  ANÁLISE  CONJUNTA? 

Análise  conjunta  é  uma  técnica  multivariada  usada  especi¬ 
ficamente  para  entender  como  os  respondentes  desenvol¬ 
vem  preferências  por  quaisquer  tipos  de  objetos  (produ¬ 
tos,  serviços  ou  idéias).  É  baseada  na  premissa  simples  de 
que  os  consumidores  avaliam  o  valor  de  um  objeto  (real 
ou  hipotético)  combinando  as  quantias  separadas  de  valor 
fornecidas  por  cada  atributo.  Além  disso,  clientes  podem 
fornecer  melhor  suas  estimativas  de  preferência  julgando 
objetos  formados  por  combinações  de  atributos. 

Utilidade,  um  julgamento  subjetivo  de  preferência 
único  para  cada  indivíduo,  é  o  conceito  mais  fundamental 
em  análise  conjunta  e  a  base  conceituai  para  medir  va¬ 


lor.  O  pesquisador  que  usa  análise  conjunta  para  estudar 
quais  coisas  determinam  utilidade  deve  considerar  diver¬ 
sas  questões-chave: 

•  Utilidade  engloba  todas  as  características  do  objeto,  tangí¬ 
veis  ou  intangíveis,  e  como  tal  é  uma  medida  de  preferência 
geral  de  um  indivíduo. 

•  Utilidade  é  considerada  baseada  no  valor  colocado  em  cada 
um  dos  níveis  dos  atributos.  Fazendo  isso,  respondentes 
reagem  a  várias  combinações  de  níveis  de  atributos  (p.ex., 
diferentes  preços,  características  ou  marcas)  com  variados 
níveis  de  preferência. 

•  Utilidade  é  expressa  por  uma  relação  que  reflete  a  manei¬ 
ra  como  a  utilidade  é  formulada  para  qualquer  combinação 
de  atributos.  Por  exemplo,  poderíamos  somar  os  valores  de 
utilidade  associados  a  cada  característica  de  um  produto  ou 
serviço  para  chegar  a  uma  utilidade  geral.  Então  assumiría¬ 
mos  que  produtos  ou  serviços  com  maiores  valores  de  utili¬ 
dade  são  preferidos  e  têm  uma  maior  chance  de  escolha. 

Para  ser  bem-sucedido  na  definição  de  utilidade,  o  pes¬ 
quisador  deve  ser  capaz  de  descrever  o  objeto  em  termos 
de  seus  atributos  e  todos  os  valores  relevantes  para  cada 
atributo.  Para  fazer  isso,  o  pesquisador  deve  ser  capaz  de 
abordar  com  precisão  três  questões: 

1.  Um  fator  representa  um  atributo  específico  ou  outra  caracte¬ 
rística  do  produto  ou  serviço.  Para  definir  com  precisão  utili¬ 
dade,  o  pesquisador  deve  identificar  todos  os  atributos  impor¬ 
tantes  que  poderiam  afetar  preferência  e,  assim,  utilidade. 

2.  Cada  fator  é  definido  por  seus  níveis,  que  são  os  valores 
possíveis  para  aquele  fator.  Tais  valores  permitem  ao  pes¬ 
quisador  descrever  um  objeto  em  termos  de  seus  níveis  no 
conjunto  de  fatores  que  o  caracterizam.  Por  exemplo,  nome 
de  marca  e  preço  poderiam  ser  dois  fatores  em  uma  análise 
conjunta.  O  nome  de  marca  poderia  ter  dois  níveis  (marca 
X  e  marca  Y),  ao  passo  que  o  preço  poderia  ter  quatro  ní¬ 
veis  (39, 49,  59  e  69  centavos). 

3.  Quando  o  pesquisador  seleciona  os  fatores  e  os  níveis  para 
descrever  um  objeto  de  acordo  com  um  plano  específico,  a 
combinação  é  conhecida  como  um  tratamento  ou  estímulo. 
Portanto,  um  estímulo  para  nosso  exemplo  simples  poderia 
ser  a  marca  X  a  49  centavos. 

A  análise  conjunta  é  única  entre  os  métodos  multiva- 
riados,  no  sentido  de  que  o  pesquisador  primeiro  constrói 
um  conjunto  de  produtos  ou  serviços  reais  ou  hipotéticos 
combinando  níveis  selecionados  de  cada  atributo.  Criar 
essas  combinações  resulta  em  um  planejamento,  que  é  o 
conjunto  de  estímulos  apresentados  ao  respondente.  Essas 
combinações  ou  estímulos  são  então  apresentados  a  res¬ 
pondentes,  os  quais  fornecem  apenas  suas  avaliações  ge¬ 
rais,  em  um  processo  chamado  de  tarefa  conjnnta.  Assim, 
o  pesquisador  está  pedindo  ao  respondente  para  realizar 
uma  tarefa  realista  -  escolher  de  um  conjunto  de  objetos. 
Os  respondentes  nada  mais  precisam  dizer  ao  pesquisador, 
como  o  quão  importante  é  um  atributo  individual  para  eles 
ou  o  quão  bem  o  objeto  funciona  em  relação  a  um  atributo 
específico.  Como  o  pesquisador  construiu  os  objetos  hipo¬ 
téticos  de  uma  maneira  específica,  a  influência  de  cada  atri¬ 
buto  e  de  cada  valor  de  cada  atributo  sobre  o  julgamento 
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de  um  respondente  quanto  a  utilidade  pode  ser  determina-  quão  importante  cada  fator  é  na  decisão  geral,  mas  também 
da  a  partir  das  avaliações  gerais  dos  respondentes.  como  os  níveis  distintos  dentro  de  um  fator  influenciam  a 

formação  de  uma  preferência  geral  (utilidade). 


UM  EXEMPLO  HIPOTÉTICO 
DE  ANÁLISE  CONJUNTA 

Como  uma  ilustração,  consideramos  uma  análise  conjunta 
simples  para  um  produto  hipotético  com  três  atributos.  Pri¬ 
meiro  descrevemos  o  processo  de  definição  de  utilidade  em 
termos  de  atributos  (fatores)  e  os  possíveis  valores  de  cada 
atributo  (níveis).  Com  os  fatores  especificados,  o  processo 
de  coleta  de  dados  de  preferência  através  de  avaliações  de 
estímulos  é  discutido,  seguido  de  uma  visão  geral  da  esti¬ 
mação  de  utilidade  associada  com  cada  fator  e  nível. 

Especificação  de  utilidade, 
fatores,  níveis  e  estímulos 

A  primeira  tarefa  é  definir  os  atributos  que  constituem 
utilidade  para  o  produto  sob  estudo.  Uma  questão-chave 
envolve  a  definição  dos  atributos  que  verdadeiramente 
afetam  preferências  e,  a  seguir,  o  estabelecimento  dos  va¬ 
lores  mais  apropriados  para  os  níveis. 


Imaginemos  que  a  HBAT*  esteja  tentando  desenvolver 
um  novo  produto:  um  detergente  industrial.  Após  dis¬ 
cussão  com  representantes  de  vendas  e  grupos  de  inte¬ 
resse,  o  administrador  decide  que  três  atributos  são  im¬ 
portantes:  ingredientes  de  limpeza,  forma  de  uso  e  nome 
da  marca.  Para  operacionalizar  esses  atributos,  os  pes¬ 
quisadores  criam  três  fatores  com  dois  níveis  cada: 


Fator 

Níveis 

Ingredientes 

Forma 

Nome  da  marca 

Sem  fosfato  Com  fosfato 

Líquido  Pó 

HBAT  Marca  genérica 

Um  detergente  hipotético  pode  ser  construído  sele¬ 
cionando-se  um  nível  de  cada  atributo.  Para  os  três  atri¬ 
butos  (fatores)  com  dois  valores  (níveis),  oito  (2  x  2  x 
2)  combinações  podem  ser  formadas.  Três  exemplos  das 
oito  possíveis  combinações  (estímulos)  são: 

•  Pó  HBAT  sem  fosfato 

•  Líquido  genérico  com  fosfato 

•  Líquido  genérico  sem  fosfato 


Construindo  combinações  específicas  (estímulos),  o  pes¬ 
quisador  tenta  entender  uma  estrutura  de  preferêucia  do 
respondente.  A  estrutura  de  preferência  explica  não  apenas 


*  N.  de  R.  T.:  Este  mesmo  exemplo  foi  apresentado  na  5®  edição  deste 
livro,  a  qual  apresentava  a  base  de  dados  da  HATCO,  uma  grande 
fornecedora  industrial,  diferentemente  da  HBAT,  definida  como 
uma  fabricante  de  produtos  de  papel. 


Obtenção  de  preferências  a 
partir  dos  respondentes 

Com  os  estímulos  definidos  em  termos  dos  atributos  que 
dão  origem  à  utilidade,  o  próximo  passo  é  reunir  avalia¬ 
ções  de  preferências  a  partir  de  respondentes.  Este  proces¬ 
so  mostra  por  que  a  análise  conjunta  também  é  conhecida 
como  análise  de  troca,  pois  ao  se  fazer  um  julgamento  sobre 
um  produto  hipotético,  os  respondentes  devem  considerar 
as  características  “boas”  e  “ruins”  do  produto  ao  formar 
uma  preferência.  Assim,  os  respondentes  devem  ponde¬ 
rar  todos  os  atributos  simultaneamente  ao  fazer  seus  jul¬ 
gamentos.  Respondentes  podem  ordenar  os  estímulos  em 
termos  de  preferência  ou  avaliar  cada  combinação  sobre 
uma  escala  de  preferência  (talvez  uma  escala  de  1  a  10). 


Em  nosso  exemplo,  a  análise  conjunta  avalia  o  impacto 
relativo  de  cada  nome  de  marca  (HBAT  versus  nome 
genérico),  cada  forma  (pó  versus  líquido)  e  os  diferentes 
ingredientes  de  limpeza  (sem  fosfato  versus  com  fosfato) 
ao  determinar  a  utilidade  de  uma  pessoa  pela  avaliação 
dos  oito  estímulos.  Cada  respondente  foi  colocado  dian¬ 
te  de  oito  descrições  de  produtos  de  limpeza  (estímulos) 
e  foi  solicitado  a  colocá-las  em  ordem  de  preferência 
para  compra  (1  =  mais  preferido  e  8  =  menos  preferido). 
Os  oito  estímulos  são  descritos  na  Tabela  7-1,  com  as  or¬ 
dens  de  preferência  dadas  por  dois  respondentes. 


Essa  utilidade,  que  representa  o  valor  total  ou  prefe¬ 
rência  geral  de  um  objeto,  pode  ser  imaginada  como  a 
soma  daquilo  que  as  partes  do  produto  valem,  ou  utili¬ 
dades  parciais.  A  forma  geral  de  um  modelo  de  análise 
conjunta  pode  ser  mostrada  como 

(Valor  total  para  produto), Utilidade  parcial  do  ní¬ 
vel  i  para  o  fator  1 

-t-  Utilidade  parcial  do  nível  j  para  o  fator  2  +. . . 

+  Utilidade  parcial  do  nível  n  para  o  fator  m 

onde  o  produto  ou  serviço  tem  m  atributos,  cada  um 
com  n  níveis.  O  produto  consiste  no  nível  i  do  fator  1, 
nível  j  do  fator  1,  e  assim  por  diante  até  o  nível  n  para 
o  fator  m. 


Em  nosso  exemplo,  o  modelo  mais  simples  representa 
a  estrutura  de  preferência  para  o  detergente  industrial 
com  base  na  adição  de  três  fatores  (utilidade  =  efeito  da 
marca  +  efeito  do  ingrediente  +  efeito  da  forma).  Este 
formato  é  conhecido  como  um  modelo  aditivo,  a  ser 
abordado  posteriormente.  A  preferência  por  um  produ¬ 
to  de  limpeza  específico  pode  ser  diretamente  calculada 

{Continua) 
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TABELA  7-1  Descrições  de  estímulos  e  ordenações  de  respondentes  para  análise  conjunta  de 
exemplo  de  detergente  industrial 


Estímulo  # 

DESCRIÇÕES  DE  ESTÍMULOS 

Níveis  de: 

Ordenações  de  respondentes 

Forma 

Ingredientes 

Marca 

Respondente  1 

Respondente  2 

1 

Líquido 

Sem  fosfato 

HBAT 

1 

1 

2 

Líquido 

Sem  fosfato 

Genérico 

2 

2 

3 

Líquido 

Com  fosfato 

HBAT 

5 

3 

4 

Líquido 

Com  fosfato 

Genérico 

6 

4 

5 

Pó 

Sem  fosfato 

HBAT 

3 

7 

6 

Pó 

Sem  fosfato 

Genérico 

4 

5 

7 

Pó 

Com  fosfato 

HBAT 

7 

8 

8 

Pó 

Com  fosfato 

Genérico 

8 

6 

Note:  Os  oito  estímulos  representam  todas  as  combinações  dos  três  atributos,  cada  um  com  dois  níveis  (2  x  2  x  2). 
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a  partir  de  valores  de  utilidade  parcial.  Por  exemplo,  a 
preferência  pelo  HBAT  em  pó  sem  fosfato  é 

Utilidade  =  Utilidade  parcial  da  marca  HBAT 

+  Utilidade  parcial  do  ingrediente  de  lim¬ 
peza  sem  fosfato 
+  Utilidade  parcial  do  pó 


Com  as  estimativas  das  utilidades  parciais,  a  preferên¬ 
cia  de  um  indivíduo  pode  ser  estimada  por  qualquer  com¬ 
binação  de  fatores.  Além  disso,  a  estrutura  de  preferência 
revelaria  os  fatores  mais  importantes  na  determinação 
de  utilidade  geral  e  escolha  de  produto.  As  escolhas  de 
múltiplos  respondentes  também  poderiam  ser  combina¬ 
das  para  representar  o  ambiente  competitivo  percebido 
no  mundo  real. 

Estimação  das  utilidades  parciais 

Como  estimamos  as  utilidades  parciais  para  cada  nível 
quando  temos  apenas  as  avaliações  ou  ordenações  dos  es¬ 
tímulos?  Na  discussão  adiante  examinamos  como  as  ava¬ 
liações  de  cada  estímulo  podem  ser  usadas  para  estimar  as 
utilidades  parciais  para  cada  nível  e,  em  última  instância, 
para  definir  a  importância  de  cada  atributo  também. 


Para  ilustrar  uma  análise  conjunta  simples,  podemos 
examinar  as  respostas  do  respondente  1.  Se  nos  concen¬ 
tramos  primeiramente  na  ordenação  para  cada  atributo, 
percebemos  que  as  ordenações  para  os  estímulos  com  os 
ingredientes  sem  fosfato  são  as  mais  altas  possíveis  (1, 
2,  3  e  4),  enquanto  os  ingredientes  baseados  em  fosfato 
têm  as  quatro  colocações  mais  baixas  (5,  6,  7  e  8).  Logo, 
os  ingredientes  sem  fosfato  são  claramente  preferidos 
em  relação  ao  detergente  com  fosfato.  Isso  pode  ser  con¬ 
trastado  com  as  ordenações  para  cada  nível  de  marca, 
que  mostra  uma  mistura  de  postos  altos  e  baixos  para 
cada  marca. 


Assumindo  que  o  modelo  básico  (um  modelo  aditi¬ 
vo)  se  aplique,  podemos  calcular  o  impacto  de  cada  nível 
como  diferenças  (desvios)  da  ordenação  média  geral.  (Os 
leitores  podem  observar  que  isso  é  análogo  à  regressão 
múltipla  com  variáveis  dicotômicas  ou  ANOVA.) 


Por  exemplo,  as  ordenações  médias  para  os  dois  ingre¬ 
dientes  dos  detergentes  (sem  fosfato  versus  com  fosfato) 
para  o  respondente  1  são: 

Sem  fosfato:  (í  +  2  +  3  +  4)/4  =  2,5 

Baseado  em  fosfato:  (5  -t  6  -t  7  -t  8)/4  =  6,5 

Com  a  ordenação  média  dos  oito  estímulos  de  4,5  [(1 
+  2  +  3  +  A  +  5  +  6  +  1  +  8)/8  =  36/8  =  4,5],  o  nível  sem 
fosfato  teria  então  um  desvio  de  -2,0  (2,5  -  4,5)  da  média 
geral,  enquanto  o  nível  com  fosfato  teria  um  desvio  de 
-h2,0  (6,5  -  4,5).  As  ordenações  médias  e  os  desvios  para 
cada  fator  em  relação  à  ordenação  média  geral  (4,5)  para 
os  respondentes  1  e  2  são  dadas  na  Tabela  7-2. 

Neste  exemplo,  usamos  números  menores  para  indi¬ 
car  postos  mais  elevados  e  um  estímulo  preferido  (p.ex., 
1  =  mais  preferido).  Quando  a  medida  de  preferência 
é  inversamente  relacionada  à  preferência,  como  aqui, 
invertemos  os  sinais  dos  desvios  nos  cálculos  das  utili¬ 
dades  parciais,  de  modo  que  os  desvios  positivos  serão 
associados  às  utilidades  parciais  que  indicam  maior  pre¬ 
ferência. 


Podemos  aplicar  este  método  básico  a  todos  os  fatores 
e  calcular  as  utilidades  parciais  de  cada  nível  em  quatro 
passos: 

Passo  1:  Eleve  os  desvios  ao  quadrado  e  faça  sua  soma  por  to¬ 
dos  os  níveis. 

Passo  2:  Calcule  um  valor  de  padronização  que  seja  igual  ao  nú¬ 
mero  total  de  níveis  dividido  pela  soma  de  desvios  ao 
quadrado. 

Passo  3:  Padronize  cada  desvio  quadrado  multiplicando-o  pelo 
valor  de  padronização. 
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TABELA  7-2  Ordenações  médias  e  desvios  para  respondentes  1  e  2 


Nível  de  fator  por  atributo 

Ordenações  nos  estímulos 

Ordem  média  de  nível 

Desvio  da  ordem  média  geral^ 

Respondente  1 

Forma 

Líquido 

1,2,  5,  6 

3,5 

-1,0 

Pó 

3,  4,  7,8 

5,5 

+  1,0 

Ingredientes 

Sem  fosfato 

1,  2,  3,  4 

2,5 

-2,0 

Com  fosfato 

5,  6,  7,  8 

6,5 

+2,0 

Marca 

HBAT 

1,3,  5,  7 

4,0 

-0,5 

Genérico 

2,  4,  6,  8 

5,0 

+0,5 

Respondente  2 

Forma 

Líquido 

1,  2,  3,  4 

2,5 

-2,0 

Pó 

5,  6,  7,  8 

6,5 

+2,0 

Ingredientes 

Sem  fosfato 

1,  2,  5,  7 

3,75 

-0,75 

Com  fosfato 

3,  4,  6,  8 

5,25 

+0,75 

Marca 

HBAT 

1,3,  7,  8 

4,75 

+0,25 

Genérico 

2,  4,  5,  6 

4,25 

-0,25 

“Desvio  calculado  como  desvio  =  Ordenação  média  de  nível  -  Ordenação  média  gerai  (4,5).  Observe  que  desvios  negativos  impiicam  ordena¬ 
ções  de  maior  preferência. 


Passo  4:  Estime  a  utilidade  parcial  calculando  a  raiz  quadrada 
do  desvio  quadrado  padronizado. 

Devemos  observar  que  tais  cálculos  são  feitos  para  cada 
respondente  separadamente  e  os  resultados  de  um  respon- 
dente  não  afetam  aqueles  de  qualquer  outro  respondente. 
Este  método  difere  sensivelmente  de  técnicas  como  regres¬ 
são  ou  ANOVA,  onde  lidamos  com  correlações  entre  to¬ 
dos  os  respondentes  ou  diferenças  de  grupos. 


Vejamos  como  calcularíamos  a  utilidade  parcial  do  primei¬ 
ro  nível  de  ingredientes  (sem  fosfato)  para  o  respondente 
1.  Os  cálculos  para  cada  passo  são  os  seguintes: 

Passo  1:  Os  desvios  de  2,5*  são  elevados  ao  quadrado.  Os 
desvios  quadrados  são  somados  (10,5). 

Passo  2:  O  número  de  níveis  é  6  (três  fatores  com  dois  ní¬ 
veis  cada).  Logo,  o  valor  de  padronização  é  calcu¬ 
lado  como  0,571  (6/10,5  =  0,571). 

Passo  3:  O  desvio  quadrado  para  ingrediente  sem  fosfato 
(2^;  lembre-se  que  invertemos  os  sinais)  é  então 
multiplicado  por  0,571  para  obtermos  2,284  (2^  x 
0,571  =  2,284). 

Passo  4:  Finalmente,  para  calcular  a  utilidade  parcial  para 
este  nível,  determinamos  a  raiz  quadrada  de  2,284, 
o  que  resulta  em  1,1511.  Este  processo  produz 
utilidades  parciais  para  cada  nível  para  os  respon¬ 
dentes  1  e  2,  como  mostrado  na  Tabela  7-3. 


Determinação  de  importância  de  atributo 

Como  as  estimativas  de  utilidade  parcial  estão  em  uma 
escala  comum,  podemos  computar  a  importância  relati¬ 
va  de  cada  fator  diretamente.  A  importância  de  um  fator 
é  representada  pela  amplitude  de  seus  níveis  (ou  seja,  a 
diferença  entre  o  valor  mais  alto  e  o  mais  baixo)  dividi¬ 
da  pela  soma  das  amplitudes  por  todos  os  fatores.  Este 
cálculo  fornece  um  impacto  ou  importância  relativa  de 
cada  atributo  com  base  na  amplitude  de  suas  estimativas 
de  utilidade  parcial.  Fatores  com  um  intervalo  maior  para 
suas  utilidades  parciais  têm  um  impacto  maior  sobre  os 
valores  de  utilidade  calculados,  e  assim  são  considerados 
de  maior  importância.  A  importância  relativa  pontua  em 
todos  os  atributos  com  um  total  de  100%. 


Por  exemplo,  para  o  respondente  1,  as  amplitudes  dos 
três  atributos  são  1,512  [0,756  -  (-0,756)],  3,022  [1,511 
-  (-1,511)]  e  0,756  [0,378  -  (-0,378)].  A  soma  total  de 
amplitudes  é  5,290.  A  partir  disso,  a  importância  relati¬ 
va  para  os  três  fatores  (forma,  ingredientes  e  marca)  é 
calculada  como  1,512/5,290, 3,022/5,290  e  0,756/5,290,  ou 
28,6%,  57,1%  e  14,3%,  respectivamente. 

Podemos  seguir  o  mesmo  procedimento  para  o  se¬ 
gundo  respondente  e  calcular  a  importância  de  cada  fa¬ 
tor,  com  os  resultados  de  forma  (66,7%),  ingredientes 
(25%)  e  marca  (8,3%).  Esses  cálculos  para  os  respon¬ 
dentes  1  e  2  também  são  exibidos  na  Tabela  7-3. 


*  N.  de  R.  T.:  O  número  correto  é  4,5. 
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TABELA  7-3  Utilidades  parciais  estimadas  e  importância  dos  fatores  para  os  respondentes  1  e  2 


Estimação  das  utilidades  parciais 

Cáicuio  da  importância  do  fator 

Desvio 

Desvio  ao 

Desvio  pa- 

Utilidade  parcial 

Amplitude  de  uti- 

Importância 

Nível  do  fator 

invertido® 

quadrado 

dronizado® 

estimada® 

lidades  parciais 

do  fator® 

Respondente  1 

Forma 

Líquido 

-1-1,0 

1,0 

-1-0,571 

+0,756 

1,512 

28,6% 

Pó 

-1,0 

1,0 

-0,571 

-0,756 

Ingredientes 

Sem  fosfato 

Com  fosfato 

-1-2,0 

4,0 

-1-2,284 

+  1,511 

3,022 

57,1% 

-2,0 

4,0 

-2,284 

-1,511 

Marca 

HBAT 

-1-0,5 

0,25 

-1-0,143 

+0,378 

0,756 

14,3% 

Genérico 

-0,5 

0,25 

-0,143 

-0,378 

Soma  de  desvios  quadrados 

10,5 

Valor  de  padronização® 

Soma  de  amplitudes  de  utilidades  parciais 

0,571 

5,290 

Respondente  2 

Forma 

Líquido 

-1-2,0 

4,0 

-1-2,60 

+  1,612 

3,224 

66,7% 

Pó 

-2,0 

4,0 

-2,60 

-1,612 

Ingredientes 

Sem  fosfato 

-1-0,75 

0,5625 

-1-0,365 

+0,604 

1,208 

25,0% 

Com  fosfato 

-0,75 

0,5625 

-0,365 

-0,604 

Marca 

HBAT 

-0,25 

0,0625 

-0,02 

-0,20 

0,400 

8,3% 

Genérico 

-1-0,25 

0,0625 

-1-0,04 

+0,20 

Soma  de  desvios  quadrados 

9,25 

Valor  de  padronização® 

Soma  de  amplitudes  de  utilidades  parciais 

0,649 

4,832 

“Desvios  são  invertidos  para  indicar  maior  preferência  para  ordens  menores.  O  Sinai  do  desvio  é  usado  para  indicar  o  sinai  de  utiiidade  parciai  estimada. 

“Desvio  padronizado  é  iguai  ao  desvio  quadrado  vezes  o  valor  de  padronização. 

‘Utilidade  parciai  estimada  é  iguai  ã  raiz  quadrada  do  desvio  padrronizado. 

“importância  do  fator  é  igual  à  amplitude  de  um  fator  dividida  pela  soma  de  amplitudes  em  todos  os  fatores,  e  multiplicada  por  1 00  para  se  conseguir  um  percentual. 
"Valor  de  padronização  é  igual  ao  número  de  níveis  (2  +  2  +  2  =  6)  dividido  pela  soma  de  desvios  quadrados. 


Avaliação  da  precisão  preditiva 

Para  examinar  a  habilidade  desse  modelo  em  prever  as  es¬ 
colhas  reais  dos  respondentes,  prevemos  a  ordem  de  pre¬ 
ferência  somando  as  utilidades  parciais  para  as  diferentes 
combinações  de  níveis  de  fator,  e  então  ordenamos  os  es¬ 
cores  resultantes.  A  comparação  da  ordem  de  preferência 
prevista  com  a  ordem  de  preferência  real  do  respondente 
indica  a  precisão  preditiva.  Observe  que  os  valores  totais 
das  utilidades  parciais  não  têm  significado  real,  exceto 
como  um  meio  de  desenvolver  a  ordem  de  preferência,  e 
como  tal  não  são  comparados  entre  respondentes. 


Os  cálculos  para  os  respondentes  para  os  oito  estímulos 
são  mostrados  na  Tabela  7-4,  com  as  ordens  de  prefe¬ 
rência  prevista  e  real.  Examinemos  os  resultados  para 
esses  respondentes  para  compreendermos  o  quão  bem 
suas  preferências  foram  representadas  pelas  estimativas 
de  utilidade  parcial. 


•  Respondente  1:  As  utilidades  parciais  estimadas  prevê- 
em  a  ordem  de  preferência  perfeitamente  para  o  res¬ 
pondente  1.  Isso  indica  que  a  estrutura  de  preferência 
foi  representada  com  sucesso  nas  estimativas  de  utilida¬ 
des  parciais  e  que  o  respondente  fez  escolhas  consisten¬ 
tes  com  a  estrutura  de  preferência. 

•  Respondente  2:  A  inconsistência  nas  ordenações  para  o 
respondente  2  proíbe  uma  representação  completa  da 
estrutura  de  preferência.  Por  exemplo,  a  ordenação  mé¬ 
dia  para  estímulos  com  a  marca  genérica  é  menor  que 
para  aqueles  com  a  marca  HBAT  (ver  Tabela  7-2).  Este 
resultado  indica  que,  sendo  tudo  igual,  os  estímulos  da 
marca  genérica  terão  maior  preferência.  Contudo,  exa¬ 
minando  as  ordens  de  classificação  reais,  essa  resposta 
nem  sempre  é  vista.  Os  estímulos  1  e  2  são  iguais,  exce¬ 
to  para  o  nome  de  marca,  mesmo  que  a  HBAT  tenha 
maior  preferência.  Isso  também  ocorre  com  os  estímu¬ 
los  3  e  4.  No  entanto,  a  ordenação  correta  (genérica  pre¬ 
ferida  em  detrimento  de  HBAT)  é  vista  para  os  pares 

{Continua) 
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de  estímulos  de  5-6  e  7-8.  Logo,  a  estrutura  de  preferên¬ 
cia  das  utilidades  parciais  terá  dificuldades  em  prever 
esse  padrão  de  escolha.  Quando  comparamos  as  ordens 
de  classificação  prevista  e  real  (ver  Tabela  7-4),  vemos 
que  as  escolhas  do  respondente  2  são  muitas  vezes  pre¬ 
vistas  erroneamente,  mas  em  geral  o  erro  é  de  apenas 
uma  posição  devido  àquilo  que  é  conhecido  como  o 
efeito  de  interação  (discutido  em  seção  posterior). 


O  exame  da  estrutura  de  preferência  para  cada  indiví¬ 
duo  fornece  uma  maneira  de  compreender  o  papel  de  cada 
atributo  na  avaliação  de  qualquer  estímulo.  Quanto  mais 
precisa  a  estrutura  de  preferência,  melhor  a  visão  sobre  o 
processo  de  escolha  e  o  papel  de  fatores  importantes. 


OS  usos  GERENCIAIS  DA 
ANÁLISE  CONJUNTA 

Antes  de  discutir  a  base  estatística  da  análise  conjunta, 
devemos  entender  a  técnica  em  termos  de  seu  papel  na 
compreensão  da  tomada  de  decisões  de  clientes  e  na  base 
de  desenvolvimento  de  uma  estratégia  [98].  O  exemplo 
simples  que  acabamos  de  discutir  apresenta  alguns  be¬ 
nefícios  básicos  da  análise  conjunta.  A  sua  flexibilidade 
viabiliza  sua  aplicação  em  praticamente  qualquer  área  na 
qual  as  decisões  são  estudadas.  A  análise  conjunta  con¬ 
sidera  que  qualquer  conjunto  de  objetos  (p.ex.,  marcas, 
companhias)  ou  conceitos  (p.ex.,  posicionamento,  benefí¬ 
cios,  imagens)  é  avaliado  como  uma  coleção  de  atributos. 
Após  determinar  a  contribuição  de  cada  fator  à  avaliação 


geral  do  consumidor,  o  pesquisador  pode  então  proceder 
com  o  seguinte: 

1.  Definir  o  objeto  ou  conceito  com  a  combinação  ótima  de 
características. 

2.  Mostrar  as  contribuições  relativas  de  cada  atributo  e  cada 
nível  para  a  avaliação  geral  do  objeto. 

3.  Usar  as  estimativas  de  julgamentos  de  comprador  ou  cliente 
para  prever  preferências  entre  objetos  com  diferentes  conjun¬ 
tos  de  características  (outros  elementos  mantidos  constantes). 

4.  Isolar  grupos  de  clientes  potenciais  que  atribuem  diferente 
importância  às  características  para  definir  segmentos  com 
potenciais  altos  e  baixos. 

5.  Identificar  oportunidades  de  marketing  explorando  o  po¬ 
tencial  de  mercado  para  combinações  de  características  in¬ 
disponíveis  no  momento. 

O  conhecimento  da  estrutura  de  preferência  para  cada 
indivíduo  permite  ao  pesquisador  ter  flexibilidade  quase 
ilimitada  para  examinar  reações  agregadas  e  individuais 
em  uma  ampla  variedade  de  questões  ligadas  a  produtos 
ou  serviços.  Examinaremos  algumas  das  aplicações  mais 
comuns  posteriormente  neste  capítulo. 


COMPARAÇÃO  ENTRE  A 
ANÁLISE  CONJUNTA  E  OUTROS 
MÉTODOS  MULTIVARIADOS 

A  análise  conjunta  difere  de  outras  técnicas  multivariadas 
em  quatro  áreas  distintas:  (1)  sua  natureza  decomposicio- 
nal,  (2)  especificação  de  variável  estatística,  (3)  o  fato  de 
que  as  estimativas  podem  ser  feitas  no  nível  individual,  e 


TABELA  7-4  Totais  de  utilidades  parciais  previstas  para  cada  estímulo  e  uma  comparação  de  ordens  de  preferência  reais  e  estimadas 


Descrição  de  estímulo 

Estimativas  de  utilidade  parcial 

Ordens  de  preferência 

Estímulo  Forma 

Ingredientes 

Marca 

Forma 

Ingredientes 

Marca 

Total 

Estimadas 

Reais 

Respondente  1 

1  Líquido 

Sem  fosfato 

HBAT 

0,756 

1,511 

0,378 

2,645 

1 

1 

2  Líquido 

Sem  fosfato 

Genérico 

0,756 

1,511 

-0,378 

1,889 

2 

2 

3  Líquido 

Com  fosfato 

HBAT 

0,756 

-1,511 

0,378 

-0,377 

5 

5 

4  Líquido 

Com  fosfato 

Genérico 

0,756 

-1,511 

-0,378 

-1,133 

6 

6 

5  Pó 

Sem  fosfato 

HBAT 

-0,756 

1,511 

0,378 

1,133 

3 

3 

6  Pó 

Sem  fosfato 

Genérico 

-0,756 

1,511 

-0,378 

0,377 

4 

4 

7  Pó 

Com  fosfato 

HBAT 

-0,756 

-1,511 

0,378 

-1,889 

7 

7 

8  Pó 

Com  fosfato 

Genérico 

-0,756 

-1,511 

-0,378 

-2,645 

8 

8 

Respondente  2 

1  Líquido 

Sem  fosfato 

HBAT 

1,612 

0,604 

-0,200 

2,016 

2 

1 

2  Líquido 

Sem  fosfato 

Genérico 

1,612 

0,604 

0,200 

2,416 

1 

2 

3  Líquido 

Com  fosfato 

HBAT 

1,612 

-0,604 

-0,200 

0,808 

4 

3 

4  Líquido 

Com  fosfato 

Genérico 

1,612 

-0,604 

0,200 

1,208 

3 

4 

5  Pó 

Sem  fosfato 

HBAT 

-1,612 

0,604 

-0,200 

-1,208 

6 

7 

6  Pó 

Sem  fosfato 

Genérico 

-1,612 

0,604 

0,200 

-0,808 

5 

5 

7  Pó 

Com  fosfato 

HBAT 

-1,612 

-0,604 

-0,200 

-2,416 

8 

8 

8  Pó 

Com  fosfato 

Genérico 

-1,612 

-0,604 

0,200 

-2,016 

7 

6 
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(4)  sua  flexibilidade  em  termos  de  relações  entre  variáveis 
dependente  e  independentes. 

Técnicas  de  composição  versus  de  decomposição 

Muitas  das  técnicas  multivariadas  de  dependência  que 
examinamos  em  capítulos  anteriores  são  chamadas  de 
modelos  de  composição  (p.ex.,  análise  discriminante  e 
muitas  aplicações  de  regressão).  Com  tais  técnicas  o  pes¬ 
quisador  coleta  avaliações  do  respondente  sobre  muitas 
características  de  produto  (p.ex.,  preferência  sobre  cor, 
estilo,  características  específicas)  e  então  relaciona  essas 
avaliações  com  alguma  avaliação  de  preferência  geral 
para  desenvolver  um  modelo  preditivo.  O  pesquisador 
não  conhece  de  antemão  as  avaliações  sobre  caracterís¬ 
ticas  de  produtos,  mas  coleta-as  a  partir  do  respondente. 
Com  as  análises  de  regressão  e  discriminante,  as  avalia¬ 
ções  e  preferências  gerais  do  respondente  são  analisadas 
para  “compor”  a  preferência  geral  a  partir  das  avaliações 
do  respondente  sobre  o  produto  em  cada  atributo. 

A  análise  conjunta,  conhecida  como  um  modelo  de  de¬ 
composição,  difere  no  sentido  de  que  o  pesquisador  pre¬ 
cisa  saber  apenas  uma  preferência  geral  do  respondente 
para  um  estímulo.  Os  valores  de  cada  atributo  (variável 
independente)  já  estavam  especificados  pelo  pesquisador 
quando  o  estímulo  foi  criado.  Deste  modo  a  análise  con¬ 
junta  pode  determinar  (decompor)  o  valor  de  cada  atribu¬ 
to  usando  somente  a  medida  de  preferência  geral. 

Especificação  da  variável  estatística  conjunta 

A  análise  conjunta  emprega  uma  variável  estatística  muito 
parecida  em  forma  com  aquela  que  é  usada  em  outras  téc¬ 
nicas  multivariadas.  A  variável  estatística  conjunta  é  uma 
combinação  linear  de  efeitos  das  variáveis  independentes 
(fatores)  sobre  uma  variável  dependente.  A  diferença  im¬ 
portante  é  que  na  variável  estatística  conjunta  o  pesquisa¬ 
dor  especifica  as  variáveis  independentes  (fatores)  e  seus 
valores  (níveis).  A  única  informação  fornecida  pelo  res¬ 
pondente  é  a  medida  dependente.  Os  níveis  especificados 
pelo  pesquisador  são  então  usados  pela  análise  conjunta 
para  decompor  a  resposta  do  respondente  em  efeitos  para 
cada  nível,  muito  parecido  com  o  que  é  feito  na  análise  de 
regressão  para  cada  variável  independente. 

Esse  aspecto  ilustra  as  características  em  comum  en¬ 
tre  a  análise  conjunta  e  a  experimentação,  sendo  que  de¬ 
linear  o  projeto  é  um  passo  crítico  para  o  sucesso.  Por 
exemplo,  se  uma  variável  ou  efeito  não  foi  antecipado 
no  delineamento  da  pesquisa,  então  não  estará  disponí¬ 
vel  para  análise.  Por  essa  razão,  um  pesquisador  pode 
se  sentir  tentado  a  incluir  diversas  variáveis  que  possam 
ser  relevantes.  Contudo,  a  análise  conjunta  é  limitada  no 
número  de  variáveis  que  podem  ser  incluídas;  assim,  o 
pesquisador  não  pode  simplesmente  incluir  questões  adi¬ 
cionais  para  compensar  uma  falta  de  conceituação  clara 
do  problema. 


Modelos  separados  para  cada  indivíduo 

A  análise  conjunta  difere  de  quase  todos  os  outros  méto¬ 
dos  multivariados  no  sentido  de  que  ela  pode  ser  levada  a 
cabo  no  nível  individual,  o  que  significa  que  o  pesquisador 
gera  um  modelo  separado  para  prever  a  estrutura  de  pre¬ 
ferência  de  cada  respondente.  A  maioria  dos  outros  méto¬ 
dos  multivariados  usa  cada  medida  do  respondente  como 
uma  única  observação  e  então  executa  a  análise  usando 
todos  os  respondentes  simultaneamente.  Na  verdade, 
muitos  métodos  exigem  que  um  respondente  forneça  ape¬ 
nas  uma  única  observação  (a  suposição  de  independência) 
e  então  desenvolvem  um  modelo  comum  para  todos  os 
respondentes,  ajustando  cada  respondente  com  graus  de 
precisão  variados  (representados  pelos  erros  de  previsão 
para  cada  observação,  como  resíduos  em  regressão). 

Em  análise  conjunta,  porém,  as  estimativas  podem  ser 
feitas  para  o  indivíduo  (desagregado)  ou  grupos  de  indi¬ 
víduos  que  representem  um  segmento  de  mercado  ou  o 
mercado  inteiro  (agregado).  Cada  abordagem  apresenta 
benefícios  distintos: 

•  No  nível  desagregado,  cada  respondente  avalia  estímulos 
suficientes  para  a  análise  ser  executada  separadamente  para 
cada  pessoa.  A  precisão  preditiva  é  calculada  para  cada  pes¬ 
soa,  em  vez  de  ser  calculada  somente  para  a  amostra  total. 
Os  resultados  individuais  podem  então  ser  agregados  para 
também  retratar  um  modelo  geral  (agregado). 

•  Muitas  vezes,  porém,  o  pesquisador  seleciona  um  método 
de  análise  agregada  que  executa  a  estimação  de  utilidades 
parciais  para  o  grupo  de  respondentes  como  um  todo.  A 
análise  agregada  pode  fornecer  o  seguinte: 

•  Um  meio  de  reduzir  a  tarefa  de  coleta  de  dados  por  meio 
de  delineamentos  mais  complexos  (discutidos  em  seções 
posteriores) 

•  Métodos  para  estimar  interações  (como  análise  conjunta 
baseada  em  escolhas) 

•  Maior  eficiência  estatística,  pelo  uso  de  mais  observações 
na  estimação. 

Ao  selecionar  entre  análises  conjuntas  agregadas  e  de¬ 
sagregadas,  o  pesquisador  deve  equilibrar  os  benefícios 
ganhos  com  métodos  agregados  versus  a  visão  fornecida 
pelos  modelos  separados  para  cada  respondente  obtidos 
com  métodos  desagregados. 

Flexibilidade  em  tipos  de  relações 

A  análise  conjunta  não  está  limitada  aos  tipos  de  relações 
exigidas  entre  as  variáveis  dependente  e  independentes. 
Como  discutido  em  capítulos  anteriores,  a  maioria  dos 
métodos  de  dependência  considera  que  uma  relação  li¬ 
near  existe  quando  a  variável  dependente  aumenta  (ou 
diminui)  em  iguais  quantias  para  cada  variação  unitária 
na  variável  independente.  Se  algum  tipo  de  relação  não- 
linear  deve  ser  representado,  a  forma  do  modelo  deve  ser 
modificada  ou  variáveis  especializadas  devem  ser  criadas 
(como  polinómios). 
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A  análise  conjunta,  no  entanto,  pode  realizar  previsões 
separadas  para  os  efeitos  de  cada  nível  da  variável  inde¬ 
pendente  e  não  considera  que  os  níveis  estejam  de  fato 
relacionados.  A  análise  conjunta  pode  facilmente  lidar 
com  relações  não-lineares  -  mesmo  a  complexa  relação 
curvilínea,  na  qual  um  valor  é  positivo,  o  próximo  é  nega¬ 
tivo  e  o  terceiro  é  novamente  positivo.  Além  disso,  os  ti¬ 
pos  de  relações  podem  variar  entre  atributos.  No  entanto, 
como  discutimos  adiante,  a  simplicidade  e  flexibilidade  da 
análise  conjunta  comparada  com  os  outros  métodos  mul- 
tivariados  é  baseada  em  diversas  suposições  feitas  pelo 
pesquisador. 

Resumo 

Como  descrito  nas  seções  anteriores,  a  análise  conjunta 
representa  um  tipo  híbrido  de  técnica  multivariada  para 
estimar  relações  de  dependência.  Em  um  sentido,  ela  com¬ 
bina  métodos  tradicionais  (ou  seja,  regressão  e  ANOVA), 
fornecendo  muito  da  flexibilidade  mostrada  na  regressão 
aliada  com  a  tradição  da  experimentação  de  ANOVA.  No 
entanto,  ela  é  única  no  sentido  de  que  é  decomposicional 
por  natureza,  e  resultados  podem  ser  estimados  para  cada 
respondente  em  separado.  Como  tal,  a  análise  conjunta 
oferece  ao  pesquisador  uma  ferramenta  especializada  de 
análise  especificamente  para  compreender  decisões  de 
clientes  e  suas  estruturas  de  preferência.  Como  vemos  nas 
próximas  seções,  a  análise  conjunta,  ao  mesmo  tempo  que 
demanda  considerável  trabalho  de  frente  no  planejamen¬ 
to  da  análise  em  si,  fornece  um  poderoso  e  esclarecedor 
método  para  análise  de  preferências  e  de  tomadas  de  de¬ 
cisões  por  parte  de  clientes. 


PLANEJAMENTO  DE 
UM  EXPERIMENTO  DE 
ANÁLISE  CONJUNTA 

O  pesquisador  que  aplica  análise  conjunta  deve  tomar 
várias  decisões-chave  ao  planejar  o  experimento  e  anali¬ 
sar  seus  resultados.  A  Figura  7-1  (estágios  1-3)  e  a  Figura 
7-4  (estágios  4-7)  mostram  os  passos  gerais  seguidos  no 
delineamento  e  execução  de  um  experimento  de  análise 
conjunta.  A  discussão  segue  o  paradigma  de  construção 
de  modelo  introduzido  no  Capítulo  1. 

O  processo  de  decisão  inicia  com  uma  especificação 
dos  objetivos  da  análise  conjunta.  Como  a  análise  conjun¬ 
ta  é  semelhante  a  um  experimento,  a  conceituação  da  pes¬ 
quisa  é  crítica  para  seu  sucesso.  Depois  que  os  objetivos 
tenham  sido  definidos,  as  questões  relacionadas  ao  verda¬ 
deiro  plano  de  pesquisa  são  abordadas  e  as  suposições  são 
avaliadas.  A  discussão  se  foca  então  em  como  o  processo 
de  decisão  considera  a  estimação  real  dos  resultados  con¬ 
juntos,  a  interpretação  dos  resultados  e  os  métodos  usa¬ 
dos  para  validar  os  resultados.  A  discussão  termina  com 


um  exame  do  uso  de  resultados  de  análise  conjunta  em 
análises  posteriores,  como  segmentação  de  mercado  e  si¬ 
muladores  de  escolha. 

Cada  uma  dessas  decisões  se  origina  da  questão  de 
pesquisa  e  do  uso  da  análise  conjunta  como  uma  ferra¬ 
menta  na  compreensão  das  preferências  do  respondente 
e  do  processo  de  julgamento.  Seguimos  essa  discussão  da 
abordagem  de  construção  de  modelo  examinando  duas 
metodologias  alternativas  de  análise  conjunta  (baseada 
em  escolha  e  adaptativa),  que  são  em  seguida  comparadas 
quanto  às  questões  tratadas  aqui  para  a  análise  conjunta 
tradicional. 


ESTÁGIO  1:  OS  OBJETIVOS 
DA  ANÁLISE  CONJUNTA 

Como  ocorre  com  qualquer  análise  estatística,  o  ponto 
de  partida  é  a  questão  de  pesquisa.  Para  compreender 
decisões  de  clientes,  a  análise  conjunta  pode  ter  dois  ob¬ 
jetivos: 

1.  Determinar  as  contribuições  de  variáveis  preditoras  e  seus 
níveis  na  determinação  de  preferências  do  consumidor.  Por 
exemplo,  quanto  o  preço  contribui  para  o  desejo  de  se  com¬ 
prar  um  produto?  Qual  é  o  melhor  nível  de  preço?  Quanto 
da  variação  no  desejo  de  comprar  sabão  pode  ser  explicada 
por  diferenças  nos  níveis  de  preço? 

2.  Estabelecer  um  modelo  válido  de  julgamentos  do  consu¬ 
midor.  Modelos  válidos  permitem  prever  a  aceitação  do 
consumidor  de  qualquer  combinação  de  atributos,  mesmo 
aqueles  que  não  foram  originalmente  avaliados  por  clientes. 
Ao  se  fazer  isso,  as  questões  abordadas  incluem  o  seguinte: 
as  escolhas  do  respondente  indicam  uma  relação  linear  sim¬ 
ples  entre  as  variáveis  preditoras  e  escolhas?  É  suficiente 
um  modelo  simples  de  “somar”  o  valor  de  cada  atributo, 
ou  precisamos  adicionar  avaliações  mais  complexas  de  pre¬ 
ferências  para  espelhar  o  processo  de  julgamento  de  forma 
adequada? 

O  respondente  reage  apenas  ao  que  o  pesquisador  for¬ 
nece  em  termos  de  estímulos  (combinações  de  atributos). 
Esses  são  os  verdadeiros  atributos  usados  em  uma  tomada 
de  decisões?  Outros  atributos  são  igualmente  importan¬ 
tes,  particularmente  aqueles  de  natureza  mais  qualitativa, 
como  reações  emocionais?  Essas  e  outras  considerações 
exigem  que  a  questão  de  pesquisa  seja  conte xtualizada  em 
torno  de  dois  aspectos  importantes: 

•  É  possível  descrever  todos  os  atributos  que  conferem  utili¬ 
dade  ou  valor  ao  produto  ou  serviço  em  estudo? 

•  Quais  são  os  critérios-chave  de  decisão  envolvidos  no  pro¬ 
cesso  de  escolha  para  esse  tipo  de  produto  ou  serviço? 

Essas  questões  precisam  ser  resolvidas  antes  de  se 
prosseguir  para  a  fase  de  delineamento  de  uma  análise 
conjunta,  pois  elas  fornecem  uma  orientação  fundamental 
para  decisões-chave  em  cada  estágio. 
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Estágio  1 


Estágio  2 


FiGURA  7-1  Estágios  1  -3  do  diagrama  de  decisão  da  análise  conjunta.  (Continua) 


Definição  da  utilidade  total  do  objeto 

O  pesquisador  deve  primeiramente  se  assegurar  de  defi¬ 
nir  a  utilidade  total  do  objeto.  Para  representar  o  proces¬ 
so  de  julgamento  do  respondente  com  precisão,  todos  os 
atributos  que  potencialmente  criam  ou  diminuem  a  uti¬ 
lidade  geral  do  produto  ou  serviço  devem  ser  incluídos. 
É  essencial  que  tanto  fatores  positivos  quanto  negativos 
sejam  considerados  pelos  seguintes  motivos: 

•  Concentrar-se  apenas  em  fatores  positivos  irá  distorcer  se¬ 
riamente  os  julgamentos  dos  respondentes. 

•  Os  respondentes  podem  empregar  subconscientemente  os 
fatores  negativos,  mesmo  quando  não  fornecidos,  e  assim 
tornar  o  experimento  inválido. 

Por  exemplo,  se  grupos  exploratórios  são  emprega¬ 
dos  para  avaliar  os  tipos  de  características  consideradas 


quando  avaliamos  o  objeto,  o  pesquisador  deve  se  asse¬ 
gurar  em  tratar  daquilo  que  torna  o  objeto  desinteressan¬ 
te,  bem  como  daquilo  que  o  torna  atraente.  Felizmente, 
a  omissão  de  um  único  fator  tem  apenas  um  pequeno 
impacto  sobre  as  estimativas  para  outros  fatores  quan¬ 
do  se  usa  um  modelo  aditivo  [84],  mas  a  omissão  de  um 
atributo -chave  pode  ainda  assim  distorcer  seriamente  a 
representação  da  estrutura  de  preferência  e  diminuir  a 
precisão  preditiva. 

Especificação  dos  fatores  determinantes 

Além  disso,  o  pesquisador  deve  se  certificar  de  incluir  to¬ 
dos  os  fatores  determinantes  (obtidos  do  conceito  de  atri¬ 
butos  determinantes  [5]).  A  meta  é  incluir  os  fatores  que 
diferenciam  melhor  entre  os  objetos.  Muitos  atributos  po- 
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Matriz  de  trocas  Perfil  completo  Comparação  pareada 


FIGURA  7-1 


Continuação. 
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-  REGRAS  PRÁTICAS  7-1  - 

Objetivos  da  análise  conjunta 

•  A  análise  conjunta  é  única  em  relação  a  outras  técnicas 

multivariadas,  pois: 

•  É  uma  forma  de  modelo  decomposicional  que  tem 
muitos  elementos  de  um  experimento 

•  Clientes  fornecem  apenas  uma  avaliação  geral  de 
preferências  para  objetos  (estímulos)  criados  pelo 
pesquisador 

•  Estímulos  são  criados  por  combinação  de  um  nível 
(valor)  de  cada  fator  (atributo) 

•  Cada  respondente  avalia  estímulos  o  suficiente  de 
forma  que  resultados  conjuntos  são  estimados  para 
cada  indivíduo 

•  Uma  análise  conjunta  "bem-sucedida"  requer  que  o 

pesquisador: 

•  Defina  precisamente  todos  os  atributos  (fatores)  que 
têm  impactos  positivos  e  negativos  sobre  preferência 

•  Aplique  o  modelo  apropriado  sobre  como  os  clientes 
combinam  os  valores  de  atributos  individuais  em 
avaliações  gerais  de  um  objeto 

•  Os  resultados  de  análise  conjunta  podem  ser  usados 

para: 

•  Fornecer  estimativas  da  "utilidade"  de  cada  nível 
dentro  de  cada  atributo 

•  Definir  a  utilidade  total  de  quaisquer  estímulos 
de  forma  que  possam  ser  comparados  com  outros 
estímulos  para  se  prever  escolhas  de  clientes  (p.ex., 
participação  de  mercado) 


dem  ser  considerados  importantes,  mas  também  podem 
não  diferenciar  as  escolhas,  pois  não  variam  substancial¬ 
mente  entre  os  objetos. 


Por  exemplo,  a  segurança  em  automóveis  é  um  atributo 
importante,  mas  pode  não  ser  determinante  na  maioria 
dos  casos  porque  todos  os  carros  atendem  a  padrões  fede¬ 
rais  rigorosos  e,  portanto,  são  considerados  seguros,  pelo 
menos  em  um  nível  aceitável.  No  entanto,  outras  caracte¬ 
rísticas,  como  quilômetros  por  litro,  desempenho  ou  pre¬ 
ço,  são  importantes  e  muito  mais  prováveis  de  serem  usa¬ 
das  para  se  decidir  entre  diferentes  modelos  de  carros. 


O  pesquisador  sempre  deve  se  empenhar  em  identifi¬ 
car  as  variáveis-chave  determinantes,  porque  elas  são  es¬ 
tratégicas  na  verdadeira  decisão  de  julgamento. 


ESTÁGIO  2:  O  PROJETO  DE 
UMA  ANÁLISE  CONJUNTA 

Tendo  resolvido  as  questões  relativas  aos  objetivos  da  pes¬ 
quisa,  o  pesquisador  desvia  sua  atenção  para  as  questões 


particulares  envolvidas  no  delineamento  e  na  execução  do 
experimento  de  análise  conjunta.  Como  descrito  na  seção 
introdutória,  o  pesquisador  deve  encarar  diversas  ques¬ 
tões  sobre  planejamento  da  pesquisa: 

•  Primeiro,  qual  dentre  os  diversos  métodos  conjuntos  alter¬ 
nativos  deve  ser  escolhido?  A  análise  conjunta  tem  três  mé¬ 
todos  diferentes  para  coletar  e  analisar  dados,  cada  um  com 
vantagens  e  limitações  específicas. 

•  Com  o  tipo  de  modelo  selecionado,  a  próxima  questão 
foca  a  composição  e  o  delineamento  dos  estímulos.  Quais 
são  os  fatores  e  níveis  a  serem  usados  para  se  definir  uti¬ 
lidade?  Como  eles  são  combinados  nos  estímulos?  Essas 
questões  são  críticas  para  o  sucesso  de  qualquer  análise 
conjunta. 

•  Um  benefício  importante  da  análise  conjunta  é  sua  habi¬ 
lidade  para  representar  muitos  tipos  de  relações  na  variá¬ 
vel  estatística  conjunta.  Uma  consideração  crucial  é  o  tipo 
de  efeitos  que  devem  ser  incluídos,  pois  eles  demandam 
modificações  no  planejamento  da  pesquisa.  Efeitos  prin¬ 
cipais,  representando  o  impacto  direto  de  cada  atributo, 
podem  ser  aumentados  por  efeitos  de  interação,  os  quais 
representam  o  impacto  ímpar  de  várias  combinações  de 
atributos. 

•  A  última  questão  se  refere  à  coleta  de  dados,  especificamen¬ 
te  o  tipo  de  medida  de  preferência  a  ser  empregado  e  as 
tarefas  reais  enfrentadas  pelo  respondente. 

Devemos  observar  que  as  questões  de  delineamento 
talvez  sejam  a  fase  mais  importante  na  análise  conjunta. 
Um  estudo  mal  planejado  não  pode  ser  “salvo”  depois  de 
aplicado  se  forem  descobertas  falhas.  Assim,  o  pesquisa¬ 
dor  deve  prestar  atenção  especial  aos  problemas  que  cer¬ 
cam  a  construção  e  administração  do  experimento  con¬ 
junto. 

Seleção  de  uma  metodologia 
de  análise  conjunta 

Depois  que  o  pesquisador  determina  os  atributos  básicos 
que  constituem  a  utilidade  do  produto  ou  serviço  (obje¬ 
to),  uma  questão  fundamental  deve  ser  resolvida:  qual  das 
três  metodologias  conjuntas  básicas  (tradicional,  adaptati- 
va  ou  baseada  em  escolha)  deve  ser  usada  [74]? 

A  escolha  de  metodologias  conjuntas  gira  em  torno 
das  características  básicas  da  pesquisa  proposta:  número 
de  atributos  com  os  quais  se  lida,  nível  de  análise,  tarefa 
de  escolha,  e  forma  de  modelo  permitida.  A  Tabela  7-5 
compara  as  três  metodologias  com  relação  a  essas  consi¬ 
derações. 

•  A  análise  conjunta  tradicional,  ilustrada  no  exemplo  an¬ 
terior,  é  caracterizada  por  um  modelo  aditivo  simples  que 
contém  até  nove  fatores  estimados  para  cada  indivíduo. 
Um  respondente  avalia  estímulos  construídos  com  níveis 
selecionados  de  cada  atributo  (conhecidos  como  perfis  com¬ 
pletos).  Apesar  de  esse  formato  ter  sido  a  principal  base  de 
estudos  conjuntos  por  muitos  anos,  duas  metodologias  adi¬ 
cionais  foram  desenvolvidas  na  tentativa  de  lidar  com  certas 
questões  de  delineamento. 
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•  O  método  conjunto  adaptativo  foi  desenvolvido  para  aco¬ 
modar  um  grande  número  de  fatores  (muitas  vezes  acima 
de  30)  que  não  seriam  praticáveis  em  análise  conjunta  tra¬ 
dicional.  Ele  emprega  um  processo  computadorizado  que 
adapta  os  estímulos  mostrados  a  um  respondente  à  medida 
que  a  tarefa  de  escolha  prossegue.  Além  disso,  os  estímulos 
podem  ser  compostos  de  subconjuntos  de  atributos,  permi¬ 
tindo  assim  muitos  atributos  a  mais. 

•  O  método  da  abordagem  baseada  em  escolha  emprega  uma 
única  forma  para  apresentar  estímulos  em  conjuntos  (esco¬ 
lher  um  de  um  conjunto  de  estímulos)  no  lugar  de  um  por 
um.  Devido  à  tarefa  mais  complicada,  o  número  de  fatores 
incluídos  é  mais  limitado,  mas  a  abordagem  permite  a  inclu¬ 
são  de  interações  e  pode  ser  estimada  no  nível  agregado  ou 
individual. 

Muitas  vezes,  os  objetivos  de  pesquisa  criam  situações 
com  as  quais  a  análise  conjunta  tradicional  não  lida  bem, 
mas  essas  metodologias  alternativas  podem  ser  usadas.  Os 
problemas  de  estabelecer  o  número  de  atributos  e  selecio¬ 
nar  a  forma  do  modelo  são  discutidos  com  mais  detalhes 
na  seção  a  seguir,  que  se  concentra  na  análise  conjunta 
tradicional.  Depois,  as  únicas  características  das  outras 
duas  metodologias  são  abordadas  em  seções  subseqüen- 
tes.  O  pesquisador  deve  notar  que  os  problemas  básicos 
discutidos  nesta  seção  também  se  aplicam  às  outras  duas 
metodologias. 

Planejamento  de  estímnios:  seleção 
e  definição  de  fatores  e  níveis 

Os  fundamentos  experimentais  da  análise  conjunta  atri¬ 
buem  grande  importância  ao  delineamento  dos  estímulos 
avaliados  por  respondentes.  O  delineamento  envolve  a 
especificação  da  variável  estatística  conjunta,  selecionan¬ 
do  os  fatores  e  níveis  a  serem  incluídos  na  construção  de 
estímulos.  Outras  questões  se  relacionam  com  o  caráter 
geral  dos  fatores,  e  níveis  e  considerações  são  específicos 
aos  mesmos.  Esses  problemas  de  delineamento  são  im¬ 
portantes  porque  afetam  a  efetividade  dos  estímulos  na 
tarefa,  a  precisão  dos  resultados  e,  finalmente,  sua  rele¬ 
vância  administrativa. 


Características  gerais  de  fatores  e  níveis 

Antes  de  discutir  as  questões  específicas  sobre  fatores  ou 
níveis,  as  características  aplicáveis  à  especificação  de  fato¬ 
res  e  níveis  devem  ser  abordadas.  Ouando  se  operaciona- 
lizam  fatores  ou  níveis,  o  pesquisador  deve  garantir  que  as 
medidas  sejam  comunicáveis  e  acionáveis. 

Medidas  comunicáveis.  Primeiro,  os  fatores  e  níveis  de¬ 
vem  ser  facilmente  comunicados  para  uma  avaliação  rea¬ 
lista.  Métodos  tradicionais  de  administração  (lápis  e  papel 
ou  computador)  limitam  os  tipos  de  fatores  que  podem 
ser  incluídos.  Por  exemplo,  é  difícil  descrever  a  verdadeira 
fragrância  de  um  perfume  ou  a  “sensação”  de  uma  loção. 
Descrições  escritas  não  capturam  bem  os  efeitos  senso- 
riais,  a  não  ser  que  o  respondente  pegue  o  produto,  inale  a 
fragrância  ou  use  a  loção.  Se  respondentes  estão  incertos 
quanto  à  natureza  dos  atributos  sendo  usados,  então  os 
resultados  não  são  um  reflexo  verdadeiro  de  sua  estrutura 
de  preferência. 

Uma  tentativa  de  trazer  uma  descrição  mais  realista 
de  características  sensoriais  que  possam  ter  sido  excluídas 
no  passado  envolve  formas  específicas  de  análise  conjun¬ 
ta  desenvolvidas  para  empregar  realidade  virtual  [83]  ou 
ajustar  todo  o  domínio  de  efeitos  sensoriais  e  de  multimí¬ 
dia  para  descrever  o  produto  ou  serviço  [43,  57,  94].  In- 
dependentemente  de  essas  abordagens  serem  utilizadas, 
o  pesquisador  sempre  deve  estar  comprometido  com  a 
comunicabilidade  dos  atributos  e  níveis  usados. 

Medidas  acionáveis.  Os  fatores  e  níveis  também  devem 
ter  condições  de  ser  colocados  em  prática,  o  que  signifi¬ 
ca  que  os  atributos  devem  ser  distintos  e  representar  um 
conceito  que  possa  ser  implementado  precisamente. 

•  Eles  não  devem  ser  atributos  que  sejam  difíceis  de  especifi¬ 
car,  como  qualidade  geral  ou  conveniência.  Um  aspecto  fun¬ 
damental  da  análise  conjunta  é  que  respondentes  negociam 
entre  atributos,  fazendo  comparações  entre  atributos  para 
avaliar  um  estímulo.  Se  eles  não  têm  certeza  sobre  como  um 
atributo  se  compara  com  outro  (p.ex.,  um  que  seja  definido 
de  maneira  mais  precisa),  então  a  tarefa  não  pode  refletir  a 
estrutura  de  preferência  real. 


TABELA  7-5  Uma  comparação  de  metodologias  conjuntas  alternativas 


Metodologia  conjunta 

Característica 

Tradicional 

Adaptativa/Híbrida 

Baseada  em  escolhas 

Número  máximo 
de  atributos 

9 

30 

6 

Nível  de  análise 

Individual 

Individual 

Agregado  ou  individual 

Forma  do  modelo 

Aditiva 

Aditiva 

Aditiva  +  Interação 

Tarefa  de  escolha 

Avaliação  de  estímulos 
de  perfil  completo  um 
por  vez 

Avaliação  de  estímulos 
contendo  subconjuntos 
de  atributos 

Escolha  entre  conjuntos 
de  estímulos 

Formato  da  coleta 
de  dados 

Qualquer  formato 

Geralmente  computacional 

Qualquer  formato 

372  Análise  Multivariada  de  Dados 


•  Os  níveis  não  devem  ser  especificados  em  termos  imprecisos, 
como  baixo,  moderado  ou  alto.  Especificações  como  essas 
são  imprecisas  por  causa  das  diferenças  de  percepção  entre 
indivíduos  quanto  ao  que  elas  realmente  significam  (quando 
comparadas  com  diferenças  reais  no  que  diz  respeito  ao  que 
os  indivíduos  sentem  com  relação  a  elas). 

•  Finalmente,  conceitos  ou  atributos  hipotéticos  muitas  vezes 
não  são  formalmente  especificados,  mas  dados  em  termos  de 
benefícios.  Apesar  de  a  análise  conjunta  poder  representá-los 
para  o  respondente,  o  pesquisador  deve  se  sentir  confiante  de 
que  os  respondentes  compreendam  como  tais  atributos  de¬ 
sempenham  individualmente  e  o  que  o  produto  final  acarre¬ 
tará.  Com  muita  freqüência  o  estímulo  é  definido  em  termos 
vagos  e  não-familiares,  de  modo  que  nem  o  pesquisador,  nem 
o  respondente  estão  verdadeiramente  seguros  sobre  o  que  é  o 
produto  ou  o  serviço  final  sob  avaliação  por  parte  do  último. 

Se  fatores  não  podem  ser  definidos  mais  precisamente, 
o  pesquisador  pode  usar  um  processo  de  dois  estágios.  Um 
estudo  conjunto  preliminar  define  estímulos  em  termos  de 
fatores  mais  globais  ou  vagos  (qualidade  ou  conveniên¬ 
cia).  Então,  os  fatores  identificados  como  importantes  no 
estudo  preliminar  são  incluídos  no  estudo  maior  em  ter¬ 
mos  mais  precisos. 

Questões  de  especificação  relacionadas  a  fatores 

Após  ter  selecionado  os  atributos  a  serem  incluídos  como 
fatores  e  garantido  que  as  medidas  serão  comunicáveis  e 
acionáveis,  o  pesquisador  ainda  deve  abordar  três  ques¬ 
tões  específicas  para  definir  fatores:  o  número  de  fatores  a 
serem  incluídos,  a  multicolinearidade  entre  os  mesmos  e  o 
papel  único  do  preço  como  um  fator. 

Número  de  fatores.  O  número  de  fatores  incluídos  na 
análise  afeta  diretamente  a  eficiência  estatística  e  a  con¬ 
fiabilidade  dos  resultados.  Dois  limites  entram  em  jogo 
quando  se  considera  o  número  de  fatores  a  serem  incluí¬ 
dos  no  estudo: 

1.  Acrescentar  fatores  a  um  estudo  conjunto  sempre  aumenta 
o  número  mínimo  de  estímulos  no  planejamento  conjunto. 
O  número  mínimo  de  estímulos  que  devem  ser  avaliados 
por  um  respondente  é 

Número  mínimo  de  estímulos  =  Número  total  de  níveis  por 
todos  os  fatores  -  Número  de  fatores  +  1 


Por  exemplo,  uma  análise  conjunta  com  cinco  fatores 
com  três  níveis  cada  (um  total  de  15  níveis)  precisaria  de 
um  mínimo  de  onze  (15  -  5  -r  1)  estímulos. 


Tal  exigência  é  semelhante  àquelas  encontradas  em  re¬ 
gressão  quando  o  número  de  observações  deve  exceder  o 
número  de  coeficientes  estimados.  Um  planejamento  con¬ 
junto  com  apenas  um  par  de  fatores  é  relativamente  sim¬ 
ples,  mas  o  acréscimo  de  fatores  pode  rapidamente  torná-lo 
uma  tarefa  complexa  e  árdua  para  o  respondente. 

Ainda  que  possa  parecer  que  o  aumento  no  número  de 
fatores  reduza  o  número  de  estímulos  exigido  (ou  seja,  o  nú¬ 


mero  de  fatores  é  subtraído  na  equação  anterior),  lembre-se 
que  cada  fator  deve  ter  pelo  menos  dois  níveis  (e  muitas  ve¬ 
zes  mais),  de  modo  que  um  fator  adicional  sempre  aumenta 
o  número  de  estímulos.  Assim,  no  exemplo  anterior,  acres¬ 
centar  um  fator  a  mais  com  três  níveis  demanda  pelo  menos 
dois  estímulos  extras. 

Há  evidências  de  que  técnicas  tradicionais  de  análise 
conjunta  podem  empregar  um  número  maior  de  atributos 
(20  ou  algo  perto  disso)  do  que  se  pensou  originalmente 
[82].  Como  discutimos  adiante,  algumas  técnicas  foram  de¬ 
senvolvidas  para  lidar  especificamente  com  grandes  quan¬ 
tias  de  atributos  com  delineamentos  especializados.  Mesmo 
em  tais  situações,  o  pesquisador  é  advertido  a  garantir  que, 
não  importa  quantos  atributos  sejam  incluídos,  isso  não  re¬ 
presente  uma  tarefa  complexa  para  o  respondente. 

2.  Quando  se  modela  uma  relação  mais  complexa,  como  no 
caso  de  acréscimo  de  termos  de  interação,  estímulos  adi¬ 
cionais  são  exigidos.  Algumas  reduções  nos  estímulos  são 
viáveis  por  meio  de  planejamentos  conjuntos  especializa¬ 
dos,  mas  o  número  maior  de  parâmetros  a  serem  estimados 
demanda  um  número  maior  de  estímulos  ou  uma  diminui¬ 
ção  na  confiabilidade  dos  parâmetros. 

É  especialmente  importante  observar  que  a  análise 
conjunta  difere  de  outras  análises  multivariadas  no  sen¬ 
tido  de  que  aumento  na  complexidade  do  modelo  e  as 
correspondentes  exigências  de  dados  não  podem  ser  re¬ 
mediadas  acrescentando-se  mais  respondentes.  Em  aná¬ 
lise  conjunta,  cada  respondente  gera  o  número  requerido 
de  observações,  e  assim  o  número  exigido  de  estímulos 
é  constante,  não  importando  quantos  respondentes  são 
analisados.  Formas  especializadas  de  estimação  estimam 
modelos  agregados  ao  longo  de  indivíduos,  exigindo  as¬ 
sim  menos  estímulos  por  respondente,  mas  nesses  casos 
o  conceito  fundamental  de  se  obter  estimativas  conjun¬ 
tas  para  cada  respondente  é  eliminado.  Discutimos  tais 
opções  com  mais  detalhes  em  uma  seção  adiante. 

A  especificação  de  fatores  também  é  uma  fase  críti¬ 
ca  do  planejamento  da  pesquisa:  uma  vez  que  um  fator 
é  incluído  na  tarefa  de  escolha  de  uma  análise  conjunta, 
ele  não  pode  simplesmente  ser  removido  da  análise.  Res¬ 
pondentes  sempre  avaliam  conjuntos  de  atributos  cole¬ 
tivamente.  A  remoção  de  um  atributo  na  estimação  das 
utilidades  parciais  invalida  a  análise  conjunta. 

Multicolinearidade  fatorial.  Um  problema  que  muitas  ve¬ 
zes  passa  não  detectado,  a  não  ser  que  o  pesquisador  exami¬ 
ne  cuidadosamente  todos  os  estímulos  na  análise  conjunta,  é 
a  correlação  entre  fatores  (conhecida  como  correlação  inte- 
ratributos  ou  ambiental).  Em  termos  práticos,  a  presença  de 
fatores  correlacionados  denota  uma  falta  de  independência 
conceituai  entre  os  fatores.  Primeiro  examinamos  os  efeitos 
de  correlação  interatributos  sobre  o  planejamento  conjunto, 
e  em  seguida  discutimos  várias  ações  corretivas. 

Impactos  da  correlação  interatributos.  Quando 
dois  ou  mais  fatores  são  correlacionados,  dois  resultados 
diretos  ocorrem: 
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1.  As  estimativas  de  parâmetros  são  afetadas  como  na  regres¬ 
são  (o  Capítulo  4  contém  uma  discussão  sobre  a  multicoli- 
nearidade  e  seu  impacto).  Entre  os  efeitos  mais  problemá¬ 
ticos  está  a  incapacidade  de  se  obter  estimativas  confiáveis 
devido  à  falta  de  unicidade  para  cada  nível. 

2.  Talvez  mais  importante  seja  a  criação  de  combinações  ina¬ 
creditáveis  de  dois  ou  mais  fatores  que  podem  distorcer  o 
planejamento  conjunto.  Este  problema  ocorre  tipicamente 
em  duas  situações: 

•  Primeiro,  dois  atributos  estão  negativamente  correlacio¬ 
nados,  de  modo  que  os  clientes  esperam  que  elevados 
níveis  de  um  fator  devam  coincidir  com  baixos  níveis  de 
outro.  No  entanto,  quando  níveis  de  cada  um  são  combi¬ 
nados  na  tarefa  conjunta,  os  estímulos  não  são  realistas. 


Um  exemplo  simples  envolve  potência  e  quilômetros  por 
litro  de  gasolina.  Apesar  de  os  atributos  serem  válidos 
quando  considerados  em  separado,  muitas  combinações 
de  seus  níveis  carecem  de  sentido.  Qual  é  o  realismo  de  um 
automóvel  com  os  mais  altos  níveis  de  potência  e  quilôme¬ 
tros  por  litro?  Além  disso,  por  que  alguém  consideraria 
um  carro  com  os  mais  baixos  níveis  desses  dois  atributos? 


O  problema  não  está  nos  níveis  propriamente,  mas 
no  fato  de  que  eles  não  podem  ser  pareados  realistica¬ 
mente  em  todas  as  combinações,  o  que  é  exigido  na  esti¬ 
mação  de  parâmetros. 

•  A  segunda  situação  acontece  quando  um  fator  aponta 
para  a  presença/ausência  de  uma  característica  e  outro 
atributo  indica  quantia.  Nesta  situação,  a  tarefa  conjunta 
inclui  estímulos  denotando  que  uma  característica  está 
disponível/indisponível,  com  um  segundo  fator  mostran¬ 
do  quanto. 


Um  exemplo  simples  envolve  dois  fatores,  com  o  primei¬ 
ro  indicando  a  presença/ausência  de  um  desconto  em  um 
preço  e  o  segundo  fator  apontando  para  o  montante  do 
desconto.  O  problema  surge  sempre  que  os  estímulos  são 
construídos  para  indicar  a  ausência  de  um  desconto,  ape¬ 
sar  de  o  segundo  fator  especificar  uma  quantia.  Incluir 
um  nível  com  o  valor  zero  apenas  aumenta  o  problema, 
pois  agora  estímulos  incluídos  podem  apontar  para  um 
desconto  de  zero.  O  resultado  em  cada  situação  é  um 
estímulo  nada  plausível. 


Novamente  em  tal  situação,  cada  fator  é  plausível  quando 
considerado  separadamente,  entretanto,  quando  combinados, 
criam  estímulos  que  não  são  possíveis  e  não  podem  ser  usados 
na  análise. 

Ações  corretivas  para  correlação  interatribu- 
tos.  Ainda  que  um  pesquisador  goste  sempre  de  evitar 
uma  correlação  ambiental  entre  fatores,  em  alguns  casos 
os  atributos  são  essenciais  para  a  análise  conjunta  e  de¬ 
vem  ser  incluídos.  Quando  os  fatores  correlacionados  são 


retidos,  o  pesquisador  tem  três  ações  corretivas  básicas 
para  contornar  os  estímulos  não-realistas  incluídos  no 
planejamento  conjunto: 

1.  A  ação  mais  direta  é  criar  superatributos  que  combinem  os 
aspectos  de  atributos  correlacionados.  Aqui  o  pesquisador 
considera  os  dois  fatores  e  cria  novos  níveis  que  represen¬ 
tam  quantias  realistas  de  ambos. 


Em  nosso  exemplo  de  potência  e  quilômetros  por  litro  de 
gasolina,  talvez  um  fator  de  “desempenho”  possa  ser  usado 
como  substituto.  Neste  caso,  níveis  de  desempenho  podem 
ser  definidos  em  termos  de  potência  e  quilômetros  por  li¬ 
tro,  mas  como  combinações  realistas  em  um  único  fator. 

Como  um  exemplo  de  atributos  positivamente  corre¬ 
lacionados,  fatores  de  organização  de  loja,  iluminação  e 
decoração  podem  ser  melhor  representados  por  um  único 
conceito,  como  “atmosfera  da  loja”.  Esta  designação  fa¬ 
torial  evita  os  estímulos  irreais  de  elevados  níveis  de  or¬ 
ganização  e  iluminação,  mas  baixos  níveis  de  decoração 
(juntamente  com  outras  combinações  igualmente  inacre¬ 
ditáveis). 

Quando  um  fator  de  ausência/presença  é  utilizado  com 
outro  que  aponta  quantia,  a  abordagem  mais  direta  é  com¬ 
biná-los  em  um  só  fator,  com  os  níveis  incluindo  zero  para 
indicar  a  ausência  do  atributo. 


É  importante  observar  que  quando  esses  superatributos 
são  acrescentados,  eles  devem  ser  tão  acionáveis  e  específi¬ 
cos  quanto  possível.  Se  não  é  possível  definir  os  fatores  mais 
amplos  com  o  nível  necessário  de  especificidade,  então  os 
pesquisadores  podem  ser  forçados  a  eliminar  um  dos  fatores 
originais  do  planejamento. 

2.  Uma  segunda  opção  envolve  planejamentos  experimentais 
refinados  e  técnicas  de  estimação  que  criam  estímulos  quase 
ortogonais,  que  podem  ser  usados  para  eliminar  qualquer 
estímulo  inacreditável  resultante  de  correlação  interatribu- 
tos  [102].  Aqui  o  pesquisador  pode  especificar  quais  com¬ 
binações  de  níveis  (conhecidas  como  pares  proibidos)  ou 
mesmo  estímulos  do  planejamento  ortogonal  devem  ser  eli¬ 
minados  do  planejamento  conjunto,  apresentando  assim  aos 
respondentes  apenas  estímulos  críveis.  Contudo,  o  perigo 
nesta  abordagem  é  que  estímulos  pobremente  delineados 
resultam  em  um  número  tão  grande  de  estímulos  inacei¬ 
táveis  que  um  ou  mais  fatores  correlacionados  são  efetiva¬ 
mente  eliminados  do  estudo,  o  que  afeta  então  as  estimati¬ 
vas  de  utilidades  parciais  para  os  mesmos  e  todos  os  demais 
fatores. 

3.  A  terceira  ação  corretiva  é  restringir  a  estimação  de  utilida¬ 
des  parciais  para  obedecer  a  uma  relação  pré-especificada. 
Essas  restrições  podem  ser  entre  fatores,  bem  como  perten¬ 
cer  aos  níveis  dentro  de  qualquer  fator  [100, 106].  Novamen¬ 
te,  porém,  o  pesquisador  está  colocando  restrições  sobre  o 
processo  de  estimação,  o  que  pode  produzir  estimativas  po¬ 
bres  das  estruturas  de  preferência. 

A  presença  de  uma  correlação  interatributos  é  uma 
questão  que  deve  ser  abordada  em  qualquer  análise  con- 
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junta.  Dentre  as  três  ações  corretivas  discutidas,  a  criação 
de  superatributos  é  a  técnica  conceitualmente  superior, 
pois  ela  preserva  a  estrutura  básica  da  análise  conjunta. 
As  outras  duas  ações  corretivas,  que  acrescentam  signi- 
ficante  complexidade  ao  delineamento  e  à  estimação  da 
análise,  devem  ser  consideradas  somente  depois  que  a 
ação  mais  direta  tenha  sido  tentada. 

O  papel  único  do  preço  como  um  fator.  O  preço  é  um 
fator  incluído  em  muitos  estudos  conjuntos  por  represen¬ 
tar  uma  componente  distinta  de  valor  para  muitos  produ¬ 
tos  ou  serviços  que  são  estudados.  O  preço,  porém,  não  é 
como  outros  atributos  em  suas  relações  com  outros  fato¬ 
res  [50].  Primeiro  discutimos  os  aspectos  únicos  do  preço, 
e  então  tratamos  das  abordagens  para  a  inclusão  do  preço 
em  uma  análise  conjunta. 

Preço  é  um  elemento  principal  em  qualquer  avaliação 
de  valor,  e  assim,  um  atributo  idealmente  adequado  à  na¬ 
tureza  de  troca  da  análise  conjunta.  Porém,  é  esta  natu¬ 
reza  básica  de  ser  uma  troca  inerente  que  cria  diversos 
problemas  com  sua  inclusão: 

•  Em  muitos  casos,  se  não  for  na  maioria,  o  preço  tem  um 
grau  elevado  de  correlação  interatributos  com  outros  fato¬ 
res.  Para  muitos  atributos,  um  aumento  na  quantia  do  atri¬ 
buto  é  associado  com  um  aumento  de  preço,  e  uma  queda 
no  nível  de  preço  pode  não  ser  realista.  O  resultado  é  um  ou 
mais  estímulos  que  são  inadequados  para  inclusão  na  análi¬ 
se  conjunta  (ver  discussão  anterior  sobre  correlação  intera¬ 
tributos  para  possíveis  ações  corretivas). 

•  A  relação  preço-qualidade  pode  ser  operante  entre  certos 
fatores,  de  modo  que  algumas  combinações  talvez  sejam 
não-realistas  ou  tenham  as  percepções  não-pretendidas. 
Esta  forma  específica  de  correlação  interatributos  é  uma 
consideração-chave  em  muitas  aplicações  de  análise  con¬ 
junta. 

•  Muitos  outros  fatores  positivos  (p.ex.,  qualidade,  confia¬ 
bilidade)  podem  ser  incluídos  ao  se  definir  a  utilidade  do 
produto  ou  serviço.  No  entanto,  quando  se  define  do  que 
se  abre  mão  para  essa  utilidade  (ou  seja,  preço),  apenas  um 
fator  é  incluído,  o  que  pode  diminuir  inerentemente  a  im¬ 
portância  do  preço  [77]. 

•  Finalmente,  o  preço  pode  interagir  com  outros  fatores, 
particularmente  fatores  mais  intangíveis,  como  nome 
da  marca.  O  impacto  de  uma  interação  nessa  situação  é 
que  um  certo  nível  de  preço  tem  diferentes  significados 
para  diferentes  marcas  [50,  77],  um  aplicável  a  uma  marca 
premium  e  outro  a  uma  marca  de  desconto.  Discutimos  o 
conceito  de  interações  posteriormente  neste  capítulo. 

Todas  essas  características  únicas  do  preço  como  um 
fator  não  devem  fazer  com  que  o  pesquisador  evite  o  uso 
deste  atributo,  mas  que,  em  vez  disso,  antecipe  os  impac¬ 
tos  e  ajuste  o  delineamento  e  a  interpretação  como  exigi¬ 
do.  Primeiro,  formas  explícitas  de  análise  conjunta,  como 
análise  de  valor  conjunta  (CVA),  foram  desenvolvidas 
para  ocasiões  nas  quais  o  foco  é  o  preço  [92].  Além  dis¬ 
so,  se  as  interações  de  preço  e  outros  fatores  são  consi¬ 
deradas  importantes,  métodos  como  as  análises  conjuntas 


-  REGRAS  PRÁTICAS  7-2  - 

Delineamento  de  nma  tarefa  conjnnta 

•  Pesquisadores  devem  escolher  uma  das  três 
metodologias  com  base  no  número  de  atributos,  nas 
exigências  da  tarefa  de  escolha  e  no  modelo  assumido 
de  escolha  do  cliente: 

•  Métodos  tradicionais  são  mais  adequados  quando 
o  número  de  atributos  é  menor  que  10,  resultados 
são  desejados  para  cada  indivíduo,  e  o  modelo  mais 
simples  de  escolha  do  cliente  é  aplicável 

•  Métodos  adaptativos  são  mais  apropriados  quando 
quantias  maiores  de  atributos  estão  envolvidas  (até 
30),  mas  demandam  entrevistas  computadorizadas. 

•  Métodos  baseados  em  escolhas  são  considerados 
os  mais  realistas,  podem  elaborar  modelos  mais 
complexos  de  escolha  por  parte  de  clientes,  e  têm 
se  tornado  mais  populares;  mas  geralmente  são 
limitados  a  seis  ou  menos  atributos 

•  O  pesquisador  encara  uma  troca  fundamental  no 
número  de  fatores  incluídos: 

•  Aumentá-los  para  refletir  melhor  a  "utilidade"  do 
objeto  versus 

•  Minimizá-los  para  reduzir  a  complexidade  da 
tarefa  conjunta  do  respondente  e  permitir  o  uso  de 
qualquer  um  dos  três  métodos 

•  A  especificação  de  fatores  (atributos)  e  níveis  (valores) 
de  cada  fator  deve  garantir  que: 

•  Fatores  e  níveis  são  influências  distintas  sobre  a 
preferência,  definidos  em  termos  objetivos  com 
ambigüidade  mínima,  eliminando  assim  elementos 
emocionais  ou  estéticos 

•  Fatores  geralmente  têm  o  mesmo  número  de  níveis 

•  Correlações  interatributos  (p.ex.,  aceleração  e 
quilômetros  por  litro)  podem  estar  presentes  a  níveis 
mínimos  (0,20  ou  menos)  para  realismo,  mas  níveis 
maiores  devem  ser  acomodados  pela: 

•  Criação  de  um  "superatributo"  (como 
desempenho) 

•  Especificação  de  pares  proibidos  na  análise  para 
eliminar  estímulos  não-realistas  (como  aceleração 
rápida  e  notável  rendimento  de  litro) 

•  Restrição  da  estimação  do  modelo  para  se 
adequar  a  relações  pré-especificadas 

•  Preço  demanda  especial  atenção,  pois: 

•  Geralmente  tem  correlações  interatributos  com  a 
maioria  dos  demais  fatores  (p.ex.,  relação  preço- 
qualidade) 

•  Em  muitas  situações  representa  de  forma  ímpar  o 
que  é  negociado  em  custo  para  o  objeto 

•  Interações  substanciais  com  outras  variáveis 
podem  exigir  métodos  conjuntos  baseados  em 
escolha  ou  multiestágios 


baseadas  em  escolha  ou  as  de  multiestágio  [77,  81,  112] 
fornecem  estimativas  quantitativas  dessas  relações.  Mes¬ 
mo  que  nenhum  ajuste  específico  seja  feito,  o  pesquisador 
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deve  considerar  essas  questões  na  definição  de  níveis  de 
preço  e  na  interpretação  dos  resultados. 

Questões  de  especificação  referentes  a  níveis 

A  definição  de  níveis  é  um  aspecto  crítico  da  análise  con¬ 
junta,  pois  os  níveis  são  as  verdadeiras  medidas  usadas 
para  formar  os  estímulos.  Assim,  além  de  serem  acioná¬ 
veis  e  comunicáveis,  a  pesquisa  tem  mostrado  que  o  nú¬ 
mero  de  níveis,  o  equilíbrio  de  níveis  entre  fatores  e  os 
intervalos  dos  níveis  em  um  fator  têm  efeitos  diferentes 
sobre  as  avaliações  dos  respondentes. 

Número  equilibrado  de  níveis.  Os  pesquisadores  devem 
tentar  equilibrar  ou  equalizar  o  melhor  possível  o  núme¬ 
ro  de  níveis  nos  fatores.  A  importância  relativa  estimada 
de  uma  variável  tende  a  aumentar  quando  o  número  de 
níveis  cresce,  mesmo  quando  os  pontos  extremos  perma¬ 
necem  os  mesmos  [52, 71, 110, 117, 118].  Conhecida  como 
o  “número  de  efeitos  de  níveis”,  a  categorização  refinada 
chama  a  atenção  para  os  atributos  e  faz  com  que  os  con¬ 
sumidores  se  concentrem  naquele  fator  mais  do  que  nos 
outros.  Se  a  importância  relativa  de  fatores  é  conhecida 
a  priori,  então  o  pesquisador  pode  querer  expandir  os  ní¬ 
veis  dos  fatores  mais  importantes  para  evitar  uma  diluição 
de  importância  e  captar  informação  adicional  sobre  os  fa¬ 
tores  mais  importantes  [116]. 

Intervalo  dos  níveis  fatoriais.  O  intervalo  (de  pequeno 
a  grande)  dos  níveis  deve  ser  estabelecido  um  pouco  fora 
dos  valores  existentes,  mas  não  em  um  nível  inacreditá¬ 
vel.  Tal  prática  ajuda  a  reduzir  a  correlação  interatribu- 
tos,  mas  também  pode  reduzir  a  credibilidade;  portanto, 
os  níveis  não  devem  ser  muito  extremos.  Nunca  extrapo¬ 
le  além  dos  níveis  mais  externos  [77],  pois  você  não  pode 
estar  tão  certo  sobre  como  o  respondente  irá  responder  a 
estes  níveis.  Níveis  completamente  inaceitáveis  também 
podem  causar  problemas  substanciais  e  devem  ser  elimi¬ 
nados. 

Antes  de  excluir  um  nível,  porém,  o  pesquisador  deve 
assegurar-se  de  que  elas  seja  verdadeiramente  inaceitável, 
pois  muitas  vezes  as  pessoas  escolhem  produtos  ou  ser¬ 
viços  que  têm  o  que  elas  chamam  de  níveis  inaceitáveis. 
Se  um  nível  inaceitável  é  encontrado  depois  que  o  experi¬ 
mento  foi  administrado,  as  soluções  recomendadas  são  a 
eliminação  de  todos  os  estímulos  que  têm  níveis  inaceitá¬ 
veis  ou  a  redução  de  estimativas  de  utilidades  parciais  do 
nível  transgressor  a  um  ponto  em  que  quaisquer  objetos 
que  contenham  aquele  nível  não  serão  escolhidos. 

O  pesquisador  também  deve  aplicar  os  critérios  de  re¬ 
levância  prática  e  aplicabilidade  ao  definir  os  níveis.  Níveis 
que  não  são  práticos  ou  jamais  seriam  usados  em  situações 
realistas  podem  afetar  artificialmente  os  resultados. 


Por  exemplo,  considere  que  no  curso  normal  de  negó¬ 
cios  o  intervalo  de  preços  varie  cerca  de  10%  em  tor¬ 


no  do  preço  médio  de  mercado.  Se  um  nível  de  preço 
20%  inferior  fosse  incluído,  mas  na  realidade  não  fosse 
oferecido,  sua  inclusão  distorceria  os  resultados  sensi¬ 
velmente.  Os  respondentes  seriam  logicamente  mais 
favoráveis  a  um  nível  de  preço  como  esse.  Quando  as 
estimativas  de  utilidades  parciais  são  feitas  e  a  impor¬ 
tância  do  preço  é  calculada,  o  preço  parecerá  artificial¬ 
mente  mais  importante  do  que  realmente  seria  em  de¬ 
cisões  diárias. 


O  pesquisador  deve  usar  os  critérios  de  aplicabilidade 
e  relevância  prática  em  todos  os  níveis  de  atributo  para 
garantir  que  não  sejam  criados  estímulos  que  serão  favo¬ 
ravelmente  vistos  pelo  respondente  mas  que  jamais  terão 
uma  chance  real  de  ocorrer. 

Especificação  da  forma  do  modelo  básico 

Para  a  análise  conjunta  explicar  a  estrutura  de  preferência 
de  um  respondente  apenas  a  partir  de  avaliações  gerais  de 
um  conjunto  de  estímulos,  o  pesquisador  deve  tomar  duas 
decisões-chave  referentes  ao  modelo  de  análise  conjunta 
inerente:  especificar  a  regra  de  composição  a  ser  empre¬ 
gada  e  selecionar  o  tipo  de  relações  entre  estimativas  de 
utilidades  parciais.  Essas  decisões  afetam  tanto  o  delinea¬ 
mento  dos  estímulos  quanto  a  análise  das  avaliações  do 
respondente. 

A  regra  de  composição:  seleção  de  um 
modelo  aditivo  versus  interativo 

A  decisão  mais  abrangente  do  pesquisador  envolve  a  es¬ 
pecificação  da  regra  de  composição  do  respondente.  A  re¬ 
gra  de  composição  descreve  como  o  respondente  combina 
as  utilidades  parciais  dos  fatores  para  obter  utilidade  ge¬ 
ral.  É  uma  decisão  crítica,  pois  define  a  natureza  básica  da 
estrutura  de  preferência  que  será  estimada.  Na  próxima 
seção  discutimos  os  elementos  básicos  da  regra  de  compo¬ 
sição  mais  comum  -  o  modelo  aditivo  -  e  então  tratamos 
das  questões  envolvidas  na  adição  de  outras  formas  de  re¬ 
lações  de  utilidades  parciais  conhecidas  como  termos  de 
interação. 

O  modelo  aditivo.  A  regra  de  composição  mais  comum 
e  básica  é  um  modelo  aditivo.  Este  considera  que  o  res¬ 
pondente  simplesmente  soma  os  valores  para  cada  atri¬ 
buto  (as  utilidades  parciais  dos  níveis)  para  obter  o  valor 
total  para  uma  combinação  de  atributos  (produtos  ou  ser¬ 
viços).  Fazendo  isso,  a  utilidade  total  de  qualquer  estímu¬ 
lo  definido  pode  ser  calculada  como  a  soma  das  partes. 


Por  exemplo,  considere  que  um  produto  tem  dois  fatores  (1 
e  2),  cada  um  com  dois  níveis  (A,  B  e  C,  D).  As  utilidades 
parciais  do  fator  1  foram  estimadas  em  2  e  4  (níveis  A  e  B), 
enquanto  o  fator  2  apresenta  valores  de  utilidades  parciais 

{Continua) 
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(Continuação) 

de  3  e  5  (níveis  C  e  D).  Podemos  então  calcular  a  utilidade 
total  dos  quatro  possíveis  estímulos  como  se  segue: 


Estímulo 

Níveis  definin¬ 
do  estímulo 

Utilidades  par¬ 
ciais  do  modelo 

aditivo 

Utilida¬ 
de  total 

1 

AeC 

2-h3 

5 

2 

AeD 

2-h5 

7 

3 

BeC 

4-h3 

7 

4 

BeD 

4-h5 

9 

O  modelo  aditivo  tipicamente  explica  a  maior  parte 
(até  80  ou  90%)  da  variação  em  preferência  na  maioria 
dos  casos,  e  é  suficiente  para  a  maioria  das  aplicações.  É 
também  o  modelo  básico  inerente  tanto  à  análise  conjun¬ 
ta  tradicional  quanto  à  adaptativa  (ver  Tabela  7-5). 

Acréscimo  de  efeitos  de  interação.  A  regra  de  composi¬ 
ção  que  usa  efeitos  de  interação  é  parecida  com  a  forma 
aditiva,  no  sentido  de  que  o  consumidor  soma  as  utilida¬ 
des  parciais  para  obter  um  total  geral  no  conjunto  de  atri¬ 
butos.  Ela  é  um  pouco  diferente,  porque  permite  que  cer¬ 
tas  combinações  de  níveis  estejam  acima  ou  abaixo  de  sua 
soma.  A  regra  de  composição  interativa  corresponde  à 
afirmação:  “O  todo  é  maior  (ou  menor)  do  que  a  soma  de 
suas  partes”.  Revisitemos  um  de  nossos  primeiros  exem¬ 
plos  para  ver  como  efeitos  de  interação  afetam  escores  de 
utilidade. 


Em  nosso  exemplo  de  detergente  industrial,  examine¬ 
mos  os  resultados  para  o  respondente  2  (rever  Tabela 
7-4).  Nas  utilidades  parciais  estimadas,  a  marca  Gené¬ 
rica  foi  preferida  em  detrimento  da  HBAT,  sem  fosfato 
foi  preferido  em  relação  aos  ingredientes  baseados  em 
fosfato,  e  líquido  foi  preferido  no  lugar  de  pó. 

Mas  os  resultados  do  respondente  nem  sempre  são 
consistentes  como  neste  caso.  Como  anteriormente  dis¬ 
cutido,  para  os  estímulos  5  a  8  o  respondente  sempre 
preferiu  estímulos  com  a  marca  Genérica  no  lugar  de 
HBAT,  com  todas  as  demais  coisas  mantidas  constan¬ 
tes.  Mas  o  inverso  é  verdadeiro  com  os  estímulos  1  a 
4.  O  que  diferencia  esses  dois  conjuntos  de  estímulos? 
Olhando  a  Tabela  7-4,  percebemos  que  os  estímulos  1-4 


contêm  a  forma  líquida,  enquanto  os  estímulos  5-8  con¬ 
têm  a  forma  de  pó.  Assim,  parece  que  as  preferências  do 
respondente  2  quanto  à  marca  diferem  dependendo  se 
o  estímulo  contém  uma  forma  líquida  ou  em  pó.  Neste 
caso  dizemos  que  os  fatores  Marca  e  Forma  interagem, 
de  forma  que  uma  ou  mais  combinações  desses  fatores 
resultam  em  avaliações  muito  maiores  ou  menores  do 
que  o  esperado.  Sem  a  inclusão  deste  efeito  de  intera¬ 
ção  ,as  ordenações  de  preferência  real  e  estimada  não 
coincidirão. 


Desvantagens  do  acréscimo  de  termos  de  intera¬ 
ção.  Com  a  habilidade  dos  termos  de  interação  de  acres¬ 
centar  generalidade  à  regra  de  composição,  por  que  não 
usar  o  modelo  interativo  em  todos  os  casos?  A  adição  de 
termos  de  interação  tem  algumas  desvantagens  que  de¬ 
vem  ser  consideradas: 

•  Cada  termo  de  interação  exige  uma  estimativa  extra  de  uti¬ 
lidade  parcial  com  pelo  menos  um  estímulo  adicional  para 
cada  respondente  avaliar.  A  menos  que  o  pesquisador  saiba 
exatamente  quais  termos  de  interação  estimar,  o  número  de 
estímulos  cresce  dramaticamente.  Além  disso,  se  respon- 
dentes  não  utilizarem  um  modelo  interativo,  a  estimação 
dos  termos  adicionais  de  interação  na  variável  estatística 
conjunta  reduz  a  eficiência  estatística  (mais  estimativas  de 
utilidades  parciais)  do  processo  de  estimação  e  torna  a  tare¬ 
fa  conjunta  mais  difícil. 

•  Mesmo  quando  usadas  por  respondentes,  interações  pre- 
vêem  substancialmente  menos  variância  do  que  os  efeitos 
aditivos,  geralmente  não  excedendo  5-10%  de  aumento  na 
variância  explicada.  Logo,  em  muitos  casos,  o  poder  prediti- 
vo  aumentado  será  mínimo. 

•  Termos  de  interação  são  geralmente  substanciais  em  casos 
para  os  quais  atributos  são  menos  tangíveis,  particularmen¬ 
te  quando  reações  estéticas  ou  emocionais  desempenham 
um  papel  significativo. 

O  pesquisador  deve  equilibrar  o  potencial  para  expli¬ 
cação  aumentada  de  termos  de  interação  com  as  conse- 
qüências  negativas  do  acréscimo  destes.  O  termo  de  in¬ 
teração  é  mais  efetivo  quando  o  pesquisador  pode  supor 
que  porções  "não-explicadas"  de  utilidade  são  associadas 
somente  com  certos  níveis  de  um  atributo.  O  Documento 
7-1  fornece  um  exame  mais  detalhado  sobre  como  identi¬ 
ficar  termos  de  interações  e  seus  impactos  sobre  estimati¬ 
vas  de  utilidades  parciais  e  precisão  preditiva. 


Documento  7-1  Um  exemplo  de  efeitos  de  interação  sobre 
estimativas  de  utilidades  parciais 


Interações  são  primeiramente  identificadas  por  padrões 
ímpares  dentro  dos  escores  de  preferência  de  um  res¬ 
pondente.  Se  elas  não  forem  incluídas  no  modelo  adi¬ 
tivo,  elas  podem  afetar  sensivelmente  a  estrutura  de 


preferência  estimada.  Retornamos  ao  nosso  exemplo  de 
um  detergente  industrial  para  ilustrar  como  interações 
são  refletidas  nos  escores  de  preferência  de  um  respon¬ 
dente. 
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Obtenção  de  avaliações  de  preferência 


Em  nosso  exemplo  anterior  de  um  detergente  industrial, 
podemos  postular  uma  situação  onde  o  respondente  faz 
escolhas  nas  quais  aparecem  interações  para  influenciar 
as  escolhas.  Considere  que  um  terceiro  respondente  deu 
a  seguinte  ordem  de  preferência: 


Ordenações  de  estímulos  formados  por  três  fatores 
(1  =  mais  preferido,  8  =  menos  preferido) 

Forma 

Líquido 

Pó 

Marca  Ingredientes 

HBAT  Sem  fosfato 

1 

2 

Com  fosfato 

3 

4 

Genérica  Sem  fosfato 

7 

8 

Com  fosfato 

5 

6 

Considere  que  a  “verdadeira”  estrutura  de  prefe¬ 
rência  para  este  respondente  deve  refletir  uma  pre¬ 
ferência  pela  marca  HBAT,  líquido  sobre  pó,  e  de¬ 
tergentes  sem  fosfato  sobre  aqueles  que  têm  fosfato. 
Contudo,  uma  experiência  ruim  com  um  detergente 
genérico  fez  o  respondente  selecionar  aquele  com  fos¬ 
fato  no  lugar  do  outro  só  se  ele  fosse  de  uma  marca  ge¬ 
nérica.  Essa  escolha  vai  contra  as  preferências  gerais  e 
é  refletida  em  um  efeito  de  interação  entre  os  fatores 
de  marca  e  ingredientes. 


Estimação  do  modelo  conjunto 

Se  considerarmos  apenas  um  modelo  aditivo,  obteremos 
as  seguintes  estimativas  de  utilidades  parciais: 


Estimativas  de  utilidades  parciais  para  o 
respondente  3:  modelo  aditivo 
Forma  Ingredientes  Marca 

Líquido  Pó  Sem  Com  HBAT  Genérico 

fosfato  fosfato 

0,42  -0,42  0,0  0,0  1,68  -1,68 


Quando  examinamos  as  estimativas  de  utilidades  par¬ 
ciais,  percebemos  que  os  valores  foram  perturbados  pela 
interação. 


Mais  marcantemente  ainda,  os  dois  níveis  no  fator  de 
ingredientes  têm  utilidades  parciais  iguais  a  0,0,  ainda 
que  saibamos  que  o  respondente  preferia  na  realidade 
a  opção  livre  de  fosfato.  As  estimativas  são  enganosas. 


pois  os  efeitos  principais  de  marca  e  ingredientes  são 
perturbados  pelas  interações  mostradas  pela  inversão 
de  ordem  de  preferência  quando  a  marca  genérica  foi 
envolvida. 


O  impacto  se  estende  para  as  estimativas  de  utilidade 
parcial,  como  podemos  ver  pela  maneira  como  também 
afeta  os  escores  de  utilidade  geral  e  as  ordenações  previs¬ 
tas  para  cada  estímulo. 


A  tabela  a  seguir  compara  as  ordens  reais  de  preferência 
com  as  ordens  calculadas  e  previstas  usando  o  modelo 
aditivo. 


HBAT 

Sem  fosfato  Com  fosfato 

Líquido  Pó 

Líquido  Pó 

Ordem  real 

1  2 

3  4 

Utilidade  calculada 

2,10  1,26 

2,10  1,26 

Ordem  prevista^* 

1,5  3,5 

1,5  3,5 

Genérico 

Sem  fosfato 

Com  fosfato 

Líquido  Pó 

Líquido  Pó 

Ordem  real 

7  8 

5  6 

Utilidade  calculada 

-1,26  -2,10 

-1,26  -2,10 

Ordem  prevista^* 

5,5  7,5 

5,5  7,5 

“Escores  de  utilidade  maiores  representam  preferência 

maior  e,  assim,  ordem  maior.  Além  disso,  as  ordens  empata- 

das  são  mostradas  como  ordem  média  (p.ex.,  dois  estímulos 

empatados  em  1  e  2  recebem  a  ordem  1,5) 

As  previsões  são  obviamente  menos  precisas,  pois  sa¬ 
bemos  que  existem  interações.  Se  prosseguíssemos  com 
apenas  um  modelo  aditivo,  estaríamos  violando  uma  das 
principais  suposições  e  fazendo  previsões  potencialmen¬ 
te  muito  imprecisas. 


Identificação  de  interações 

Examinar  interações  de  primeira  ordem  é  uma  tarefa  ra¬ 
zoavelmente  simples  com  dois  passos.  Usando  o  exemplo 
anterior  com  três  fatores,  ilustramos  cada  passo: 

•  Forme  três  matrizes  de  2^  ordem  referentes  à  ordem  de  pre¬ 
ferência.  Em  cada  matriz,  some  as  duas  ordens  de  preferên¬ 
cia  para  o  terceiro  fator. 


Por  exemplo,  a  primeira  matriz  pode  ser  as  combina¬ 
ções  de  forma  e  ingredientes  com  cada  célula  contendo 
a  soma  das  duas  preferências  por  marca.  Ilustramos  o 
processo  com  duas  das  possíveis  matrizes  aqui: 

{Continua) 
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{Continuação) 


Matriz  1“ 

Matriz  2* 

Forma 

Ingredientes 

Marca  Líquido  Pó 

Sem  fosfato  Com  fosfato 

HBAT  1  -t  3  2-1-4 

1+2  3+4 

Genérico  7-1-5  8-1-6 

7  +  8  5  +  6 

“Os  valores  são  as  duas  ordens  de  preferência  para  Ingredientes. 
'“Os  valores  são  as  duas  ordens  de  preferência  para  Forma. 

•  Para  checar  as  interações,  os  valores  diagonais  são  então  so¬ 
mados  e  a  diferença  é  calculada.  Se  o  total  é  zero,  não  existe 
interação. 

Para  a  matriz  1,  as  duas  diagonais  são  iguais  a  18  (1  -t  3 
-i-8-i-6  =  7-h5-i-2-i-4).  Mas  na  matriz  2  o  total  nas  diago¬ 
nais  não  é  igual  (1 +  2  +  5  +  +  ?> +  3  +  A).  Tal  diferen¬ 

ça  aponta  para  uma  interação  entre  marca  e  ingredientes, 
como  anteriormente  descrito.  O  grau  de  diferença  indica 
a  força  da  interação. 

A  medida  que  a  diferença  se  torna  maior,  o  impacto  da 
interação  aumenta,  e  fica  a  cargo  do  pesquisador  quando 
as  interações  causam  problemas  de  previsão  o  suficiente,  a 
fim  de  assegurar  a  maior  complexidade  da  estimação  dos 
coeficientes  devido  aos  termos  de  interação. ■ 

Seleção  do  tipo  de  modelo.  A  escolha  de  uma  regra  de 
composição  determina  os  tipos  e  o  número  de  tratamen¬ 
tos  ou  estímulos  que  o  respondente  deve  avaliar,  junta¬ 
mente  com  a  forma  do  método  de  estimação  utilizado. 
Como  anteriormente  discutido,  uma  ponderação  entre  as 
duas  abordagens  precisa  ser  considerada.  Uma  forma  adi¬ 
tiva  exige  menos  avaliações  do  respondente,  e  é  mais  fácil 
obter  estimativas  para  as  utilidades  parciais.  No  entanto,  a 
forma  interativa  é  uma  representação  mais  precisa  quan¬ 
do  os  respondentes  usam  regras  mais  complexas  de  deci¬ 
são  na  avaliação  de  um  produto  ou  serviço. 

O  pesquisador  não  sabe  com  certeza  a  melhor  forma 
de  modelo,  mas  deve,  em  vez  disso,  compreender  as  impli¬ 
cações  de  qualquer  escolha  sobre  o  delineamento  de  estu¬ 
do  e  sobre  os  resultados  obtidos.  Se  uma  forma  de  modelo 
aditivo  é  escolhida,  não  é  possível  estimar  efeitos  intera¬ 
tivos.  Isso  não  significa  que  o  pesquisador  deva  sempre 
incluir  efeitos  interativos,  uma  vez  que  eles  acrescentam 
complexidade  substancial  ao  processo  de  estimação  e  na 
maioria  dos  casos  fazem  com  que  a  análise  seja  executa¬ 
da  no  nível  agregado  e  não  no  individual.  Examinamos 
a  necessidade  de  se  fazer  essa  escolha  e  as  ponderações 
associadas  à  escolha  de  uma  das  formas  em  vários  pontos 
de  nossa  discussão. 

Seleção  da  relação  de  utilidades  parciais:  linear, 
quadrática  ou  utilidades  parciais  separadas 

A  flexibilidade  da  análise  conjunta  para  lidar  com  dife¬ 
rentes  tipos  de  variáveis  vem  das  suposições  que  o  pes¬ 


quisador  faz  referentes  às  relações  das  utilidades  parciais 
dentro  de  um  fator.  Ao  tomar  decisões  sobre  a  regra  de 
composição,  o  pesquisador  decide  como  os  fatores  se  re¬ 
lacionam  uns  com  os  outros  na  estrutura  de  preferência 
do  respondente.  Ao  definir  o  tipo  de  relação  de  utilidades 
parciais,  o  pesquisador  se  concentra  em  como  os  níveis  de 
um  fator  estão  relacionados. 

Tipos  de  relações  de  utilidades  parciais.  A  análise  con¬ 
junta  dá  ao  pesquisador  três  alternativas,  que  variam  da 
mais  restrita  (uma  relação  linear)  até  a  menos  restrita 
(utilidades  parciais  separadas),  com  o  ponto  ideal,  ou  mo¬ 
delo  quadrático,  entre  essas  duas.  A  Figura  7-2  ilustra  as 
diferenças  entre  os  três  tipos  de  relações: 

•  O  modelo  linear  é  o  mais  simples,  ainda  que  seja  a  forma 
mais  restrita,  porque  estimamos  apenas  uma  utilidade  par¬ 
cial  (semelhante  a  um  coeficiente  de  regressão),  a  qual  é 
multiplicada  pelo  valor  do  nível  para  chegar  a  utilidades 
parciais  separadas  para  cada  nível. 

•  Na  forma  quadrática,  também  conhecida  como  o  modelo 
ideal,  a  suposição  de  linearidade  estrita  é  relaxada,  de  modo 
que  temos  uma  relação  curvilínea  simples.  A  curva  pode  ter 
concavidade  para  cima  ou  para  baixo. 

•  Finalmente,  a  forma  de  utilidades  parciais  separadas  (em 
geral  chamada  simplesmente  de  forma  de  utilidades  par¬ 
ciais)  é  a  mais  geral,  permitindo  estimativas  separadas  para 
cada  nível.  Quando  usamos  utilidades  parciais  separadas, 
o  número  de  valores  estimados  é  mais  alto  e  aumenta  ra¬ 
pidamente  quando  acrescentamos  fatores  e  níveis,  porque 
cada  novo  nível  tem  uma  estimativa  de  utilidade  parcial  se¬ 
parada. 

A  forma  de  relação  de  utilidades  parciais  pode  ser  es¬ 
pecificada  para  cada  fator  separadamente,  e  uma  mistura 
de  formas  nos  fatores  é  possível,  se  necessária.  Essa  es¬ 
colha  não  afeta  o  modo  como  os  tratamentos  ou  estímu¬ 
los  são  criados,  e  valores  das  utilidades  parciais  ainda  são 
calculados  para  cada  nível.  No  entanto,  isso  tem  impacto 
sobre  como  e  quais  tipos  de  utilidades  parciais  são  estima¬ 
dos  por  análise  conjunta.  Se  podemos  reduzir  o  número 
de  parâmetros  estimados  para  qualquer  conjunto  dado  de 
estímulos  usando  uma  relação  de  utilidade  parcial  mais 
restrita  (p.ex.,  uma  forma  linear  ou  quadrática),  então 
os  cálculos  são  mais  eficientes  e  mais  confiáveis  sob  um 
ponto  de  vista  de  estimação  estatística.  O  impacto  sobre  o 
número  de  parâmetros  estimados  e  eficiência  estatística  se 
relaciona  diretamente  ao  tipo  de  relação  escolhida: 

•  Se  as  formas  linear  ou  quadrática  são  especificadas,  então  os 
valores  das  utilidades  parciais  para  cada  nível  são  estimados 
a  partir  de  uma  relação.  Uma  relação  linear  requer  a  estima¬ 
tiva  de  um  único  coeficiente,  enquanto  a  relação  quadrática 
exige  dois  parâmetros. 

•  Se  especificarmos  estimativas  separadas  de  utilidades  par¬ 
ciais,  então  o  número  de  parâmetros  se  iguala  ao  de  níveis. 

O  pesquisador  deve  considerar  o  balanço  entre  os  ga¬ 
nhos  em  eficiência  estatística  usando  as  formas  linear  ou 
quadrática  versus  a  representação  potencialmente  mais 
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(b)  Quadrático  ou  ideal 
FIGURA  7-2  Três  tipos  básicos  de  relação  entre  níveis  fatoriais  em  análise  conjunta. 


precisa  de  como  o  cliente  realmente  forma  preferência 
geral  se  empregamos  relações  menos  restritivas  de  utili¬ 
dades  parciais. 

Seleção  de  uma  relação  de  utilidade  parcial.  O  pesquisa¬ 
dor  dispõe  de  diversas  abordagens  para  decidir  o  tipo  de 
relação  para  cada  fator. 

•  Primeiro,  o  pesquisador  pode  confiar  em  pesquisa  anterior 
ou  em  modelos  conceituais  para  ditar  o  tipo  de  relação. 
Deste  modo,  um  pesquisador  pode  ser  capaz  de  especificar 
uma  relação  linear  ou  quadrática  para  conquistar  não  ape¬ 
nas  eficiência  estatística,  mas  também  consistência  com  a 
questão  de  pesquisa. 

•  Se  não  estiver  disponível  suporte  conceituai  para  especi¬ 
ficar  a  forma  da  relação,  o  pesquisador  pode  seguir  uma 
abordagem  mais  empírica.  Aqui  o  modelo  conjunto  é  esti¬ 
mado  primeiro  como  um  modelo  de  utilidade  parcial.  Em 
seguida,  as  diferentes  estimativas  de  utilidade  parcial  são 
examinadas  visualmente  para  que  se  detecte  se  uma  for¬ 
ma  linear  ou  quadrática  é  adequada.  Em  muitos  casos,  a 
forma  geral  é  clara,  e  o  modelo  pode  ser  reestimado  com 
relações  especificadas  para  cada  variável  conforme  for 
justificado. 

•  Finalmente,  o  pesquisador  pode  avaliar  as  mudanças  na  ha¬ 
bilidade  preditiva  sob  diferentes  combinações  de  relações 
para  uma  ou  mais  variáveis,  selecionando  a  relação  que  me¬ 
lhor  representa  os  dados.  No  entanto,  este  método  não  é 
recomendado  sem  pelo  menos  alguma  evidência  teórica  ou 
empírica  do  possível  tipo  de  relação  considerada.  Sem  este 
suporte,  os  resultados  podem  ter  elevada  habilidade  prediti¬ 
va,  mas  pouco  uso  na  tomada  de  decisões. 

Análise  e  interpretação  da  relação  separada  de  ntilidade 
parcial.  A  relação  separada  de  utilidade  parcial  pode 
parecer  uma  opção  lógica  em  todos  os  casos,  mas  o  pes¬ 
quisador  deve  perceber  que  esta  flexibilidade  na  forma  da 
relação  pode  também  criar  dificuldades  na  estimação  ou 
interpretação.  Esses  problemas  acontecem  sempre  que  o 
pesquisador  espera  alguma  forma  de  relação  monotônica 
entre  os  níveis  (ou  seja,  alguma  forma  de  preferência  or¬ 
denada  presente  entre  os  níveis)  sem  especificar  a  forma 
real  dessa  relação  (p.ex.,  linear  ou  quadrática).  Examine¬ 
mos  um  exemplo  para  percebermos  onde  podem  ocorrer 
tais  problemas. 


Considere  que  temos  uma  análise  conjunta  simples  tra¬ 
tando  de  freguesia  de  uma  loja  com  dois  fatores  (tipo  de 
loja  e  distância  de  percurso  à  mesma).  Podemos  estimar 
os  conjuntos  de  utilidades  parciais  com  a  relação  sepa¬ 
rada  de  utilidade  parcial.  Para  o  fator  de  tipo  de  loja, 
as  estimativas  de  utilidade  parcial  representam  a  utili¬ 
dade  relativa  de  cada  tipo  de  loja  sem  qualquer  ordem 
pré-definida  sobre  qual  deve  ser  preferida  sobre  outra 
qualquer.  Com  distância,  a  suposição  mais  provável  é 
que  distância  menor  seja  preferível  sobre  a  maior.  Na 
pior  das  hipóteses,  distâncias  mais  remotas  não  devem 
ser  preferíveis  sobre  as  menores. 

No  entanto,  quando  empregamos  uma  relação  sepa¬ 
rada  de  utilidade  parcial,  o  método  das  utilidades  par¬ 
ciais  não  tem  o  padrão  pré-definido  da  relação  linear  ou 
quadrática.  Podemos  descobrir  que  as  utilidades  parciais 
estimadas  não  seguem  o  padrão  prescrito  para  um  ou 
mais  níveis,  devido  mais  provavelmente  a  inconsistên¬ 
cias  nas  respostas.  Três  quilômetros  de  distância,  por 
exemplo,  podem  ter  uma  utilidade  parcial  maior  do  que 
um  quilômetro,  o  que  parece  ilógico. 


O  pesquisador  sempre  deve  estar  ciente  da  possibili¬ 
dade  dessas  violações  da  relação  monotônica  (conhecidas 
como  inversões)  e  examinar  os  resultados  para  se  certifi¬ 
car  da  seriedade  de  quaisquer  ocorrências.  Retornamos  a 
essa  questão  com  mais  detalhes  quando  discutimos  esti¬ 
mação  (onde  ações  corretivas  são  possíveis)  e  a  interpre¬ 
tação  das  utilidades  parciais  em  si. 

Resumo.  Ao  selecionar  a  relação  de  utilidade  parcial, 
o  pesquisador  deve  equilibrar  habilidade  preditiva  com 
o  uso  pretendido  do  estudo,  a  fundamentação  conceituai 
disponível  e  o  grau  de  relevância  administrativa  e  de  inter¬ 
pretação  necessário.  Pode  ser  necessário  estimar  diversas 
formas  da  relação  para  identificar  a  mais  apropriada  para 
o  contexto  de  escolha  e  o  processo  de  decisão  individual. 

Visão  geral 

O  processo  de  especificação  da  forma  do  modelo  envol¬ 
ve  questões  relativas  à  natureza  e  ao  caráter  dos  fatores 
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e  níveis,  bem  como  o  processo  de  decisão  utilizado  pelo 
respondente.  Assim,  o  pesquisador  deve  estar  ciente  das 
suposições  inerentes  à  cada  escolha  feita  quando  decidir 
sobre  a  regra  de  composição  e  o  tipo  de  relação  de  utilida¬ 
de  parcial  para  cada  fator. 

Coleta  de  dados 

Após  ter  especificado  os  fatores  e  níveis,  mais  a  forma  do 
modelo  básico,  o  pesquisador  deve  tomar  três  decisões  en¬ 
volvendo  coleta  de  dados:  o  tipo  de  método  de  apresen¬ 
tação  dos  estímulos  (troca,  perfil  completo  ou  compara¬ 
ção  aos  pares),  o  tipo  de  variável  de  resposta  e  o  método 
de  coleta  de  dados.  O  objetivo  prioritário  é  transmitir  ao 
respondente  as  combinações  de  atributos  (estímulos)  da 
maneira  mais  realista  e  eficiente  possível.  Na  maioria  das 
vezes,  os  estímulos  são  apresentados  em  descrições  escri¬ 
tas,  apesar  de  modelos  físicos  ou  pictóricos  poderem  ser 
muito  úteis  para  atributos  estéticos  ou  sensoriais. 

Escolha  de  um  método  de  apresentação 

Três  métodos  de  apresentação  de  estímulos  são  mais  co- 
mumente  associados  com  análise  conjunta.  Apesar  de 
diferirem  consideravelmente  na  forma  e  na  quantia  de 
informações  apresentadas  ao  respondente  (ver  Figura 
7-3),  eles  são  todos  aceitáveis  dentro  do  modelo  conjunto 
tradicional.  A  escolha  entre  métodos  de  apresentação  se 
concentra  nas  suposições  sobre  a  extensão  do  processo  do 
cliente  que  é  executado  durante  a  tarefa  conjunta  e  o  tipo 
de  processo  de  estimação  empregado. 

O  método  de  apresentação  de  trocas.  O  método  de  troca 

compara  atributos  aos  pares,  ordenando  todas  as  combina¬ 
ções  de  níveis  (ver  Figura  7-3a).  Ele  tem  as  vantagens  de 
ser  simples  para  o  respondente  e  fácil  de  administrar,  e  evi¬ 
ta  que  informações  se  sobreponham,  apresentando  apenas 
dois  atributos  por  vez.  Foi  a  forma  de  apresentação  mais 
amplamente  usada  nos  anos  iniciais  da  análise  conjunta. 
No  entanto,  o  uso  desse  método  diminuiu  dramaticamente 
nos  últimos  anos  devido  a  diversas  limitações: 

•  Um  sacrifício  em  realismo,  ao  usar  somente  dois  fatores  por 
vez 

•  O  grande  número  de  julgamentos  necessários  mesmo  para 
um  pequeno  número  de  níveis 

•  Uma  tendência  de  os  respondentes  ficarem  confusos  ou  se¬ 
guirem  um  padrão  de  resposta  rotineiro  por  fadiga 

•  Falta  de  habilidade  de  empregar  estímulos  pictóricos  ou  ou¬ 
tros  estímulos  não-escritos 

•  O  uso  de  somente  respostas  não-métricas 

•  Sua  falta  de  capacidade  de  usar  delineamentos  de  estímulos 
fatoriais  fracionários  para  reduzir  o  número  de  comparações 
feitas. 

Estudos  indicam  que  a  terceira  abordagem,  compara¬ 
ções  aos  pares,  suplantou  os  métodos  de  troca  como  o  se¬ 
gundo  método  de  apresentação  mais  usado  nas  aplicações 
comerciais  [118]. 


-  REGRAS  PRÁTICAS  7-3  - 

Especificação  da  forma  de  modelo  e 
das  relações  de  utilidade  parcial 

•  Pesquisadores  podem  escolher  entre  duas  formas  básicas 
de  modelo  sobre  a  regra  de  composição  assumida  para 
indivíduos: 

•  Modelo  aditivo:  Considera  o  tipo  mais  simples  de 
regra  de  composição  (utilidade  para  cada  atributo  é 
simplesmente  adicionada  até  atingir  utilidade  geral) 
e  requer  a  tarefa  de  escolha  e  os  procedimentos  de 
estimação  mais  simples 

•  Modelo  interativo:  Adiciona  termos  de  interação 
entre  atributos  para  retratar  de  maneira  mais  realista 
a  regra  de  composição,  mas  exige  uma  tarefa  de 
escolha  mais  complexa  para  o  respondente  e  para  o 
procedimento  de  estimação. 

•  Modelos  aditivos  geralmente  bastam  para  a  maioria 
das  situações  e  são  os  mais  amplamente  usados 

•  A  estimação  da  utilidade  de  cada  nível  (conhecida  como 
utilidade  parcial)  pode  seguir  uma  de  três  relações: 

•  Linear:  Demanda  que  utilidades  parciais  sejam 
linearmente  relacionadas,  mas  pode  ser  não-realista 
esperar  por  tipos  específicos  de  atributos 

•  Quadrática:  Mais  adequada  quando  se  espera  um 
"ponto  ideal"  nos  níveis  do  atributo 

•  Separada:  Faz  a  estimação  de  cada  utilidade  parcial 
independentemente  de  outros  níveis,  mas  tem  mais 
chances  de  encontrar  inversões  (violações  da  relação 
teorizada) 


O  método  de  apresentação  de  perfil  completo.  O  méto¬ 
do  de  apresentação  mais  popular  é  o  de  perfil  completo, 
principalmente  por  causa  de  seu  evidente  realismo  e  de 
sua  habilidade  em  reduzir  o  número  de  comparações  por 
meio  do  uso  de  delineamentos  fatoriais  fracionários.  Nes¬ 
sa  abordagem,  cada  estímulo  é  descrito  separadamente, 
em  geral  em  um  cartão  de  perfil  (ver  Figura  7-3b).  Essa 
técnica  demanda  menos  julgamentos,  mas  eles  são  mais 
complexos  e  podem  ser  ordenados  ou  avaliados.  Entre 
suas  vantagens,  estão: 

•  Uma  descrição  mais  realista  conseguida  com  a  definição  de 
um  estímulo  em  termos  de  um  nível  para  cada  fator 

•  Uma  descrição  mais  explícita  das  trocas  entre  todos  os  fato¬ 
res  e  as  correlações  ambientais  existentes  entre  os  atributos 

•  O  possível  uso  de  mais  tipos  de  julgamentos  de  preferência, 
como  intenções  de  compra,  probabilidade  de  experimentar 
e  chances  de  troca  -  todos  difíceis  de  responder  com  um  mé¬ 
todo  de  troca. 

O  método  de  perfil  completo  não  é  infalível  e  enfrenta 
duas  grandes  limitações  com  base  na  habilidade  e  capaci¬ 
dade  do  respondente  para  tomar  decisões  razoáveis: 

•  Quando  o  número  de  fatores  aumenta,  o  mesmo  ocorre  com 
a  possibilidade  de  sobrecarga  de  informação.  Q  responden- 
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ANÁLISE  CONJUNTA 


(a)  Método  de  troca 
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Fator  1 :  Preço 

Nível  1  Nível  2  Nível  3  Nível  4 
$1,19  $1,39  $1,49  $1,69 


Nível  1: 
Genérico 

Nível  2: 
KX-19 

Nível  3: 
Limpa-tudo 


o 

re  Nível  4: 

^  Limpeza  total 


(b)  Método  do  perfil  completo 


Nome  da  marca:  KX-19 
Preço:  $1,19 
Forma:  Pó 
Realça  cores:  Sim 


(c)  Comparação  aos  pares 


Nome  da  marca:  KX-1 9 

Nome  da  marca:  Genérico 

Preço:  $1,19 

VERSUS 

Preço:  $1 ,49 

Forma:  Pó 

Forma:  Líquido 

FIGURA  7-3  Exemplos  dos  métodos  de  troca  e  de  perfil  completo  para  apresentação  de  estímulos. 


te  sente-se  tentado  a  simplificar  o  processo,  concentrando- 
se  em  apenas  poucos  fatores,  quando  em  uma  situação  real 
todos  os  fatores  deveriam  ser  considerados. 

•  A  ordem  na  qual  os  fatores  são  listados  no  cartão  de  estí¬ 
mulos  pode  ter  um  impacto  sobre  a  avaliação.  Logo,  o  pes¬ 
quisador  precisa  revezar  os  fatores  entre  os  respondentes, 
quando  possível,  para  minimizar  efeitos  de  ordem. 

O  método  de  perfil  completo  é  recomendado  quando 
o  número  de  fatores  é  6  ou  menos.  Quando  o  número  de 
fatores  varia  de  7  a  10,  o  método  de  troca  se  torna  uma 
possível  opção  para  o  método  de  perfil  completo.  Se  o 
número  de  fatores  excede  10,  então  métodos  alternativos 
(análise  conjunta  adaptativa)  são  sugeridos  [29]. 

O  método  de  apresentação  de  combinação  aos  pares.  O 

terceiro  método  de  apresentação,  a  combinação  aos  pa¬ 
res,  combina  os  dois  outros  métodos.  A  combinação 
aos  pares  é  uma  comparação  de  dois  perfis  (ver  Figura 
7-3c)  em  que  o  respondente  geralmente  usa  uma  escala 
de  avaliação  para  indicar  o  nível  de  preferência  por  um 
perfil  ao  invés  do  outro  [46].  A  característica  notável  da 


comparação  aos  pares  é  que  o  perfil  normalmente  não 
contém  todos  os  atributos,  como  no  caso  do  método  de 
perfil  completo,  mas,  ao  invés  disso,  apenas  uns  poucos 
atributos  por  vez  são  selecionados  na  construção  de  per¬ 
fis  a  fim  de  simplificar  a  tarefa  se  o  número  de  atributos  é 
grande.  O  pesquisador  deve  ser  cuidadoso  em  não  levar 
esta  característica  ao  extremo  e  retratar  estímulos  com 
pouquíssimos  atributos  para  representar  realisticamente 
os  objetos. 

É  semelhante  ao  método  de  troca,  no  sentido  de  que 
os  pares  são  avaliados,  mas  no  caso  do  método  de  troca 
os  pares  avaliados  são  atributos,  ao  passo  que  no  método 
de  comparação  aos  pares  estes  são  perfis  com  múltiplos 
atributos.  O  método  de  comparação  aos  pares  também 
é  instrumental  em  muitos  delineamentos  conjuntos  es¬ 
pecializados,  como  a  análise  conjunta  adaptativa  (ACA) 
[87],  que  é  usada  em  conjunção  com  um  grande  número 
de  atributos  (uma  discussão  mais  detalhada  sobre  grandes 
quantias  de  atributos  aparece  posteriormente  neste  capí¬ 
tulo). 
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Criação  dos  estímulos 

Logo  que  os  fatores  e  níveis  tenham  sido  selecionados  e 
o  método  de  apresentação  tenha  sido  escolhido,  o  pes¬ 
quisador  se  volta  para  a  tarefa  de  criar  os  tratamentos 
ou  estímulos  para  avaliação  por  parte  dos  respondentes. 
Para  qualquer  método  de  apresentação,  o  pesquisador 
sempre  está  diante  de  uma  responsabilidade  crescente  do 
respondente  conforme  o  número  de  estímulos  aumenta 
para  lidar  com  mais  fatores  ou  níveis.  O  pesquisador  deve 
ponderar  os  benefícios  de  esforço  crescente  versus  a  in¬ 
formação  adicional  ganha.  As  seções  a  seguir  detalham 
as  questões  envolvidas  na  criação  de  estímulos  para  cada 
método  de  apresentação. 

O  método  de  apresentação  de  troca.  No  caso  do  método 
de  troca,  todas  as  combinações  possíveis  de  atributos  são 
usadas.  O  número  de  matrizes  no  método  de  troca  é  estri¬ 
tamente  baseado  no  número  de  fatores  e  pode  ser  calcu¬ 
lado  como: 

XT.  j  j  N(N-Í) 

Numero  de  matrizes  de  troca  =  — ^ - - 

2 

onde  N  é  o  número  de  fatores.  Além  disso,  o  pesquisa¬ 
dor  deve  lembrar  que  o  número  de  respostas  dentro  de 
cada  matriz  de  troca  é  igual  ao  produto  dos  níveis  dos 
fatores. 


Por  exemplo,  cinco  fatores  resultariam  em  10  matrizes 
de  troca  [(5  x  4)/2  =  10].  Se  a  matriz  de  troca  tivesse  fa¬ 
tores  de  três  níveis  cada,  tal  matriz  incluiria  nove  (3  x  3) 
avaliações.  Se  os  cinco  fatores  de  nosso  exemplo  tives¬ 
sem  três  níveis  cada,  então  o  respondente  avaliaria  10 
matrizes  de  troca,  cada  uma  com  9  avaliações,  para  um 
total  de  90  avaliações. 


Como  podemos  ver,  esse  método  de  apresentação 
pode  rapidamente  conduzir  a  responsabilidades  pesadas 
sobre  o  respondente  conforme  o  número  de  atributos  ou 
níveis  aumenta.  Contudo,  esse  método  mantém  a  tarefa 
simples,  pedindo  ao  respondente  para  avaliar  somente 
dois  fatores  por  vez,  enquanto  os  outros  métodos  de  apre¬ 
sentação  podem  ficar  complicados  em  termos  de  comple¬ 
xidade  de  estímulos. 

Métodos  de  apresentação  de  perfil  completo  ou  de  com¬ 
paração  aos  pares.  Os  dois  métodos  restantes  -  perfil 
completo  e  comparação  aos  pares  -  envolvem  a  avalia¬ 
ção  de  um  estímulo  por  vez  (perfil  completo)  ou  pares 
de  estímulos  (comparação  aos  pares).  Em  uma  análise 
conjunta  simples  com  um  pequeno  número  de  fatores  e 
níveis  (como  aqueles  discutidos  anteriormente,  para  os 
quais  três  fatores  com  dois  níveis  cada  resultaram  em 
oito  combinações),  o  respondente  avalia  todos  os  estí¬ 
mulos  possíveis.  Isso  é  conhecido  como  planejamento 
fatorial. 


À  medida  que  o  número  de  fatores  e  níveis  aumenta, 
esse  delineamento  se  torna  impraticável,  de  uma  manei¬ 
ra  semelhante  à  mostrada  no  método  de  troca.  Examine¬ 
mos  algumas  situações  típicas  de  pesquisa  para  vermos 
como  a  tarefa  conjunta  pode  rapidamente  se  tornar  im¬ 
praticável. 


Se  o  pesquisador  está  interessado  em  avaliar  o  impacto 
de  quatro  variáveis  com  quatro  níveis  para  cada,  256  es¬ 
tímulos  (4  níveis  x  4  níveis  x  4  níveis  x  4  níveis)  seriam 
criados  em  um  delineamento  fatorial  completo  para  o 
método  de  perfil  completo.  Mesmo  que  o  número  de 
níveis  diminua,  uma  quantia  moderada  de  fatores  pode 
criar  uma  tarefa  difícil.  Para  uma  situação  com  seis  fa¬ 
tores  e  dois  níveis  cada,  64  estímulos  seriam  necessá¬ 
rios.  Se  o  número  de  níveis  crescer  para  somente  três 
nos  seis  fatores,  então  a  quantia  de  estímulos  subiria 
para  729. 


Tais  situações  obviamente  incluem  muitos  estímulos 
para  um  respondente  avaliar  e  ainda  fornecer  respostas 
consistentes  e  com  significado.  Um  número  ainda  maior 
de  pares  de  estímulos  seria  criado  para  as  combinações  de 
pares  de  perfis  com  diferentes  números  de  atributos. 

Porém,  apesar  de  o  respondente  possivelmente  não  ser 
capaz  de  avaliar  todos  os  potenciais  estímulos,  a  quantia 
destes  deve  ser  grande  o  bastante  para  que  se  derivem 
estimativas  estáveis  de  utilidades  parciais.  A  quantia  mí¬ 
nima  de  estímulos  se  iguala  ao  número  de  parâmetros  a 
serem  estimados,  calculado  como: 

Número  de  parâmetros  estimados  =  Número  total  de 
níveis  -  Número  de  atributos  -r  1 

E  sugerido  que  o  respondente  avalie  um  conjunto  de 
estímulos  igual  a  um  múltiplo  (duas  ou  três  vezes)  do  nú¬ 
mero  de  parâmetros.  No  entanto,  quando  a  quantia  de  ní¬ 
veis  e  atributos  sobe,  o  pesquisador  deve  estar  ciente  do 
peso  colocado  sobre  o  respondente  por  quantia  tão  grande 
de  tarefas.  Pesquisas  têm  mostrado  que  respondentes  po¬ 
dem  completar  até  30  tarefas  de  escolha,  mas  depois  deste 
ponto  a  qualidade  dos  dados  pode  se  tornar  questionável 
[92].  O  pesquisador  então  enfrenta  um  dilema:  aumentar 
a  complexidade  das  tarefas  de  escolha  pelo  acréscimo  de 
mais  níveis  e/ou  fatores  faz  crescer  a  quantia  de  parâmetros 
estimados  e  o  número  recomendado  de  tarefas  de  escolha. 
O  pesquisador  deve  ponderar  o  ganho  de  realismo  contra  o 
limite  sobre  o  número  de  tarefas  de  escolha  que  podem  ser 
completadas  por  um  respondente,  o  que  varia  de  acordo 
com  o  tipo  de  método  de  apresentação  e  a  complexidade 
dos  estímulos. 

Com  o  número  de  tarefas  de  escolhas  especificado,  o 
que  se  faz  necessário  a  seguir  é  um  método  para  desenvol¬ 
ver  um  subconjunto  dos  estímulos  totais  que  ainda  forne¬ 
cem  a  informação  necessária  para  se  fazer  estimativas  pre¬ 
cisas  e  confiáveis  de  utilidades  parciais.  A  seção  a  seguir 
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descreve  duas  abordagens  para  criação  de  um  conjunto  de 
estímulos  que  atendem  tais  exigências. 

Definição  de  subconjuntos  de  estímulos.  O  proces¬ 
so  de  seleção  de  um  subconjunto  de  todos  os  estímulos 
possíveis  deve  ser  feito  de  maneira  a  preservar  a  ortogo- 
nalídade  (nenhuma  correlação  entre  níveis  de  um  atribu¬ 
to)  e  o  aspecto  de  planejamento  balanceado  (cada  nível 
em  um  fator  aparece  o  mesmo  número  de  vezes).  Discu¬ 
timos  duas  abordagens  para  selecionar  o  subconjunto  de 
estímulos  que  atendem  esses  critérios. 

1.  Um  planejamento  fatorial  fracionário  é  o  método  mais  co¬ 
mum  para  definir  um  subconjunto  de  estímulos  para  ava¬ 
liação.  Ele  seleciona  uma  amostra  de  estímulos  possíveis, 
em  que  o  número  de  estímulos  depende  do  tipo  de  regra  de 
composição  considerada  para  ser  usada  por  respondentes. 
Utilizando  o  modelo  aditivo,  o  qual  assume  apenas  efeitos 
principais  sem  interações,  o  método  de  perfil  completo  com 
quatro  fatores  a  quatro  níveis  exige  apenas  16  estímulos 
para  estimar  os  efeitos  principais.  A  Tabela  7-6  mostra  dois 
conjuntos  possíveis  de  16  estímulos.  Os  16  estímulos  devem 
ser  cuidadosamente  construídos  para  garantir  a  estimação 
correta  dos  efeitos  principais.  Os  dois  delineamentos  na 
Tabela  7-6  são  delineamentos  ótimos;  eles  são  ortogonais  e 
balanceados. 

Os  demais  240  estímulos  possíveis  em  nosso  exemplo 
que  não  estão  no  planejamento  fatorial  fracionário  esco¬ 
lhido  são  usados  para  estimar  termos  de  interação  se  for 
desejado.  Se  o  pesquisador  decide  que  interações  selecio¬ 
nadas  são  importantes  e  devem  ser  incluídas  na  estimação 
do  modelo,  o  planejamento  fatorial  fracionário  deve  incluir 
estímulos  extras  para  acomodar  as  interações.  Orientações 
publicadas  para  planejamentos  fatoriais  fracionários  ou 


componentes  de  programas  conjuntos  delinearão  os  sub¬ 
conjuntos  de  estímulos  para  manter  ortogonalidade,  tor¬ 
nando  a  geração  de  estímulos  de  perfil  completo  bastante 
fácil  [1, 17,  33,  65]. 

2.  Se  o  número  de  fatores  se  tornar  muito  grande  e  a  metodo¬ 
logia  adaptativa  não  for  aceitável,  um  planejamento  de  liga¬ 
ção  pode  ser  empregado  [8].  Nesse  delineamento,  os  fatores 
são  divididos  em  subconjuntos  de  tamanho  apropriado,  com 
alguns  atributos  se  sobrepondo  entre  os  conjuntos,  de  for¬ 
ma  que  cada  conjunto  tenha  (um)  fator(es)  em  comum  com 
outros  conjuntos  de  fatores.  Os  estímulos  são  então  constru¬ 
ídos  para  cada  subconjunto  de  forma  que  os  respondentes 
jamais  percebam  a  quantia  original  de  fatores  em  um  único 
perfil.  Quando  as  utilidades  parciais  são  estimadas,  os  con¬ 
juntos  separados  de  perfis  são  combinados  e  um  único  con¬ 
junto  de  estimativas  é  fornecido.  Programas  de  computador 
lidam  com  a  divisão  dos  atributos,  criação  de  estímulos  e 
sua  recombinação  para  estimação  [12].  Quando  usamos 
comparações  aos  pares,  o  número  pode  ser  muito  grande  e 
complexo,  de  modo  que  os  programas  interativos  geralmen¬ 
te  são  usados  para  selecionar  os  conjuntos  ótimos  de  pares  à 
medida  que  o  questionamento  prossegue. 

Estímulos  inaceitáveis.  A  criação  de  um  delinea¬ 
mento  ótimo,  com  ortogonalidade  e  equilíbrio,  não  sig¬ 
nifica,  porém,  que  todos  os  estímulos  no  mesmo  serão 
aceitáveis  para  avaliação.  Diversas  razões  explicam  a 
ocorrência  de  estímulos  inaceitáveis. 

1.  A  primeira  é  a  criação  de  estímulos  “óbvios”  -  aqueles  cuja 
avaliação  é  óbvia  por  causa  de  sua  combinação  de  níveis.  Qs 
exemplos  mais  comuns  são  estímulos  com  todos  os  níveis 
com  os  valores  mais  altos  ou  mais  baixos.  Nesses  casos,  os 
estímulos  realmente  fornecem  pouca  informação  sobre  es- 


TABELA  7-6  Dois  planejamentos  fatoriais  fracionários  alternativos  para  um  modelo  aditivo  (apenas  efeitos  principais)  com  quatro  fatores  a 
quatro  níveis  cada 


Estímulo 

Planejamento  1:  Níveis  para... 

a 

Planejamento  2:  Níveis  para... 

a 

Fator  1 

Fator  2 

Fator  3 

Fator  4 

Fator  1 

Fator  2 

Fator  3 

Fator  4 

1 

3 

2 

3 

1 

2 

3 

1 

4 

2 

3 

1 

2 

4 

4 

1 

2 

4 

3 

2 

2 

1 

2 

3 

3 

2 

1 

4 

4 

2 

2 

3 

2 

2 

4 

1 

5 

1 

1 

1 

1 

1 

1 

1 

1 

6 

4 

3 

4 

1 

1 

4 

4 

4 

7 

1 

3 

2 

2 

4 

2 

1 

3 

8 

2 

1 

4 

3 

2 

4 

2 

3 

9 

2 

4 

2 

1 

3 

2 

3 

4 

10 

3 

3 

1 

3 

3 

4 

1 

2 

11 

1 

4 

3 

3 

4 

3 

4 

2 

12 

3 

4 

4 

2 

1 

3 

3 

3 

13 

1 

2 

4 

4 

2 

1 

3 

2 

14 

2 

3 

3 

4 

3 

1 

4 

3 

15 

4 

4 

1 

4 

1 

2 

2 

2 

16 

4 

1 

3 

2 

4 

4 

3 

1 

“Os  números  nas  colunas  sob  os  fatores  1  a  4  são  os  níveis  para  cada  fator.  Por  exemplo,  o  primeiro  estímuio  no  planejamento  1  consiste  de  nível  3  para  o  tator  1 , 
nível  2  para  o  fator  2,  nível  3  para  o  fator  3,  e  nível  1  para  o  tator  4. 
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colha  e  podem  criar  uma  percepção  de  descrença  por  parte 
do  respondente. 

2.  A  segunda  ocorrência  é  a  criação  de  estímulos  inacreditá¬ 
veis  devido  à  correlação  interatributos,  a  qual  pode  criar 
estímulos  com  combinações  de  níveis  (alto  índice  de  quilô¬ 
metros  po  litro,  alta  aceleração)  que  não  são  realistas. 

3.  Finalmente,  restrições  podem  ser  impostas  às  combinações 
de  atributos.  O  projeto  de  pesquisa  pode  excluir  certas  com¬ 
binações  por  serem  inaceitáveis  (ou  seja,  certos  atributos 
não  podem  ser  combinados)  ou  inadequadas  (p.ex.,  certos 
níveis  não  podem  ser  combinados).  Em  qualquer  desses  ca¬ 
sos,  os  atributos  e  níveis  são  importantes  para  a  questão  de 
pesquisa,  mas  certas  combinações  devem  ser  excluídas. 

Em  qualquer  desses  casos,  os  estímulos  inaceitáveis 
apresentam  escolhas  não-realistas  para  o  respondente  e 
devem  ser  eliminados  para  garantir  um  processo  válido 
de  estimação,  bem  como  uma  percepção  de  credibilidade 
da  tarefa  de  escolha  entre  os  respondentes.  Há  diversas 
ações  que  ajudam  a  eliminar  os  estímulos  inaceitáveis: 

1.  Primeiro,  o  pesquisador  pode  gerar  outro  delineamento  fa¬ 
torial  fracionário  e  avaliar  a  aceitabilidade  de  seus  estímu¬ 
los.  Como  muitos  planejamentos  fatoriais  fracionários  são 
possíveis  a  partir  de  qualquer  conjunto  maior  de  estímulos, 
pode  ser  possível  identificar  um  que  não  contenha  qualquer 
estímulo  inaceitável. 

2.  Se  todos  os  delineamentos  contêm  estímulos  inaceitáveis 
e  um  delineamento  alternativo  melhor  não  pode  ser  obti¬ 
do,  então  o  estímulo  inaceitável  pode  ser  eliminado.  Ape¬ 
sar  de  o  delineamento  não  ser  totalmente  ortogonal  (ou 
seja,  será  de  algum  modo  correlacionado  e  é  dito  quase 
ortogonal),  ele  não  violará  quaisquer  suposições  da  aná¬ 
lise  conjunta.  Ele  criará  problemas  semelhantes  à  mul- 
ticolinearidade  em  regressão  (ou  seja,  instabilidade  das 
estimativas  quando  os  níveis  são  ligeiramente  mudados  e 
uma  diminuição  na  habilidade  em  avaliar  o  impacto  único 
de  cada  atributo). 

3.  Muitos  programas  conjuntos  têm  uma  opção  para  excluir 
certas  combinações  de  níveis  (conhecidas  como  pares  proi¬ 
bidos).  Em  tais  casos,  o  programa  tenta  criar  um  conjunto 
de  estímulos  que  é  tão  próximo  quanto  possível  de  um  óti¬ 
mo,  mas  deve  ser  observado  que  esta  opção  não  pode  supe¬ 
rar  falhas  de  planejamento  na  especificação  de  fatores  ou 
níveis.  Em  casos  nos  quais  existe  um  problema  sistemático, 
o  pesquisador  não  deve  se  acomodar  com  um  programa  que 
pode  gerar  um  conjunto  de  estímulos,  pois  o  planejamento 
fatorial  fracionário  resultante  ainda  pode  ter  sérios  vieses 
(baixa  ortogonalidade  ou  equilíbrio)  que  podem  causar  im¬ 
pacto  na  estimação  de  utilidades  parciais. 

Todos  os  delineamentos  quase  ortogonais  devem  ser 
avaliados  quanto  à  eficiência  de  planejamento,  que  é  uma 
medida  da  correspondência  do  delineamento  em  termos 
de  ortogonalidade  e  equilíbrio  em  relação  a  um  delinea¬ 
mento  ótimo  [55].  Normalmente  medidos  em  uma  escala 
de  100  pontos  (delineamentos  ótimos  =  100),  os  delinea¬ 
mentos  não-ortogonais  alternativos  podem  ser  avaliados, 
e  o  mais  eficiente  com  todos  os  estímulos  aceitáveis  pode 
ser  selecionado.  A  maioria  dos  programas  de  análise  con¬ 


junta  para  desenvolver  delineamentos  quase  ortogonais 
avalia  a  eficiência  dos  delineamentos  [54]. 

Estímulos  inaceitáveis  decorrentes  de  correlações  in¬ 
teratributos  podem  ocorrer  em  delineamentos  ótimos  ou 
ortogonais,  e  o  pesquisador  deve  acomodar  os  mesmos 
durante  o  desenvolvimento  dos  delineamentos  em  uma 
base  conceituai.  Em  termos  práticos,  as  correlações  inte¬ 
ratributos  devem  ser  minimizadas,  mas  não  precisam  ser 
nulas  se  pequenas  correlações  (0,20  ou  menos)  acrescen¬ 
tarem  realismo.  A  maioria  dos  problemas  ocorre  no  caso 
de  correlações  negativas,  como  no  caso  de  quilômetros 
por  litro  e  potência.  Acrescentar  fatores  não-correlacio- 
nados  pode  reduzir  a  correlação  média  interatributos,  de 
forma  que,  com  um  número  realista  de  fatores  (p.ex.,  6),  a 
correlação  média  seria  próxima  de  0,20,  o  que  tem  efeitos 
sem  maiores  conseqüências.  O  pesquisador  sempre  deve 
avaliar  a  credibilidade  dos  estímulos  como  uma  medida 
de  relevância  prática. 

Seleção  de  uma  medida  de  preferência  do  cliente 

O  pesquisador  também  deve  selecionar  a  medida  de 
preferência:  ordenação  versus  avaliação  (p.ex.,  uma  es¬ 
cala  de  1  a  10).  Apesar  de  o  método  de  troca  empregar 
apenas  dados  de  ordenação,  os  métodos  de  comparação 
aos  pares  e  perfil  completo  podem  avaliar  a  preferência 
obtendo  uma  avaliação  de  preferência  de  um  estímulo 
sobre  o  outro  ou  apenas  uma  medida  binária  de  qual  é 
preferido. 

Uso  de  uma  medida  de  preferência  por  ordenação. 

Cada  medida  de  preferência  tem  certas  vantagens  e  limi¬ 
tações.  Obter  uma  medida  de  preferência  por  ordenação 
(ou  seja,  ordenar  os  estímulos  dos  mais  preferidos  até  os 
menos  preferidos)  tem  duas  grandes  vantagens:  (1)  é  pos¬ 
sivelmente  mais  confiável,  pois  a  ordenação  é  mais  fácil 
do  que  avaliação  com  um  número  razoavelmente  peque¬ 
no  (20  ou  menos)  de  estímulos,  e  (2)  ela  fornece  maior 
flexibilidade  para  estimar  diferentes  tipos  de  regras  de 
composição. 

No  entanto,  há  uma  desvantagem  importante:  é  difí¬ 
cil  de  administrar,  pois  o  processo  de  ordenação  é  mais 
comumente  executado  pela  ordenação  de  cartões  de  es¬ 
tímulos  na  ordem  de  preferência,  e  essa  ordenação  pode 
ser  feita  apenas  com  entrevistas  pessoais. 

Medida  de  preferência  por  avaliação.  A  alternativa  é 
obter  uma  avaliação  de  preferência  em  uma  escala  métri¬ 
ca.  Medidas  métricas  são  facilmente  analisadas  e  adminis¬ 
tradas,  mesmo  por  correio,  e  permitem  que  a  estimação 
conjunta  seja  realizada  por  regressão  multivariada.  No 
entanto,  os  respondentes  podem  ser  menos  discriminan¬ 
tes  em  seus  julgamentos  do  que  quando  estes  são  orde¬ 
nados.  Além  disso,  dado  o  grande  número  de  estímulos 
avaliados,  é  útil  expandir  a  quantia  de  categorias  de  res¬ 
posta  em  relação  ao  que  se  vê  na  maioria  das  pesquisas 
com  clientes.  Uma  regra  prática  é  ter  11  categorias  (ou 
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seja,  avaliar  de  0  a  10  ou  de  0  a  100  com  incrementos  de 
10)  para  16  ou  menos  estímulos,  e  expandir  para  21  cate¬ 
gorias  para  mais  de  16  estímulos  [58]. 

Escolha  da  medida  de  preferência.  A  decisão  sobre  o  tipo 
de  medida  de  preferência  a  ser  usada  deve  se  basear  em 
questões  práticas  e  conceituais.  Muitos  pesquisadores  pre¬ 
ferem  a  medida  por  ordenação  pelo  fato  de  ela  representar 
o  processo  de  escolha  inerente  em  análise  conjunta:  esco¬ 
lha  entre  objetos.  De  um  ponto  de  vista  prático,  porém,  o 
esforço  de  se  ordenarem  grandes  quantias  de  estímulos  se 
torna  exagerado,  particularmente  quando  a  coleta  de  da¬ 
dos  é  feita  em  um  cenário  diferente  de  entrevista  pessoal. 

A  medida  de  avaliação  tem  a  vantagem  inerente  de 
ser  fácil  de  administrar  em  qualquer  contexto  de  coleta 
de  dados,  apesar  de  também  ter  suas  desvantagens.  Se  os 
respondentes  não  estão  engajados  e  envolvidos  na  tarefa 
de  escolha,  a  medida  de  avaliação  pode  fornecer  pouca 
diferenciação  entre  perfis  (p.ex.,  todos  os  perfis  avaliados 
mais  ou  menos  igual).  Além  disso,  à  medida  que  a  tarefa 
de  escolha  se  torna  mais  envolvida  com  estímulos  adicio¬ 
nais,  o  pesquisador  deve  se  preocupar  não  somente  com  a 
fadiga  com  a  tarefa,  mas  com  a  confiabilidade  das  avalia¬ 
ções  ao  longo  dos  estímulos. 

Administração  de  pesquisa 

No  passado,  a  complexidade  da  tarefa  de  análise  conjunta 
levava  ao  uso  de  entrevistas  pessoais  para  obter  as  res¬ 
postas  conjuntas.  As  entrevistas  pessoais  permitem  ao  en¬ 
trevistador  explicar  as  tarefas  eventualmente  mais  difíceis 
associadas  à  análise  conjunta.  Desenvolvimentos  recen¬ 
tes  em  métodos  de  entrevista,  porém,  têm  possibilitado 
a  condução  da  análise  conjunta  por  correio  (com  questio¬ 
nários  de  lápis  e  papel  ou  consultas  por  computador)  e 
por  telefone.  Se  a  pesquisa  é  delineada  para  garantir  que 
o  respondente  possa  assimilar  e  processar  os  estímulos 
adequadamente,  então  todos  os  métodos  de  entrevista 
produzem  precisão  preditiva  relativamente  parecida  [2]. 
O  uso  de  entrevistas  por  computador  tem  simplificado 
muito  as  demandas  da  tarefa  conjunta  sobre  o  responden¬ 
te  e  tornado  viável  a  administração  de  planejamentos  de 
perfil  completo  [79,  113]  ao  mesmo  tempo  que  tem  tam¬ 
bém  acomodado  até  mesmo  a  análise  conjunta  adaptativa 
[87].  Pesquisas  recentes  demonstraram  a  confiabilidade  e 
a  validade  da  análise  conjunta  de  perfil  completo  quando 
administrada  pela  internet  [80]. 

Uma  preocupação  em  qualquer  estudo  conjunto  é  a 
carga  colocada  sobre  o  respondente  devido  ao  número  de 
estímulos  conjuntos  avaliados.  Obviamente,  o  respondente 
poderia  não  avaliar  todos  os  256  estímulos  de  nosso  deli¬ 
neamento  fatorial  anterior,  mas  qual  é  o  número  adequado 
de  tarefas  em  uma  análise  conjunta?  Uma  pesquisa  recen¬ 
te  de  estudos  conjuntos  comerciais  descobriu  que  os  res¬ 
pondentes  podem  facilmente  completar  até  20  ou  mesmo 
30  avaliações  conjuntas  [51,  92].  Acima  disso,  as  respostas 
começam  a  ficar  menos  confiáveis  e  menos  representativas 


da  estrutura  de  referência  inerente.  O  pesquisador  sempre 
deve  procurar  usar  o  menor  número  possível,  mantendo  e- 
ficiência  no  processo  de  estimação.  Não  obstante,  ao  tentar 
reduzir  o  esforço  envolvido  na  tarefa  de  escolha,  o  pesqui¬ 
sador  não  deve  torná-la  simplista  demais  ou  não-realista. 
Além  disso,  não  há  substituto  para  o  pré -teste  de  um  estu¬ 
do  conjunto  para  avaliar  a  carga  do  respondente,  o  método 
de  administração  e  a  aceitabilidade  dos  estímulos. 

Resumo 

A  decisão  envolvendo  coleta  de  dados  deve  ser  feita  para 
fornecer  a  tarefa  de  escolha  mais  realista  e  envolvente 
possível.  O  pesquisador  deve  considerar  a  experiência 
total  apresentada  ao  respondente  e  buscar  desenvolver 
uma  tarefa  de  escolha  mais  ajustada  ao  plano  de  pesqui¬ 
sa.  Pesquisadores  são  encorajados  a  pré-testar  diferentes 
combinações  de  métodos  de  apresentação,  abordagens  de 
coleta  de  dados  e  medidas  de  preferência,  para  identificar 
o  melhor  método  para  cada  contexto  específico  de  pes¬ 
quisa.  O  desafio  é  realizar  uma  tarefa  de  escolha  realista  e 
envolvente  para  o  respondente.  O  impacto  de  se  manter  o 
envolvimento  do  respondente  foi  avaliado  em  um  estudo 
de  tempos  de  resposta  (o  tempo  necessário  para  comple¬ 
tar  a  tarefa  conjunta).  Foi  demonstrado  que  tempos  de 
resposta  mais  longos  eram  associados  com  resultados  con- 
ceitualmente  consistentes  [34].  O  estudo  também  sugere 
que  respondentes  com  tempos  de  resposta  excessivamen¬ 
te  curtos  comumente  usavam  regras  de  escolha  heurísti¬ 
cas  (p.ex.,  estratégias  simplificadoras)  que  não  refletiam 
o  processo  de  escolha  antecipado.  Tal  estudo  destaca  a 
necessidade  crítica  de  que  pesquisadores  sejam  cientes 
da  experiência  total  sob  a  ótica  do  respondente.  O  uso  de 
análise  conjunta  não  garante  resultados  mais  válidos  se  a 

-  REGRAS  PRÁTICAS  7-4  - 

Coleta  de  dados 

•  Coleta  de  dados  por  métodos  tradicionais  de  análise 
conjunta: 

•  Geralmente  se  consegue  com  alguma  forma  de 
método  de  perfil  completo  usando  um  estímulo 
definido  sobre  todos  os  atributos 

•  O  aumento  do  número  de  fatores  e/ou  níveis  acima 
da  tarefa  mais  simples  (dois  ou  três  fatores  com 
apenas  dois  ou  três  níveis  cada)  requer  alguma  forma 
de  planejamento  fatorial  fracionário  que  especifique 
um  conjunto  estatisticamente  válido  de  estímulos 

•  Metodologias  alternativas  (adaptativas  ou  baseadas 
em  escolha)  discutidas  em  seções  anteriores  fornecem 
opções  em  termos  da  complexidade  e  realismo  da  tarefa 
de  escolha  que  pode  ser  acomodada 

•  Respondentes  devem  se  limitar  a  avaliar  não  mais  do 
que  30  estímulos,  independentemente  da  metodologia 
utilizada 
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compararmos  com  outras  técnicas  multi variadas.  Ao  in¬ 
vés  disso,  o  pesquisador  deve  procurar  criar  uma  tarefa 
de  escolha  que  não  seja  focada  sobre  as  necessidades  ana¬ 
líticas,  mas  sobre  os  respondentes,  para  verdadeiramente 
representar  sua  estrutura  de  preferência. 


ESTÁGIO  3:  SUPOSIÇÕES  DA 
ANÁLISE  CONJUNTA 

A  análise  conjunta  tem  o  menor  conjunto  restritivo  de 
suposições  associadas  com  a  estimação  do  modelo.  O  de¬ 
lineamento  experimental  estruturado  e  a  natureza  gene¬ 
ralizada  do  modelo  tornam  desnecessários  a  maioria  dos 
testes  realizados  em  outros  métodos  de  dependência.  Por¬ 
tanto,  os  testes  estatísticos  de  normalidade,  homocedasti- 
cidade  e  independência  que  foram  executados  para  outras 
técnicas  de  dependência  não  são  necessários  para  a  aná¬ 
lise  conjunta.  O  emprego  de  delineamentos  de  estímulos 
baseados  em  estatísticas  também  garante  que  a  estimação 
não  seja  confusa  e  que  os  resultados  sejam  interpretáveis 
sob  a  regra  de  composição  assumida. 

Ainda  assim,  mesmo  com  menos  suposições  estatísti¬ 
cas,  as  suposições  conceituais  talvez  sejam  maiores  do  que 
em  qualquer  outra  técnica  multivariada.  Como  já  men¬ 
cionado,  o  pesquisador  deve  especificar  a  forma  geral  do 
modelo  (efeitos  principais  versus  modelo  interativo)  antes 
que  a  pesquisa  seja  delineada.  O  desenvolvimento  da  ta¬ 
refa  conjunta  real  sustenta  essa  decisão  e  torna  impossível 
testar  modelos  alternativos  logo  que  a  pesquisa  é  deline¬ 
ada  e  os  dados  são  coletados.  A  análise  conjunta  não  é 
como  a  regressão,  por  exemplo,  na  qual  os  efeitos  adicio¬ 
nais  (termos  de  interação  ou  não-lineares)  podem  ser  fa¬ 
cilmente  avaliados  depois  que  os  dados  foram  coletados. 
Em  análise  conjunta,  o  pesquisador  deve  decidir  quanto  à 
forma  do  modelo  e  delinear  a  pesquisa  em  conformidade 
com  isso.  Logo,  a  análise  conjunta,  embora  tenha  poucas 
suposições  estatísticas,  é  bem  orientada  teoricamente  em 
seu  delineamento,  estimação  e  interpretação. 


ESTÁGIO  4:  ESTIMAÇÁO 
DO  MODELO  CONJUNTO  E 
AVALIAÇÁO  DO  AJUSTE  GERAL 

As  opções  disponíveis  ao  pesquisador  em  termos  de  téc¬ 
nicas  de  estimação  aumentaram  dramaticamente  nos  últi¬ 
mos  anos.  Além  disso,  o  desenvolvimento  de  técnicas  em 
conjunção  com  métodos  especializados  de  apresentação 
de  estímulos  (por  exemplo,  a  análise  conjunta  adaptativa 
ou  a  baseada  em  escolhas)  é  apenas  um  melhoramento 
desse  tipo.  O  pesquisador,  ao  obter  os  resultados  de  um 
estudo  de  análise  conjunta,  tem  inúmeras  opções  disponí¬ 
veis  quando  seleciona  o  método  de  estimação  e  avalia  os 
resultados  (ver  Figura  7-4). 


Seleção  de  uma  técnica  de  estimação 

Por  muitos  anos,  o  tipo  de  processo  de  estimação  foi  ditado 
pela  escolha  de  medida  de  preferência.  No  entanto,  pes¬ 
quisas  recentes  se  concentram  no  desenvolvimento  de  uma 
abordagem  alternativa  de  estimação  apropriada  para  todos 
os  tipos  de  medidas  de  preferência,  ao  mesmo  tempo  que 
também  fornece  uma  metodologia  de  estimação  mais  ro¬ 
busta  e  melhoras  em  resultados  agregados  e  desagregados. 

Abordagens  tradicionais  de  estimação 

Medidas  de  preferência  por  ordem  de  classificação  foram 
tipicamente  estimadas  usando  uma  forma  modificada  de 
análise  de  variância  especificamente  planejada  para  dados 
ordinais.  Entre  os  programas  de  computador  mais  popu¬ 
lares  e  conhecidos  estão  o  MONANOVA  (Análise  Mo- 
notônica  de  Variância)  [46,  53]  e  o  LINMAP  [95].  Esses 
programas  fornecem  estimativas  de  utilidades  parciais  de 
atributos,  de  modo  que  a  ordem  de  classificação  de  sua 
soma  (utilidade  total)  para  cada  tratamento  está  correla¬ 
cionada  tanto  quanto  possível  com  a  ordem  observada. 

Quando  uma  medida  métrica  de  preferência  é  usada 
(p.ex.,  avaliações,  em  vez  de  ordenações),  então  muitos 
métodos,  até  mesmo  a  regressão  múltipla,  podem  estimar 
as  utilidades  parciais  para  cada  nível.  A  maioria  dos  pro¬ 
gramas  disponíveis  hoje  em  dia  pode  acomodar  qualquer 
tipo  de  classificação  (avaliações  ou  ordenamentos),  bem 
como  estimar  qualquer  um  dos  três  tipos  de  relações  (li¬ 
near,  ponto  ideal  e  utilidade  parcial). 

Extensões  para  o  processo  básico  de  estimação 

Até  este  ponto,  discutimos  apenas  estimação  do  modelo 
conjunto  básico  com  efeitos  principais  e  talvez  de  intera¬ 
ção.  Apesar  de  esta  formulação  do  modelo  ser  a  fundamen¬ 
tação  de  todas  as  análises  conjuntas,  extensões  da  mesma 
podem  ser  garantidas  em  alguns  casos.  As  seções  a  seguir 
discutem  extensões  aplicáveis  a  métodos  desagregados  e 
agregados. 

Uma  das  principais  críticas  às  estimações  de  modelo 
agregado  é  a  falta  de  estimativas  separadas  de  utilidades 
parciais  para  cada  indivíduo  versus  a  solução  agregada 
única.  Porém,  o  pesquisador  nem  sempre  é  capaz  de  utili¬ 
zar  uma  abordagem  desagregada  devido  a  considerações 
de  planejamento  (p.ex.,  tipo  de  formato  de  escolha,  núme¬ 
ro  de  variáveis  ou  tamanho  amostrai).  Um  método  para 
explicar  heterogeneidade  é  a  estimação  bayesiana  discu¬ 
tida  na  próxima  seção  [4,  55].  Uma  segunda  metodologia 
é  a  modificação  da  estimação  tradicional  para  introduzir 
uma  forma  de  heterogeneidade  de  respondentes,  o  que 
representa  a  variação  esperada  ao  longo  de  indivíduos  se 
o  modelo  foi  estimado  no  nível  desagregado  [111].  Em 
ambos,  foram  conseguidas  melhorias  na  precisão  prediti- 
va  em  níveis  comparáveis  àqueles  encontrados  em  mode¬ 
los  desagregados  [76]. 

Outra  extensão  no  modelo  conjunto  básico  é  a  incor¬ 
poração  de  variáveis  adicionais  no  processo  de  estimação. 
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Estágio  4 


Estágio  5 


Estágio  6 


Estágio  7 

Usos  adicionais 


FiGURA  7-4  Estágios  4-7  do  diagrama  de  decisão  da  análise  conjunta. 


particularmente  variáveis  refletindo  características  do  in¬ 
divíduo  ou  de  contexto  de  escolha.  Até  aqui  assumimos 
que  preferências  para  os  estímulos  são  completamente 
expressadas  nos  níveis  dos  vários  atributos.  Mas  e  quan¬ 
to  a  outras  medidas  menos  quantificáveis,  como  atitudes 
ou  mesmo  características  sócio-econômicas?  Ainda  que 
possamos  considerar  que  essas  diferenças  individuais  se¬ 
rão  refletidas  nas  estimativas  desagregadas  de  utilidades 
parciais,  em  alguns  casos  é  benéfico  estabelecer  a  relação 
com  esses  tipos  de  variáveis.  Pesquisas  recentes  têm  ex¬ 
plorado  técnicas  para  inclusão  de  variáveis  sócio-econô¬ 


micas  e  ligadas  a  contexto  de  escolha,  bem  como  variáveis 
de  atitudes  e  até  mesmo  de  construtos  latentes  [142].  Tais 
técnicas  não  estão  amplamente  disponíveis  ainda,  mas 
elas  representam  abordagens  potencialmente  úteis  para 
quantificar  os  impactos  de  variáveis  diferentes  daquelas 
usadas  na  construção  dos  estímulos. 

Estimação  bayesiana:  uma 
abordagem  radicalmente  nova 

Os  procedimentos  de  estimação  acima  descritos  se  susten¬ 
tam  na  teoria  estatística  clássica  que  é  a  fundamentação 
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para  todos  os  métodos  multivariados  discutidos  neste  tex¬ 
to.  Esses  métodos,  porém,  estão  sendo  superados  por  uma 
nova  abordagem,  a  análise  bayesiana  [22],  que  é  muito 
diferente  em  seu  método  básico  de  estimação  do  modelo 
conjunto.  A  aplicação  de  análise  bayesiana  está  aconte¬ 
cendo  não  somente  em  análise  conjunta  [3,  56,  62],  mas 
também  em  métodos  mais  tradicionais,  como  a  análise  de 
regressão  [4, 93]. 

Os  aspectos  básicos  da  análise  bayesiana.  A  premissa 
inerente  da  análise  bayesiana  é  o  teorema  de  Bayes,  que 
é  baseado  na  definição  de  dois  valores  de  probabilidade:  a 
probabilidade  a  priori  e  a  probabilidade  a  posteriori.  Em 
um  sentido  geral,  a  probabilidade  a  posteriori  é  aquela 
que  obtemos  a  partir  das  observações  reais  de  dados.  A 
probabilidade  a  prion  é  uma  estimativa  do  quão  provavel¬ 
mente  este  conjunto  particular  de  observações  deve  ocor¬ 
rer  na  população.  Combinando  essas  duas  probabilidades, 
fazemos  alguma  estimativa  da  probabilidade  real  de  um 
evento  (conhecida  como  a  probabilidade  conjunta). 


Examinemos  um  exemplo  simples  para  ilustrar  como 
este  método  funciona  na  estimação  de  probabilidade  de 
ocorrência  de  um  evento.  Considere  que  uma  firma  está 
tentando  entender  o  impacto  de  seu  programa  de  lealda¬ 
de  em  conseguir  que  indivíduos  comprem  um  programa 
estendido  de  garantia.  A  questão  é  se  deve  continuar  o 
suporte  ao  programa  de  lealdade  como  uma  maneira  de 
aumentar  as  compras  das  extensões.  Uma  consulta  aos 
clientes  chegou  aos  seguintes  resultados: 

Probabilidade  a  posteriori  de: 

Comprar  uma  Não  comprar 


Tipo  de  cliente 

extensão 

uma  extensão 

Membro  de  programa 

0,40 

0,60 

de  lealdade 

Não-membro  de  pro- 

0,10 

0,90 

grama  de  lealdade 

Se  olharmos  apenas  para  esses  resultados,  percebe¬ 
remos  que  membros  do  programa  de  lealdade  têm  qua¬ 
tro  vezes  mais  chances  de  comprar  uma  extensão  do  que 
os  não-membros.  Esta  figura  representa  a  probabilidade 
a  posteriori  (ou  seja,  a  probabilidade  de  comprar  uma 
extensão  com  base  no  tipo  de  cliente)  que  podemos  es¬ 
timar  diretamente  a  partir  dos  dados. 

A  probabilidade  a  posteriori  é  apenas  parte  da  aná¬ 
lise,  pois  ainda  precisamos  conhecer  mais  uma  proba¬ 
bilidade:  a  de  que  clientes  se  juntem  ao  programa  de 
lealdade.  Esta  probabilidade  a  priori  descreve  a  possi¬ 
bilidade  de  que  um  dado  cliente  se  junte  ao  programa 
de  lealdade. 

Se  estimamos  que  10%  de  nossos  clientes  são  mem¬ 
bros  do  programa  de  lealdade,  podemos  agora  estimar 
as  probabilidades  de  que  qualquer  tipo  de  cliente  com¬ 


pre  uma  extensão.  Fazemos  isso  multiplicando  a  proba¬ 
bilidade  a  priori  pela  a  posteriori  para  obter  a  probabili¬ 
dade  conjunta.  Para  nosso  exemplo,  este  cálculo  resulta 
no  que  se  segue: 

PROBABILIDADES  CONJUNTAS  DE  COMPRA 
DE  UMA  EXTENSÃO 

Probabilidade  conjunta 

Probabilida-  Sem 

Tipo  de  cliente  de  a  priori  Compra  compra  Total 


Membro  do 
programa  de 
lealdade 

10% 

0,04 

0,06 

0,10 

Fora  do  pro¬ 
grama  de  leal¬ 
dade 

90% 

0,09 

0,81 

0,90 

Total 

0,13 

0,87 

1,00 

Agora  podemos  ver  que  mesmo  que  membros  do  pro¬ 
grama  de  lealdade  comprem  extensões  em  um  ritmo  mui¬ 
to  maior  do  que  não-membros,  a  proporção  relativamente 
menor  de  clientes  no  programa  de  lealdade  (10%)  os  tor¬ 
na  uma  minoria  de  compradores  da  extensão.  Na  verdade, 
membros  do  programa  de  lealdade  compram  apenas  algo 
em  torno  de  30%  (0,04/0,13  =  0,307)  das  extensões. 


Como  vimos  neste  exemplo,  podemos  perceber  que 
não  estamos  fazendo  uma  estimação  estatística,  mas  em¬ 
pírica.  Como  tal,  a  estimação  bayesiana  se  sustenta  em 
análise  extensiva  dos  dados  para  determinar  as  estimati¬ 
vas  de  probabilidade  precisas  a  partir  dos  dados. 

Vantagens  e  desvantagens  da  estimação  bayesiana.  Ao 

se  usar  análise  bayesiana  para  a  estimação  de  um  modelo 
conjunto,  o  pesquisador  não  precisa  fazer  nada  diferente; 
esses  valores  de  probabilidades  são  estimados  pelo  pro¬ 
grama  a  partir  do  conjunto  de  observações.  A  questão  a 
ser  colocada,  porém,  é:  quais  são  as  vantagens  e  desvanta¬ 
gens  de  se  empregar  esta  técnica?  Examinemos  com  mais 
detalhes. 

Vantagens.  Muitos  estudos  examinaram  a  estimação 
bayesiana  em  comparação  com  métodos  mais  tradicionais 
e  em  todos  os  casos  foi  constatado  que  a  estimação  baye¬ 
siana  é  comparável  ou  até  superior  tanto  para  estimação 
de  utilidade  parcial  quanto  na  capacidade  preditiva  [6]. 
No  entanto,  as  vantagens  vão  além  da  mera  precisão  de 
estimação.  Dada  a  natureza  das  estimativas  exigidas  de 
probabilidade,  a  estimação  bayesiana  permite  que  os  mo¬ 
delos  conjuntos  sejam  estimados  individualmente  onde 
antes  apenas  modelos  agregados  eram  viáveis  (ou  seja, 
modelos  conjuntos  baseados  em  escolha  e  mesmo  mode¬ 
los  mais  complexos  com  termos  de  interação).  Para  este 
propósito,  ela  tem  sido  incorporada  em  todos  os  modelos 
conjuntos  básicos  [89,  91]. 
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Desvantagens.  Estimação  bayesiana  tem  alguns 
problemas.  Primeiro,  ela  requer  uma  amostra  grande 
(tipicamente  200  ou  mais  respondentes),  pois  ela  é  de¬ 
pendente  da  amostra  para  estimativas  de  probabilidades 
a  priori.  Esta  exigência  difere  de  modelos  conjuntos  tra¬ 
dicionais  que  poderiam  ser  estimados  somente  para  um 
indivíduo.  Segundo,  ela  exige  consideravelmente  mais 
recursos  computacionais  por  usar  uma  abordagem  itera¬ 
tiva  na  estimação.  Análises  que  podem  ser  estimadas  em 
segundos  usando  meios  tradicionais  agora  demandam 
várias  horas  [103].  Mesmo  que  os  rápidos  avanços  no 
poder  computacional  de  alguma  forma  minimizem  esse 
problema,  o  pesquisador  ainda  deve  estar  ciente  dos  re¬ 
cursos  extras  exigidos. 

Resumo.  Como  a  análise  bayesiana  está  se  tornando 
uma  alternativa  viável  para  a  estimação  de  outras  téc¬ 
nicas  multivariadas,  seu  emprego  em  análise  conjunta 
também  está  aumentando.  Algumas  questões  ainda  pre¬ 
cisam  ser  tratadas,  mas  a  estimação  bayesiana  represen¬ 
ta  melhoras  potencialmente  significantes  em  relação  a 
métodos  existentes  em  termos  de  habilidade  preditiva 
e  explanatória.  Pesquisadores  são  encorajados  a  exa¬ 
minar  opções  de  estimação  bayesiana  em  análise  con¬ 
junta  sempre  que  disponíveis  e  continuar  a  seguir  seu 
progresso  à  medida  que  as  questões  de  implementação 
são  abordadas. 

Utilidades  parciais  estimadas 

Uma  vez  que  um  método  de  estimação  é  escolhido,  as 
respostas  a  cada  estímulo  são  analisadas  para  estimar  as 
utilidades  parciais  para  cada.  O  método  mais  comum  é 
alguma  forma  de  regressão,  dependendo  se  a  medida  de¬ 
pendente  é  métrica  ou  não.  Como  tais,  as  utilidades  par¬ 
ciais  estimadas  são  essencialmente  coeficientes  de  regres¬ 
são  estimados  com  variáveis  dicotômicas,  e  um  nível  para 
cada  atributo  é  eliminado  para  evitar  singularidade  (ver 
Capítulo  4  para  uma  discussão  mais  detalhada  do  uso  de 
variáveis  dicotômicas  em  regressão).  Assim,  as  estimati¬ 
vas  resultantes  de  utilidade  parcial  devem  ser  interpreta¬ 
das  em  um  sentido  relativo. 


Como  podemos  ver,  as  utilidades  parciais  devem  ser  jul¬ 
gadas  umas  em  relação  às  outras,  pois  elas  têm  valores 
negativos  e  positivos.  Por  exemplo,  para  o  segundo  atri¬ 
buto,  o  segundo  nível  é  na  verdade  o  menos  desejado 
(mais  negativo)  por  uma  pequena  quantia,  com  o  quarto 
nível  tendo  a  maior  utilidade.  Os  níveis  também  podem 
ser  comparados  ao  longo  dos  atributos,  mas  deve-se  to¬ 
mar  cuidado  para  que  primeiro  se  avaliem  os  níveis  den¬ 
tro  do  atributo  para  estabelecer  sua  posição  relativa. 


Para  ajudar  na  interpretação,  muitos  programas  con¬ 
vertem  as  estimativas  de  utilidade  parcial  para  alguma  es¬ 
cala  em  comum  (p.ex.,  do  mínimo  de  zero  até  um  máximo 
de  100  pontos)  para  permitir  uma  comparação  nos  atribu¬ 
tos  para  um  indivíduo  e  ao  longo  de  indivíduos. 


Abaixo  estão  as  utilidades  parciais  escalonadas  para  o 
exemplo  que  acaba  de  ser  discutido.  Como  podemos  ver, 
elas  são  muito  mais  fáceis  de  interpretar,  tanto  dentro  de 
atributos  quanto  ao  longo  dos  mesmos. 


Atributo  1 

Atributo  2 

Atributo  3 

Nível 

Utilidade 

parcial 

Nível 

Utilidade 

parcial 

Nível 

Utilidade 

parcial 

1 

0,00 

1 

0,23 

1 

2,15 

2 

18,29 

2 

0,00 

2 

0,00 

3 

12,76 

3 

45,59 

3 

36,59 

4 

34,53 

4 

48,38 

4 

68,28 

5 

29,54 

A  ordenação  relativa  nos  valores  originais  de  utilida¬ 
de  é  preservada,  mas  agora  o  menor  nível  em  cada  atri¬ 
buto  é  marcado  como  zero  e  todos  os  demais  níveis  são 
valorados  relativamente  a  este  valor  mínimo. 


Como  as  estimativas  de  utilidade  parcial  são  sempre 
interpretadas  em  uma  perspectiva  relativa  (uma  utilida¬ 
de  parcial  versus  outra)  no  lugar  de  um  valor  absoluto  (a 
quantia  real  de  mudança  na  medida  dependente),  o  pes¬ 
quisador  deve  se  concentrar  em  um  método  para  retratar 
os  resultados  que  mais  facilite  a  aplicação  e  a  interpreta¬ 
ção.  O  escalonamento  das  estimativas  de  utilidade  parcial 
fornece  uma  maneira  simples,  ainda  que  efetiva,  de  apre¬ 
sentação  da  posição  relativa  de  cada  nível.  Este  formato  é 
também  útil  para  representação  gráfica  e  oferece  um  modo 
de  usar  mais  facilmente  as  utilidades  parciais  em  outras 
técnicas  multivariadas,  como  a  análise  de  agrupamentos. 

Avaliação  da  qualidade  de  ajuste  do  modelo 

Os  resultados  da  análise  conjunta  são  avaliados  quanto  a 
precisão  em  nível  individual  e  agregado.  O  objetivo  em 
ambas  as  situações  é  determinar  o  quão  consistentemente 
o  modelo  prevê  o  conjunto  de  avaliações  de  preferência. 


Aqui  está  um  exemplo  de  utilidades  parciais  estimadas 
usando  ACA  [87]  para  um  planejamento  simples  de  três 
atributos  com  cinco  e  quatro  níveis. 


Atributo  1 

Atributo  2 

Atributo  3 

Nível 

Utilidade 

parcial 

Nível 

Utilidade 

parcial 

Nível 

Utilidade 

parcial 

1 

-0,657 

1 

-0,751 

1 

-0,779 

2 

-0,0257 

2 

-0,756 

2 

-0,826 

3 

-0,378 

3 

0,241 

3 

-0,027 

4 

5 

0,098 

-0,0111 

4 

0,302 

4 

0,667 
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Avaliação  de  modelos  conjuntos  no  nível  individual 

O  papel  da  medida  de  qualidade  de  ajuste  é  avaliar  a  qua¬ 
lidade  do  modelo  estimado  comparando  valores  reais  das 
variáveis  dependentes  com  valores  previstos  pelo  modelo 
estimado.  Por  exemplo,  em  regressão  múltipla  correlacio¬ 
namos  os  valores  reais  e  previstos  da  variável  dependente 
por  meio  do  coeficiente  de  determinação  (R^)  ao  longo  de 
todos  os  respondentes.  Em  análise  discriminante,  compa¬ 
ramos  as  pertinências  reais  e  previstas  a  grupos  para  cada 
membro  da  amostra  na  matriz  de  classificação.  O  que  di¬ 
ferencia  análise  conjunta  de  outras  técnicas  multivariadas 
é  que  modelos  conjuntos  separados  são  estimados  para 
cada  indivíduo,  exigindo  que  a  medida  de  qualidade  do 
ajuste  forneça  informação  sobre  as  utilidades  parciais  esti¬ 
madas  para  cada  respondente.  Como  vemos  nas  próximas 
discussões,  este  processo  requer  cuidado  especial  no  tipo 
de  medida  de  qualidade  de  ajuste  usada  e  como  é  inter¬ 
pretada. 

Tipos  de  medidas  de  qualidade  de  ajuste.  Para  um  mo¬ 
delo  de  nível  individual,  a  medida  de  qualidade  do  ajuste 
é  calculada  para  cada  indivíduo.  Como  tal,  ela  se  baseia  na 
quantia  e  tipos  de  tarefas  de  escolha  executadas  por  cada 
respondente.  Quando  as  tarefas  de  escolha  envolvem  da¬ 
dos  de  ordenação  não-métricos,  correlações  baseadas  nas 
ordens  reais  e  previstas  (p.ex.,  rô  de  Spearman  ou  tau  de 
Kendall)  são  usadas.  Quando  as  tarefas  de  escolha  envol¬ 
vem  uma  avaliação  (p.ex.,  preferência  em  uma  escala  de 
0  a  100),  então  uma  simples  correlação  de  Pearson,  como 
aquela  usada  em  regressão,  é  adequada.  Nos  dois  casos,  as 
utilidades  parciais  estimadas  são  empregadas  para  gerar 
valores  previstos  de  preferência  (ordenações  ou  avalia¬ 
ções  métricas)  para  cada  estímulo.  As  preferências  reais 
e  previstas  são  então  correlacionadas  para  cada  pessoa  e 
testadas  quanto  a  significância  estatística.  Indivíduos  que 
têm  pouco  ajuste  preditivo  devem  ser  candidatos  para  eli¬ 
minação  da  análise. 

Avaliação  da  força  da  medida  de  qualidade  de  ajuste. 

Quão  altos  devem  ser  os  valores  de  qualidade  de  ajus¬ 
te?  Como  ocorre  com  a  maioria  das  medidas  de  ajuste, 
valores  maiores  indicam  um  ajuste  melhor.  No  entanto, 
na  maioria  dos  experimentos  conjuntos  o  número  de  es¬ 
tímulos  não  excede  substancialmente  o  número  de  parâ¬ 
metros,  e  o  potencial  para  superajustar  os  dados,  e  assim 
superestimar  a  qualidade  de  ajuste,  está  sempre  presente. 
Medidas  de  qualidade  de  ajuste  não  são  corrigidas  quanto 
aos  graus  de  liberdade  no  modelo  de  estimação. 

Logo,  à  medida  que  o  número  de  estímulos  se  apro¬ 
xima  da  quantia  de  parâmetros  estimados,  o  pesquisador 
deve  aplicar  uma  referência  maior  para  valores  aceitáveis 
de  qualidade  de  ajuste.  Por  exemplo,  regressão  múltipla 
é  muitas  vezes  usada  no  processo  de  estimação  métrica. 
Ao  avaliar  qualidade  de  ajuste  com  o  coeficiente  de  de¬ 
terminação  {R^),  o  pesquisador  sempre  deve  calcular  o  R^ 
ajustado,  que  compensa  para  menos  graus  de  liberdade. 


Assim,  em  muitos  casos,  o  que  parecem  ser  valores  de 
qualidade  de  ajuste  aceitáveis  em  análise  conjunta  podem, 
na  realidade,  refletir  valores  ajustados  consideravelmente 
menores,  pois  o  número  de  estímulos  avaliado  não  é  subs¬ 
tancialmente  maior  do  que  o  número  de  utilidades  par¬ 
ciais  (ver  Capítulo  4  para  uma  discussão  mais  detalhada 
sobre  o  processo  de  ajuste).  Além  disso,  valores  que  são 
excessivamente  elevados  (muito  próximos  de  100%)  po¬ 
dem  não  refletir  ajuste  exageradamente  bom,  mas  indicar 
respondentes  que  podem  não  estar  seguindo  corretamen¬ 
te  as  tarefas  de  escolha  e  assim  também  são  candidatos  à 
eliminação. 

Uso  de  uma  amostra  de  validação.  Qs  pesquisadores 
são  também  encorajados  a  medir  a  precisão  do  modelo 
não  apenas  nos  estímulos  originais,  mas  também  com  um 
conjunto  de  estímulos  de  validação.  Em  um  procedimento 
semelhante  a  uma  amostra  de  validação  em  análise  discri¬ 
minante,  o  pesquisador  prepara  mais  cartões  de  estímulos 
do  que  o  necessário  para  a  estimação  das  utilidades  par¬ 
ciais,  e  o  respondente  avalia  todos  ao  mesmo  tempo.  Pa¬ 
râmetros  do  modelo  conjunto  estimado  são  então  usados 
para  prever  a  preferência  para  o  novo  conjunto  de  estímu¬ 
los,  os  quais  são  comparados  com  as  respostas  reais  para 
se  avaliar  a  confiabilidade  do  modelo  [48].  A  amostra  de 
validação  também  dá  ao  pesquisador  uma  oportunidade 
para  uma  avaliação  direta  de  estímulos  de  interesse  para 
o  estudo  da  pesquisa. 

Porém,  ao  medir  a  qualidade  de  ajuste  de  uma  amos¬ 
tra  de  validação,  o  pesquisador  deve  ser  muito  cuidadoso 
na  avaliação  dos  valores  reais  da  medida.  Na  maioria  dos 
casos,  a  amostra  de  validação  pode  conter  um  pequeno 
número  de  estímulos  adicionais  (de  quatro  a  seis),  e  as¬ 
sim  os  valores  são  calculados  para  um  pequeno  número 
de  observações.  Valores  extremamente  altos  podem  ser 
suspeitos  no  sentido  de  que  eles  não  refletem  bom  ajuste, 
mas  problemas  fundamentais  na  estrutura  de  preferência 
estimada  do  processo  de  escolha  em  si. 

Avaliação  do  nível  agregado 

Se  uma  técnica  de  estimação  agregada  é  usada,  então  os 
mesmos  procedimentos  básicos  se  aplicam,  só  que  agora 
agregados  ao  longo  de  respondentes.  Pesquisadores  têm 
também  a  opção  de  escolherem  uma  amostra  de  validação 
de  respondentes  em  cada  grupo  para  avaliarem  precisão 
preditiva.  Em  tais  casos,  o  modelo  agregado  é  aplicado  a 
indivíduos  e  então  avaliado  em  termos  de  precisão  prediti¬ 
va  de  suas  escolhas.  Este  método  não  é  adequado  para  re¬ 
sultados  desagregados,  pois  nenhum  modelo  generalizado 
está  disponível  para  ser  aplicado  na  amostra  de  validação, 
e  cada  respondente  na  amostra  de  estimação  apresenta 
estimativas  individualizadas  de  utilidade  parcial. 

Resumo 

A  natureza  única  da  estimação  de  modelos  de  análise  con¬ 
junta  requer  uma  perspectiva  diferente  sobre  medidas  de 
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qualidade  de  ajuste  tanto  no  nível  individual  quanto  agre¬ 
gado.  Como  qualquer  medida  de  qualidade  de  ajuste  pode 
ser  superajustada  quando  se  avalia  um  único  respondente, 
o  pesquisador  deve  cuidar  para  complementar  qualquer 
processo  empírico  com  avaliação  adicional  através  do 
exame  da  estrutura  estimada  de  preferência,  como  discu¬ 
tido  na  próxima  seção.  Esta  avaliação  é  particularmente 
importante  para  valores  extremamente  altos,  que  podem 
na  verdade  sinalizar  mais  problemas  fundamentais  do  que 
ajuste  excelente  propriamente  dito. 


ESTÁGIO  5:  INTERPRETAÇÃO 
DOS  RESULTADOS 

A  abordagem  corriqueira  para  interpretar  a  análise  con¬ 
junta  é  desagregada.  Ou  seja,  cada  respondente  é  modela¬ 
do  separadamente  e  os  resultados  do  modelo  (estimativas 
de  utilidade  parcial  e  avaliações  de  importância  de  atribu¬ 
to)  são  examinados  para  cada  respondente.  Interpretação, 
contudo,  também  pode  ocorrer  com  resultados  agregados. 
Se  a  estimação  do  modelo  é  feita  no  nível  individual  e  en¬ 
tão  agregada,  ou  estimativas  agregadas  são  feitas  para  um 
conjunto  de  respondentes,  a  análise  ajusta  um  modelo  ao 
agregado  das  respostas.  Como  se  pode  esperar,  tal  proces¬ 
so  geralmente  conduz  a  resultados  pobres  quando  se  prevê 
o  que  qualquer  respondente  faria  ou  quando  se  interpre¬ 
tam  as  utilidades  parciais  para  qualquer  respondente  em 
particular.  A  menos  que  o  pesquisador  esteja  lidando  com 
uma  população  que  definitivamente  exiba  comportamento 
homogêneo  em  relação  aos  atributos,  a  análise  agregada 

-  REGRAS  PRÁTICAS  7-5  - 

Estimação  de  um  Modelo  Conjunto 

•  A  seleção  de  um  método  de  estimação  é  direta: 

•  O  método  mais  comum  é  uma  abordagem  baseada 
em  regressão,  aplicável  com  todas  as  medidas 
métricas  de  preferência 

•  O  uso  de  dados  ordenados  de  preferência  exige  uma 
estimação  mais  especializada  (p.ex.,  MONANOVA) 

•  Métodos  bayesianos  estão  surgindo,  os  quais 
permitem  modelos  individuais  a  serem  estimados 
onde  não  era  possível  antes,  mas  eles  demandam 
amostras  maiores,  são  mais  intensivos  em  termos 
computacionais  e  não  estão  tão  disponíveis 

•  Qualidade  de  ajuste  deve  ser  avaliada  com: 

•  Coeficiente  de  correlação  (R^)  entre  preferências 
reais  e  previstas 

•  Medidas  baseadas  em  ordenações  das  preferências 
previstas  e  reais 

•  Medidas  para  as  amostras  de  estimação  e  de 
validação  de  estímulos  adicionais  não  usados  no 
processo  de  estimação 


não  deve  ser  usada  como  o  único  método  de  estudo.  Não 
obstante,  muitas  vezes  a  análise  agregada  prevê  mais  pre¬ 
cisamente  comportamento  agregado,  como  participação 
de  mercado.  Assim,  o  pesquisador  deve  identificar  o  prin¬ 
cipal  objetivo  do  estudo  e  empregar  o  nível  apropriado  de 
análise  ou  uma  combinação  dos  níveis  da  mesma. 

Exame  das  utilidades  parciais  estimadas 

O  método  mais  comum  de  interpretação  é  um  exame  das 
estimativas  das  utilidades  parciais  para  cada  fator,  ava¬ 
liando  sua  magnitude  e  padrão.  Estimativas  de  utilidades 
parciais  são  tipicamente  escalonadas  de  modo  que  quanto 
maior  a  utilidade  parcial  (seja  positiva  ou  negativa),  maior 
o  impacto  sobre  a  utilidade  geral.  Como  observado  ante¬ 
riormente,  muitos  programas  reescalonam  as  utilidades 
parciais  para  uma  escala  em  comum,  como  uma  de  0  a  100, 
de  modo  a  viabilizar  uma  comparação  mais  fácil  entre  fa¬ 
tores  para  um  indivíduo  e  mesmo  entre  indivíduos. 

Garantia  de  relevância  prática 

Ao  avaliar  qualquer  conjunto  de  estimativas  de  utilidades 
parciais,  o  pesquisador  deve  considerar  tanto  a  relevância 
prática  quanto  a  correspondência  com  quaisquer  relações 
teóricas  entre  níveis.  Em  termos  de  relevância  prática,  a 
principal  consideração  é  o  grau  de  diferenciação  entre 
utilidades  parciais  dentro  de  cada  atributo.  Por  exemplo, 
valores  de  utilidade  parcial  podem  ser  graficamente  repre¬ 
sentados  para  identificação  de  padrões.  Padrões  relativa¬ 
mente  constantes  indicam  um  grau  de  indiferença  entre  os 
níveis,  no  sentido  de  que  o  respondente  não  viu  entre  os 
níveis  muita  diferença  que  afetasse  a  escolha.  Desse  modo, 
seja  por  meios  gráficos,  seja  por  comparação  empírica  en¬ 
tre  os  níveis,  é  imperativo  que  o  pesquisador  avalie  cada 
conjunto  de  utilidades  parciais  para  garantir  que  eles  sejam 
uma  representação  adequada  da  estrutura  de  preferência. 

Avaliação  de  consistência  teórica 

Muitas  vezes  um  atributo  tem  uma  estrutura  teórica  para 
as  relações  entre  níveis.  A  mais  comum  é  a  monotônica, 
tal  que  as  utilidades  parciais  do  nível  C  devem  ser  maio¬ 
res  do  que  aquelas  do  nível  B,  que,  por  sua  vez,  devem 
ser  maiores  do  que  as  utilidades  parciais  do  nível  A.  Si¬ 
tuações  comuns  nas  quais  tal  relação  é  teorizada  incluem 
atributos  como  preço  (preços  menores  sempre  têm  valores 
maiores),  qualidade  (qualidade  maior  é  sempre  melhor), 
ou  conveniência  (lojas  mais  próximas  são  preferíveis  a  lo¬ 
jas  mais  distantes).  Com  estes  e  muitos  outros  atributos,  o 
pesquisador  tem  uma  relação  sustentada  em  teoria  à  qual 
os  valores  de  utilidade  parcial  devem  corresponder. 

O  que  acontece  quando  as  utilidades  parciais  não  se¬ 
guem  o  padrão  teorizado?  Introduzimos  o  conceito  de 
uma  inversão  em  nossa  discussão  anterior  de  formas  de 
modelo  para  as  situações  nas  quais  os  valores  de  utilida¬ 
de  parcial  violam  a  relação  monotônica  assumida.  Em  um 
sentido  simples,  estamos  nos  referindo  às  situações  apa- 
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rentemente  sem  sentido  nas  quais  respondentes  valorizam 
o  pagamento  de  preços  mais  altos,  tendo  menor  qualidade 
ou  percorrendo  distâncias  mais  longas.  Uma  inversão  re¬ 
presenta  distorções  potencialmente  sérias  na  representa¬ 
ção  de  uma  estrutura  de  preferência.  Isso  não  apenas  afeta 
a  relação  entre  níveis  adjacentes,  mas  pode  afetar  as  utili¬ 
dades  parciais  para  o  atributo  inteiro. 

Quando  inversões  criam  uma  estrutura  de  preferência 
que  não  pode  ser  teoricamente  suportada,  o  pesquisador 
deve  então  considerar  a  eliminação  do  respondente.  Está 
em  questão  o  tamanho  e  a  freqüência  de  inversões,  pois 
elas  representam  padrões  ilógicos  ou  inconsistentes  na  es¬ 
trutura  geral  de  preferência  quando  medida  pelas  utilida¬ 
des  parciais. 

Fatores  que  contribuem  para  inversões.  Dadas  as  conse- 
qüências  potencialmente  sérias  de  uma  inversão,  um  pes¬ 
quisador  deve  reconhecer  fatores  no  projeto  de  pesquisa 
que  criam  a  possibilidade  de  inversões.  Tais  fatores  devem 
ser  considerados  quando  se  julga  a  extensão  de  inversões 
e  quando  se  chega  a  uma  conclusão  quanto  à  validade  ou 
não  de  uma  estrutura  de  preferência: 

•  Empenho  do  respondente:  Um  fator  crítico  no  sucesso  de 
qualquer  análise  conjunta  é  interesse  mantido  nas  tarefas 
conjuntas  a  fim  de  se  avaliar  com  precisão  a  estrutura  de 
preferência.  Muitos  fatores,  porém,  podem  diminuir  este 
empenho,  como  cansaço  do  respondente  com  as  tarefas 
conjuntas  ou  outras  partes  da  pesquisa,  ou  desinteresse  na 
tarefa  de  pesquisa.  Uma  medida  simples  de  interesse  do  res¬ 
pondente  é  o  tempo  despendido  nas  tarefas  conjuntas.  O 
pesquisador  sempre  deve  pré-testar  as  tarefas  conjuntas  e 
desenvolver  um  período  mínimo  de  tempo  considerado  ne¬ 
cessário  para  completar  a  tarefa  de  forma  confiável.  Em  se¬ 
guida,  para  indivíduos  abaixo  deste  tempo  referencial,  deve 
ser  dada  consideração  especial  no  exame  de  suas  utilidades 
parciais  quanto  a  inversões. 

•  Método  de  coleta  de  dados:  O  método  preferido  de  adminis¬ 
tração  é  através  de  entrevista  pessoal  por  conta  da  possível 
complexidade  das  tarefas  de  escolha,  mas  avanços  recentes 
tornam  viáveis  meios  alternativos  de  coleta  de  dados  (p.ex., 
via  Web,  correio  ou  telefone).  Apesar  de  estudos  funda¬ 
mentarem  a  validade  preditiva  dessas  medidas  alternativas, 
o  pesquisador  deve  considerar  que  tais  situações  podem 
exibir  um  nível  maior  de  inversões  devido  a  fatores  como 
crescente  empenho  exigido  do  respondente,  perda  de  inte¬ 
resse,  ou  mesmo  incapacidade  de  resolver  questões  ou  até 
confusão  com  a  tarefa  de  pesquisa. 

O  pesquisador  sempre  deve  incluir  alguma  forma  de 
interrogatório  sobre  as  manifestações  do  respondente, 
através  de  uma  série  de  questões  administradas  após  uma 
tarefa  conjunta  ou  por  meio  de  uma  série  de  sondagens  pro¬ 
movidas  pelo  entrevistador  em  uma  entrevista  pessoal.  O 
objetivo  deve  ser  a  avaliação  do  nível  de  compreensão  do 
respondente  sobre  os  fatores  e  níveis  envolvidos,  bem  como 
do  realismo  da  tarefa  de  escolha. 

•  Contexto  de  pesquisa:  Uma  questão  final  que  contribui  para 
o  nível  potencial  de  inversões  é  o  objeto/conceito  sob  es¬ 
tudo.  Produtos  ou  situações  de  pouco  envolvimento  (p.ex., 
bens,  idéias  ou  conceitos  de  baixo  risco)  sempre  correm  o 


risco  de  inconsistências  nas  escolhas  reais  e  nas  utilidades 
parciais  resultantes.  O  pesquisador  sempre  deve  considerar 
a  habilidade  de  qualquer  conjunto  de  tarefas  de  escolha  de 
manter  suficiente  envolvimento  do  cliente  em  um  proces¬ 
so  de  decisão  quando  na  realidade  o  cliente  pode  não  dar 
à  decisão  o  nível  de  idealização  modelada  pelas  tarefas 
conjuntas.  Muitas  vezes,  pesquisadores  identificam  muitos 
atributos  para  consideração,  complicando  em  demasia  um 
processo  simples  do  ponto  de  vista  do  respondente.  Quan¬ 
do  esta  situação  acontece,  o  respondente  pode  considerar 
as  tarefas  de  escolha  muito  complicadas  ou  não-realistas  e 
fornecer  resultados  inconsistentes  ou  ilógicos. 

Identificação  de  inversões.  Com  as  potenciais  influências 
do  plano  de  pesquisa  consideradas,  o  pesquisador  ainda  se 
encontra  diante  de  uma  questão  crítica:  o  que  é  realmente 
uma  inversão?  Tecnicamente,  sempre  que  uma  utilidade 
parcial  é  assumida  como  sendo  maior  do  que  um  nível  ad¬ 
jacente  mas  não  é,  ela  viola  a  relação  monotônica  e  pode 
ser  considerada  uma  inversão.  No  entanto,  qual  quantia 
de  aumento  é  necessária  para  evitar  ser  considerada  uma 
inversão?  E  se  os  dois  níveis  adjacentes  forem  iguais?  E  se 
o  declínio  for  minúsculo? 

O  primeiro  passo  é  identificar  possíveis  inversões.  Um 
método  simples  mas  efetivo  é  retratar  graficamente  os  pa¬ 
drões  de  utilidades  parciais  para  cada  atributo.  Padrões 
ilógicos  podem  ser  rapidamente  identificados  dentro  de 
cada  atributo.  Contudo,  à  medida  que  o  número  de  atri¬ 
butos  e  respondentes  aumenta,  a  necessidade  de  alguma 
medida  empírica  se  torna  evidente.  E  um  simples  proces¬ 
so  de  calcular  as  diferenças  entre  níveis  adjacentes,  que 
podem  ser  examinadas  depois  quanto  a  padrões  ilógicos. 
Um  declínio  minúsculo  pode  não  constituir  uma  inversão; 
então,  quão  grande  deve  ser  a  diferença?  No  entanto,  por 
uma  questão  prática,  alguma  amplitude  de  diferenças, 
mesmo  quando  contrária  ao  padrão  esperado,  seria  pro¬ 
vavelmente  considerada  aceitável.  Para  estabelecer  esse 
grau  de  aceitabilidade,  existem  diversas  opções: 

•  Um  método  é  examinar  as  diferenças  e  ver  onde  ocorre 
uma  irregularidade  natural,  denotando  aqueles  valores  ver¬ 
dadeiramente  diferentes.  Novamente,  o  pesquisador  está 
buscando  valores  verdadeiramente  distintos  que  indiquem 
preferências  contrárias  à  relação  presumida. 

•  Uma  segunda  abordagem  é  tentar  e  estabelecer  alguma  es¬ 
timativa  de  um  intervalo  de  confiança  que  leve  em  conta  as 
características  estabelecidas  de  distribuição  das  diferenças. 
Uma  possibilidade  é  determinar  o  erro  padrão  das  diferen¬ 
ças  e  então  usar  isso  para  construir  um  intervalo  de  confian¬ 
ça  em  torno  de  zero  para  denotar  diferenças  verdadeira- 
mente  significativas.  Devemos  observar  que,  tecnicamente  o 
intervalo  de  confiança  deveria  ser  construído  internamente, 
mas  pouquíssimas  observações  são  fornecidas  sobre  qual¬ 
quer  fator  para  se  fazer  isso.  Logo,  faz-se  necessário  o  uso 
do  erro  padrão  calculado  ao  longo  de  sujeitos. 

Em  última  instância,  para  responder  esta  questão,  o 
pesquisador  é  encorajado  a  examinar  a  distribuição  de  di¬ 
ferenças  e  então  identificar  aquelas  consideradas  fora  de 
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um  intervalo  razoável.  O  tamanho  deste  intervalo  deve 
ser  baseado  não  apenas  nas  diferenças  reais,  mas  nos  fato¬ 
res  discutidos  anteriormente  (empenho  do  respondente, 
método  de  coleta  de  dados  e  contexto  da  pesquisa),  que 
impactam  sobre  a  possibilidade  de  inversões. 

O  objetivo  de  qualquer  análise  de  inversões  é  identifi¬ 
car  padrões  consistentes  de  inversões  que  apontem  para 
uma  representação  inválida  de  uma  estrutura  de  preferên¬ 
cia.  Apesar  de  um  pesquisador  esperar  que  nenhuma  in¬ 
versão  ocorra,  elas  podem  surgir  ocasionalmente  e  ainda 
fornecer  uma  estrutura  válida  de  preferência.  É  o  traba¬ 
lho  do  pesquisador  considerar  todos  os  fatores  discutidos, 
bem  como  a  extensão  das  inversões  para  cada  responden¬ 
te,  e  identificar  aqueles  respondentes  com  uma  quantia 
inadequada  de  inversões. 

Ações  corretivas  para  inversões.  A  despeito  de  a  pre¬ 
sença  de  inversões  não  invalidar  necessariamente  um 
conjunto  de  estimativas  de  utilidades  parciais,  a  pesquisa 
deve  considerar  fortemente  uma  série  de  ações  corretivas 
para  garantir  a  adequação  dos  resultados  e  maximizar  a 
habilidade  preditiva  das  utilidades  parciais.  Quando  dian¬ 
te  de  um  número  substancial  de  inversões,  o  pesquisador 
tem  várias  opções: 

•  Não  fazer  coisa  alguma.  Muitas  vezes  uma  pequena  quantia 
de  inversões  pode  ser  ignorada,  particularmente  se  o  foco 
for  sobre  os  resultados  agregados.  Muitos  pesquisadores  su¬ 
gerem  que  se  mantenham  essas  inversões  como  uma  medida 
de  inconsistência  do  mundo  real.  A  razão  é  que  as  inversões 
serão  compensadas  durante  a  agregação. 

•  Aplicar  restrições.  Restrições  podem  ser  aplicadas  no  pro¬ 
cesso  de  estimação  visando  à  proibição  de  inversões  [3, 109]. 
A  especificidade  dessas  restrições  varia  de  métodos  simples 
de  criação  de  um  “empate”  para  os  níveis  envolvidos  (ou 
seja,  dar  a  eles  a  mesma  estimativa  de  utilidade  parcial)  até 
a  monotonicidade  dentro  e  ao  longo  de  atributos  [107].  Po- 
de-se  ver  também  os  modelos  lineares  ou  de  ponto  ideal  de 
utilidades  parciais  discutidos  anteriormente. 

Ainda  que  estudos  mostrem  que  a  precisão  preditiva 
pode  ser  melhorada  com  tais  restrições,  o  pesquisador  deve 
também  avaliar  o  grau  em  que  elas  potencialmente  distor¬ 
cem  as  preferências  em  relações  pré-definidas.  Assim,  onde 
quer  que  restrições  possam  ser  utilizadas  para  corrigir  a  in¬ 
versão  ocasional,  seria  inadequado  utilizar  restrições  para 
corrigir  níveis  ou  atributos  incorretamente  especificados 
mesmo  que  a  precisão  preditiva  melhore. 

•  Eliminar  respondentes.  Uma  ação  corretiva  final  envolve  a 
eliminação,  da  análise,  de  respondentes  com  substanciais 
quantias  de  inversões.  O  que  está  em  jogo  aqui  é  a  pon¬ 
deração  entre  reduzir  representatividade  e  diversidade  da 
amostra  através  da  eliminação  versus  a  inclusão  de  estru¬ 
turas  inválidas  de  preferência.  Novamente,  o  pesquisador 
deve  ponderar  os  custos  em  relação  aos  benefícios  ao  tomar 
tal  decisão. 

Sempre  deve-se  tomar  cuidado  toda  vez  que  o  pesquisa¬ 
dor  afeta  diretamente  as  utilidades  parciais  estimadas.  Ape¬ 
sar  de  a  ausência  de  inversões  atingir  um  senso  de  validade 


pela  correspondência  com  as  relações  teorizadas,  o  pesqui¬ 
sador  deve  se  certificar  de  não  impor  restrições  que  possam 
obscurecer  resultados  válidos  mas  contra-intuitivos.  Com 
qualquer  ação  corretiva  para  inversões,  o  pesquisador  tam¬ 
bém  deve  estar  consciente  das  implicações  não  apenas  sobre 
estimativas  de  utilidades  parciais  individuais,  mas  sobre  des¬ 
crições  gerais  de  preferência  vistas  em  resultados  agregados 
ou  outras  aplicações  (p.ex.,  segmentação,  simuladores  de 
escolha). 

Resumo 

Um  dos  elementos  únicos  da  análise  conjunta  é  a  habüidade 
de  representar  a  estrutura  de  preferência  de  indivíduos  atra¬ 
vés  de  utilidades  parciais,  ainda  que  muitos  pesquisadores 
esqueçam  de  validar  essas  estruturas  de  preferência.  Como 
discutido  anteriormente,  pode  se  conseguir  uma  boa  visão 
a  partir  de  tal  exame,  e  ainda  o  potencial  para  melhorar  os 
resultados  gerais  pela  correção  de  padrões  inválidos  entre 
as  utilidades  parciais.  É  de  interesse  do  próprio  pesquisador 
o  exame  minucioso  dos  resultados  para  cada  indivíduo  para 
garantir  relevância  prática  e  a  validade  da  estrutura  de  pre¬ 
ferência  antes  de  utilizá-los  em  análise  posterior. 

Avaliação  da  importância  relativa  de  atributos 

Além  de  retratar  o  impacto  de  cada  nível  com  as  estimativas 
de  utilidades  parciais,  a  análise  conjunta  pode  avaliar  a  im¬ 
portância  relativa  de  cada  fator.  Como  as  estimativas  de  uti¬ 
lidades  parciais  geralmente  são  convertidas  em  uma  escala 
comum,  a  maior  contribuição  para  a  utilidade  geral  -  e,  por¬ 
tanto,  o  fator  mais  importante  -  é  o  fator  com  a  maior  amph- 
tude  (do  nível  baixo  ao  nível  alto)  de  utüidades  parciais.  Os 
valores  de  importância  de  cada  fator  podem  ser  convertidos 
em  percentuais  que  somam  100%  dividindo-se  cada  ampli¬ 
tude  de  fator  pela  soma  de  todas  as  amplitudes. 


Usando  nosso  exemplo  anterior  de  utilidades  parciais  esti¬ 
madas  com  três  atributos,  o  cálculo  de  importância  é  como 
se  segue.  Primeiro,  descubra  a  amplitude  (valor  máximo 
menos  valor  mínimo)  por  atributo.  Em  seguida,  divida 
cada  valor  de  amplitude  pelo  total  para  obter  o  valor  de 
importância. 


Atributo 

Mínimo 

Máximo 

Amplitude 

Importância 

1 

-  0,657 

0,098 

0,755 

22,8% 

2 

-  0,756 

0,302 

1,058 

32,0% 

3 

-  0,826 

0,667 

1,493 

45,2% 

Total 

3,306 

100,0% 

Neste  caso,  o  terceiro  atributo  explica  quase  metade 
da  variação  (1,493/3,306  =  0,452)  nos  escores  de  utilidade, 
ainda  que  os  outros  dois  atributos  sejam  menores  (32,0%  e 
22,8%).  Podemos  então  dizer  que  para  este  respondente,  o 
atributo  3  é  duas  vezes  tão  importante  quanto  o  atributo  1 
na  obtenção  dos  escores  de  utilidade  e  de  preferências. 
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Isso  viabiliza  a  comparação  entre  respondentes  usando 
uma  escala  comum,  bem  como  dá  significado  à  magnitu¬ 
de  do  escore  de  importância.  O  pesquisador  sempre  deve 
considerar  o  impacto  sobre  os  valores  de  importância  de 
um  nível  extremo  ou  praticamente  impossível.  Se  tal  ní¬ 
vel  é  encontrado,  ele  deve  ser  eliminado  da  análise  ou  os 
valores  de  importância  devem  ser  reduzidos  para  refletir 
apenas  a  amplitude  de  níveis  possíveis. 


ESTÁGIO  6:  VALIDAÇÃO  DOS 
RESULTADOS  CONJUNTOS 

Resultados  conjuntos  podem  ser  validados  interna  e  ex¬ 
ternamente.  A  validação  interna  envolve  a  confirmação 
de  que  a  regra  de  composição  selecionada  (isto  é,  aditiva 
versus  interativa)  é  apropriada  [19].  Em  geral,  o  pesquisa¬ 
dor  é  limitado  a  avaliar  empiricamente  a  validade  somen¬ 
te  da  forma  do  modelo  escolhido  em  um  estudo  completo, 
devido  às  altas  demandas  da  coleta  de  dados  para  testar 
os  dois  modelos.  Este  processo  de  validação  é  realizado 
com  mais  eficiência  comparando-se  modelos  alternativos 
(aditivo  versus  interativo)  em  um  estudo  de  pré-teste  para 
confirmar  qual  modelo  é  adequado.  Já  discutimos  o  uso 

-  REGRAS  PRÁTICAS  7-6  - 

Interpretação  e  validação  de  resultados  conjuntos 

•  Resultados  devem  ser  estimados  para  cada  indivíduo  a 
menos  que: 

•  O  modelo  conjunto  exija  estimativas  agregadas  (ou 
seja,  algumas  formas  de  análise  conjunta  baseada  em 
escolha) 

•  A  população  seja  conhecida  como  homogênea  com 
nenhuma  variação  entre  estruturas  individuais  de 
preferência 

•  Estimativas  de  utilidades  parciais  são  geralmente 
escalonadas  em  uma  base  comum  para  comparação 
entre  respondentes 

•  Padrões  teoricamente  inconsistentes  de  utilidades 
parciais,  conhecidos  como  inversões,  podem  originar 
eliminação  de  um  respondente  a  menos  que: 

•  A  ocorrência  dos  mesmos  seja  mínima 

•  Restrições  sejam  aplicadas  para  proibir  inversões 

•  Importância  de  atributo  deve  ser  obtida  com  base  nas 
amplitudes  relativas  de  utilidades  parciais  para  cada 
atributo 

•  Validação  deve  acontecer  em  dois  níveis: 

•  Validação  interna:  Testar  se  foi  escolhida  a  regra 
adequada  de  composição  (isto  é,  aditiva  ou 
interativa)  e  se  é  feita  em  um  pré-teste  de  estudo 

•  Validação  externa:  Avaliar  a  validade  preditiva 
dos  resultados  em  um  ambiente  real  no  qual  o 
pesquisador  sempre  deve  garantir  que  a  amostra  é 
representativa  da  população  em  estudo 


de  estímulos  de  validação  para  avaliar  a  precisão  preditiva 
para  cada  indivíduo  ou  para  a  amostra  de  validação  de 
respondentes  se  a  análise  é  executada  no  nível  agregado. 

A  validação  externa  em  geral  envolve  a  habilidade  da 
análise  conjunta  para  prever  escolhas  reais  e,  em  termos 
específicos,  a  questão  da  representatividade  da  amostra. 
Embora  a  análise  conjunta  tenha  sido  empregada  em  nu¬ 
merosos  estudos  nos  últimos  20  anos,  relativamente  pou¬ 
ca  pesquisa  tem  se  concentrado  em  sua  validade  externa. 
Um  estudo  confirmou  que  a  análise  conjunta  aproxima-se 
muito  dos  resultados  do  teste  de  conceito  tradicional,  uma 
metodologia  aceita  para  prever  a  preferência  de  clientes 
[105],  enquanto  outros  estudos  demonstraram  a  precisão 
preditiva  para  compras  de  eletrônicos  e  artigos  de  merce¬ 
aria  pelos  clientes  [37,  76].  Apesar  de  não  haver  avaliação 
de  erro  amostrai  nos  modelos  de  nível  individual,  o  pesqui¬ 
sador  sempre  deve  garantir  que  a  amostra  seja  representa¬ 
tiva  da  população  de  estudo  [72].  Essa  representatividade 
se  torna  especialmente  importante  quando  os  resultados 
conjuntos  são  usados  para  fins  de  segmentação  ou  simu¬ 
lação  de  escolha  (ver  a  próxima  seção  para  uma  discussão 
mais  detalhada  desses  usos  de  resultados  conjuntos). 


APLICAÇÕES  GERENCIAIS 
DE  ANÁLISE  CONJUNTA 

Normalmente,  os  modelos  conjuntos  estimados  no  nível 
individual  (modelo  separado  por  indivíduo)  são  empre¬ 
gados  em  uma  ou  mais  das  seguintes  áreas:  segmentação, 
análise  de  lucratividade  e  simuladores  conjuntos.  Além 
dos  resultados  individuais,  resultados  agregados  conjun¬ 
tos  podem  representar  grupos  de  indivíduos  e  também 
fornecer  um  meio  de  prever  suas  decisões  para  qualquer 
número  de  situações.  A  única  vantagem  da  análise  con¬ 
junta  é  a  habilidade  de  representar  as  preferências  para 
cada  indivíduo  de  uma  maneira  objetiva  (p.ex.,  utilidades 
parciais).  No  sentido  mais  fundamental,  a  análise  con¬ 
junta  pode  ajudar  a  identificar  necessidades  de  clientes, 
a  dar  prioridade  a  essas  necessidades  e  então  traduzi-las 
na  forma  de  estratégias  reais  [67,  90,  98].  As  aplicações 
gerenciais  e  acadêmicas  mais  comuns  de  análise  conjunta 
junto  com  sua  representação  da  estrutura  de  preferência 
do  cliente  incluem  segmentação,  análise  de  lucratividade 
e  simuladores  conjuntos. 

Segmentação 

Um  dos  usos  mais  comuns  de  resultados  de  análise  con¬ 
junta  individual  é  agrupar  respondentes  com  utilidades 
parciais  ou  valores  de  importância  semelhantes  para  iden¬ 
tificar  segmentos.  As  utilidades  parciais  conjuntas  estima¬ 
das  podem  ser  usadas  sozinhas  ou  em  combinação  com 
outras  variáveis  (p.ex.,  demográficas)  para  deduzir  agru¬ 
pamentos  de  respondentes  que  são  mais  semelhantes  em 
suas  preferências  [20,  26]. 
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No  exemplo  do  detergente  industrial,  poderíamos 
primeiramente  agrupar  indivíduos  com  base  em  seus 
escores  de  importância  de  atributo,  encontrando  um 
grupo  para  o  qual  a  marca  é  a  característica  mais  im¬ 
portante,  ao  passo  que  um  outro  grupo  poderia  valo¬ 
rizar  mais  o  preço.  Outra  abordagem  seria  o  exame 
direto  dos  escores  de  utilidade  parcial,  novamente 
identificando  indivíduos  com  padrões  similares  de  es¬ 
cores  ao  longo  de  cada  um  dos  níveis  dentro  de  um  ou 
mais  atributos. 


Para  o  pesquisador  interessado  em  conhecer  a  presença 
de  tais  grupos  e  sua  magnitude  relativa,  várias  abordagens 
para  segmentação,  que  diferem  em  vantagens  e  desvanta¬ 
gens,  estão  disponíveis  [66,  109].  Uma  abordagem  lógica 
é  a  aplicação  de  análise  de  agrupamentos  (ver  Capítulo  8) 
para  as  estimativas  de  utilidades  parciais  ou  para  os  esco¬ 
res  de  importância  para  cada  atributo  a  fim  de  identificar 
subgrupos  homogêneos  de  respondentes.  A  análise  con¬ 
junta  tem  sido  proposta  também  como  um  meio  de  vali¬ 
dar  análise  de  segmentação  formada  com  outras  variáveis 
de  agrupamento,  onde  diferenças  em  estruturas  conjuntas 
de  preferência  são  utilizadas  para  demonstrar  distinção 
entre  os  segmentos  [18 j. 

Análise  de  lucratividade 

Um  complemento  à  decisão  de  projeto  de  produto  é  uma 
análise  de  lucratividade  marginal  do  projeto  proposto 
para  o  produto.  Se  o  custo  de  cada  característica  é  conhe¬ 
cido,  o  custo  de  cada  produto  pode  ser  combinado  com  a 
participação  de  mercado  e  o  volume  de  vendas  esperados 
para  prever  sua  viabilidade.  Esse  processo  pode  identificar 
combinações  de  atributos  que  seriam  mais  lucrativas  mes¬ 
mo  com  uma  participação  menor  no  mercado,  por  causa 
do  baixo  custo  de  componentes  particulares.  Um  adjunto 
da  análise  de  lucratividade  é  a  avaliação  de  sensibilidade  a 
preço  [45  j,  a  qual  pode  ser  abordada  por  meio  de  projetos 
de  pesquisa  específicos  [81j  ou  programas  especializados 
[92 j.  Tanto  resultados  individuais  quanto  agregados  po¬ 
dem  ser  usados  nessa  análise. 

Simuladores  conjuntos 

Neste  ponto,  o  pesquisador  ainda  entende  apenas  a  im¬ 
portância  relativa  dos  atributos  e  o  impacto  de  níveis  es¬ 
pecíficos.  Mas  como  a  análise  conjunta  atinge  seu  outro 
objetivo  primário  de  usar  análise  do  tipo  “o  que  aconte¬ 
ceria  se”  para  prever  a  participação  de  preferências  que 
um  estímulo  (real  ou  hipotético)  está  apto  a  capturar  em 
vários  cenários  competitivos  de  interesse  para  a  adminis¬ 
tração?  Esse  papel  é  desempenhado  pelos  simuladores  de 
escolha,  os  quais  permitem  ao  pesquisador  simular  qual¬ 
quer  número  de  cenários  competitivos  e  então  estimar 
como  os  respondentes  reagiriam  a  cada  cenário. 


Condução  de  uma  simulação 

Uma  simulação  conjunta  é  uma  tentativa  de  compreen¬ 
der  como  o  conjunto  de  respondentes  escolheria  em  um 
conjunto  especificado  de  estímulos.  Este  processo  fornece 
ao  pesquisador  a  habilidade  de  usar  as  utilidades  parciais 
estimadas  na  avaliação  de  qualquer  número  de  cenários 
consistindo  de  diferentes  combinações  de  estímulos.  Para 
qualquer  cenário  dado,  o  pesquisador  segue  um  processo 
de  três  passos: 

Passo  1:  Especificar  o(s)  cenário(s).  Depois  que  o  mo¬ 
delo  conjunto  é  estimado,  o  pesquisador  pode  especificar 
qualquer  número  de  conjuntos  de  estímulos  para  simu¬ 
lação  de  escolhas  de  clientes.  Entre  os  possíveis  cenários 
que  podem  ser  avaliados  estão  os  seguintes: 

•  Impactos  de  se  acrescentar  um  produto  a  um  mercado  exis¬ 
tente 

•  Potencial  ampliado  a  partir  da  estratégia  de  um  multipro- 
duto  ou  de  uma  multimarca,  incluindo  estimativas  de  cani¬ 
balismo 

•  Impactos  de  se  eliminar  um  produto  ou  marca  do  mercado 

•  Delineamentos  ótimos  de  produtos  para  um  mercado  espe¬ 
cífico 

Em  cada  caso,  o  pesquisador  fornece  o  conjunto  de 
estímulos  que  representam  os  objetos  (produtos,  serviços 
etc.)  disponíveis  no  cenário  do  mercado  sob  estudo,  e  as 
escolhas  de  respondentes  são  então  simuladas.  O  valor 
singular  de  se  usar  análise  conjunta  nas  simulações  é  que 
múltiplos  cenários  podem  ser  avaliados  e  os  resultados 
podem  ser  compilados  para  cada  respondente  através  da 
sua  estrutura  de  preferência  de  utilidades  parciais. 

Passo  2:  Simular  escolhas.  Uma  vez  que  os  cenários  es¬ 
tão  completos,  as  utilidades  parciais  para  cada  indivíduo 
são  usadas  para  prever  as  escolhas  ao  longo  dos  estímu¬ 
los  em  cada  cenário.  Simuladores  de  escolha  garantem  ao 
pesquisador  a  habilidade  de  avaliar  qualquer  número  de 
cenários,  mas  o  verdadeiro  benefício  envolve  a  capacida¬ 
de  do  pesquisador  de  especificar  condições  ou  relações 
entre  os  estímulos  para  representar  condições  de  mercado 
de  forma  mais  realista.  Por  exemplo,  os  objetos  compe¬ 
tirão  igualmente  com  todos  os  demais?  A  similaridade 
entre  os  objetos  cria  diferentes  padrões  de  preferência? 
As  características  não-medidas  do  mercado  podem  ser  in¬ 
cluídas  na  simulação?  Estas  questões  são  apenas  algumas 
entre  muitas  que  devem  ser  tratadas  para  se  acrescentar 
o  nível  necessário  de  realismo  ao  simulador  de  escolhas, 
para  retratar  um  mercado  válido  no  qual  respondentes  fa¬ 
zem  escolhas. 

Apesar  de  pesquisadores  terem  trabalhado  extensi¬ 
vamente  para  captar  muitos  dos  efeitos  observados  ante¬ 
riormente,  pelo  menos  três  tipos  básicos  [37]  devem  ser 
incluídos: 

•  Impacto  diferencial:  O  impacto  de  qualquer  atributo/nível 
é  o  mais  importante  quando  o  respondente  valoriza  aquele 
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objeto  entre  os  dois  do  topo,  indicando  seu  papel  na  escolha 
real  entre  esses  objetos. 

•  Substituição  diferencial:  A  similaridade  entre  objetos  afeta  a 
escolha  com  objetos  parecidos  compartilhando  preferência 
geral  (p.ex.,  quando  se  escolhe  entre  pegar  um  ônibus  ou 
dirigir  um  carro,  acrescentar  ônibus  de  cores  diferentes  não 
aumenta  a  chance  de  se  pegar  um  ônibus;  os  dois  objetos 
compartilhariam  a  chance  geral  de  se  pegar  um  ônibus). 

•  Melhoramento  diferencial:  Dois  objetos  extremamente  pareci¬ 
dos  do  mesmo  tipo  básico  podem  ser  distinguidos  por  peque¬ 
nas  diferenças  em  um  atributo  que  é  relativamente  inconse- 
qüente  quando  se  comparam  dois  objetos  de  tipos  distintos. 


Examinemos  um  conjunto  de  cinco  produtos  hipotéticos 
para  ilustrar  tais  efeitos.  Considere  que  os  cinco  produtos 
estão  na  categoria  de  sucos  de  fruta,  com  duas  subclasses: 
sem  e  com  gás  carbônico.  As  marcas  A,  B  e  C  são  sem 
gás  carbônico,  enquanto  as  marcas  D  e  E  têm  gás.  Cal¬ 
culamos  valores  de  utilidade  para  as  marcas,  com  A  e  B 
mostrando  valores  de  30  e  40,  respectivamente,  enquanto 
as  demais  marcas  (C,  D  e  E)  têm  todas  o  valor  10. 

Agora  olhemos  como  cada  tipo  de  efeito  impacta  um 
simulador  de  escolha.  Primeiro,  o  impacto  diferencial  se 
refere  ao  fato  de  que  mudar  os  níveis  de  atributo  nas  mar¬ 
cas  A  e  B  tem  o  maior  impacto,  pois  essas  duas  marcas 
apresentam  o  maior  valor,  onde  uma  pequena  mudança 
poderia  ser  suficiente  para  fazer  a  balança  pender  para 
alguma  delas.  A  substituição  diferencial  se  refere  ao  fato 
de  que  acrescentar  um  novo  produto  gaseificado  causará 
impacto  nas  marcas  D  e  E  de  maneira  desproporcional, 
pois  elas  são  mais  parecidas  com  o  novo  produto  do  que 
as  marcas  não-gaseificadas.  Finalmente,  o  melhoramento 
diferencial  implica  que  as  marcas  D  e  E,  por  serem  mais 
assemelhadas,  serão  mais  facilmente  comparadas  em 
qualquer  atributo  do  que  quando  se  comparar  qualquer 
uma  delas  (D  ou  E)  com  as  demais  marcas. 


Esses  efeitos  tentam  retratar  algumas  das  regras  de  es¬ 
colha  mais  complexas  que  afetam  decisões  de  clientes.  A 
habilidade  de  simuladores  de  escolha  de  representar  essas 
relações  permite  que  os  pesquisadores  retratem  mais  rea¬ 
listicamente  as  forças  atuando  no  conjunto  de  objetos  sob 
consideração  no  cenário.  Além  disso,  precisão  preditiva  é 
sensivelmente  melhorada  com  uma  melhor  compreensão 
sobre  o  comportamento  de  mercado  inerente  dos  respon- 
dentes  [37,  78]. 

Passo  3:  Calcular  a  participação  de  preferência.  O  úl¬ 
timo  passo  em  simulação  conjunta  é  prever  preferência 
para  cada  indivíduo  e  então  calcular  participação  de  pre¬ 
ferência  para  cada  estímulo  agregando  as  escolhas  indi¬ 
viduais.  Simuladores  de  escolha  podem  usar  uma  vasta 
gama  de  regras  de  escolha  [25]  na  previsão  para  qualquer 
indivíduo: 

•  Modelo  de  utilidade  máxima  (primeira  escolha).  Este  mo¬ 
delo  assume  que  o  respondente  escolhe  o  estímulo  com  o 


maior  escore  de  utilidade  previsto.  A  participação  de  prefe¬ 
rência  é  determinada  pelo  cálculo  do  número  de  indivíduos 
preferindo  cada  estímulo.  Esta  abordagem  é  mais  adequada 
para  situações  com  indivíduos  de  preferências  amplamente 
distintas  e  em  situações  envolvendo  compras  esporádicas, 
não-rotineiras. 

•  Modelo  de  probabilidade  de  preferência.  Neste,  previsões  de 
probabilidade  de  escolha  somam  100%  no  conjunto  de  estí¬ 
mulos  testados,  com  cada  pessoa  tendo  alguma  probabilidade 
de  comprar  cada  estímulo.  Participação  geral  de  preferência 
é  medida  somando-se  as  probabilidades  de  preferência  ao 
longo  de  todos  os  respondentes.  Esta  abordagem,  que  pode 
aproximar  alguns  elementos  de  similaridade  de  produtos,  é 
mais  apropriada  para  situações  de  compras  repetitivas,  para 
as  quais  compras  podem  ser  mais  associadas  com  situações 
de  uso  ao  longo  do  tempo.  Os  dois  métodos  mais  comuns  de 
se  fazerem  essas  previsões  são  os  modelos  BTL  (Bradford- 
Terry-Luce)  e  logit,  que  fazem  previsões  muito  parecidas  em 
quase  todas  as  situações  [36]. 

•  Primeira  escolha  ao  acaso.  Desenvolvido  pela  Sawtooth  Soft¬ 
ware  [73,  78],  este  método  procura  combinar  o  melhor  das 
duas  abordagens  anteriores.  Tira  amostras  de  cada  respon¬ 
dente  múltiplas  vezes,  cada  vez  acrescentando  variação  ale¬ 
atória  nas  estimativas  de  utilidade  para  cada  estímulo.  Para 
cada  iteração,  ele  aplica  a  regra  da  primeira  escolha  e  então 
totaliza  os  resultados  para  cada  F  individual  para  conseguir 
uma  participação  de  preferência  por  respondente.  Ele  corrige 
similaridade  de  produtos  e  pode  ser  refinado  pela  especifica¬ 
ção  da  quantia  e  tipo  de  variação  ao  acaso  que  melhor  apro¬ 
xima  as  participações  conhecidas  de  preferência  [37,  75]. 

Resumo.  A  participação  de  preferência,  determinada 
por  qualquer  um  dos  três  métodos  descritos,  fornece  uma 
visão  sobre  muitos  fatores  inerentes  às  escolhas  reais  de 
respondentes.  Múltiplos  cenários  de  produtos  podem  ser 
avaliados,  dando  origem  não  apenas  a  uma  perspectiva  de 
qualquer  cenário  em  particular,  mas  da  dinâmica  na  parti¬ 
cipação  de  preferência  conforme  os  estímulos  variam. 

O  pesquisador  deve  acautelar-se  em  qualquer  aplica¬ 
ção  do  simulador  conjunto  ao  assumir  que  a  participação 
de  preferência  em  uma  simulação  conjunta  se  traduz  di- 
retamente  em  participação  de  mercado  [15].  A  simulação 
conjunta  representa  apenas  o  produto  e  talvez  aspectos  de 
preço  de  administração  de  marketing,  omitindo  todos  os 
outros  fatores  de  marketing  (p.ex.,  anúncio  e  promoção, 
distribuição,  respostas  competitivas)  que  acabariam  cau¬ 
sando  impacto  sobre  a  participação  de  mercado.  Não  obs¬ 
tante,  a  simulação  conjunta  apresenta  uma  visão  do  mer¬ 
cado  do  produto  e  da  dinâmica  de  preferências  que  podem 
ser  vistos  na  amostra  em  estudo. 


METODOLOGIAS  CONJUNTAS 
ALTERNATIVAS 

Até  este  ponto,  lidamos  com  aplicações  de  análise  conjun¬ 
ta  que  envolvem  a  metodologia  conjunta  tradicional.  Mas 
as  aplicações  no  mundo  real  muitas  vezes  envolvem  de  20 
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a  30  atributos  ou  demandam  uma  tarefa  de  escolha  mais 
realista  do  que  a  usada  em  nossas  discussões  anteriores. 
Pesquisas  recentes,  direcionadas  para  superar  esses  pro¬ 
blemas  encontrados  em  muitos  estudos  conjuntos,  con¬ 
duziram  ao  desenvolvimento  de  duas  novas  metodologias 
conjuntas:  (1)  uma  análise  conjunta  adaptativa/auto-expli- 
cada  para  lidar  com  um  grande  número  de  atributos  e  (2) 
uma  análise  conjunta  baseada  em  escolhas  para  fornecer 
tarefas  de  escolha  mais  realistas.  Essas  áreas  representam 
o  principal  foco  de  pesquisa  recente  em  análise  conjunta 
[14,29,  63]. 

Análise  conjunta  adaptativa/auto-explicada: 
conjunta  com  um  grande  número  de  fatores 

Os  métodos  do  perfil  completo  e  de  trocas  começam  a  se 
tornar  intratáveis  quando  envolvem  mais  de  10  atribu¬ 
tos,  ainda  que  muitos  estudos  conjuntos  precisem  incor¬ 
porar  até  20,  30  ou  mesmo  mais  atributos.  Nesses  casos, 
uma  forma  adaptada  ou  reduzida  de  análise  conjunta  é 
empregada  para  simplificar  o  esforço  de  coleta  de  dados 
e  ainda  representar  uma  decisão  de  escolha  realista.  As 
duas  opções  são  os  modelos  auto-explicados  e  os  modelos 
adaptativos  ou  híbridos. 

Modelos  conjuntos  auto-explicados 
No  modelo  auto-explicado,  o  respondente  fornece  uma 
avaliação  sobre  quão  desejável  é  cada  nível  de  um  atri¬ 
buto  e  então  avalia  a  importância  relativa  do  atributo  em 
geral.  Utilidades  parciais  são  então  calculadas  por  uma 
combinação  dos  dois  valores  [99].  Nessa  abordagem  com- 
posicional,  são  feitas  avaliações  sobre  as  componentes  de 
utilidade,  em  vez  de  apenas  preferência  geral.  Por  ser  uma 
variante  importante  da  análise  conjunta  e  mais  próxima 
de  modelos  multiatributos  tradicionais,  este  modelo  gera 
diversas  preocupações: 

•  Os  respondentes  podem  avaliar  a  importância  relativa  de 
atributos  com  precisão?  Um  problema  comum  com  auto- 
avaliações  é  o  potencial  para  importância  ser  subestimado 
em  modelos  multiatributos  porque  os  respondentes  querem 
dar  respostas  socialmente  desejáveis.  Em  tais  situações,  o 
modelo  conjunto  resultante  também  é  tendencioso. 

•  Correlações  interatributos  podem  ter  um  papel  maior  e 
provocar  vieses  substanciais  nos  resultados  devido  à  dupla 
contagem  de  fatores  correlacionados.  Modelos  conjuntos 
tradicionais  sofrem  deste  problema  também,  mas  a  abor¬ 
dagem  auto-explicada  é  particularmente  afetada  porque  os 
respondentes  jamais  devem  considerar  explicitamente  esses 
atributos  em  relação  a  outros. 

•  Finalmente,  respondentes  jamais  executam  uma  tarefa  de 
escolha  (avaliando  o  conjunto  de  combinações  hipotéticas 
de  atributos),  e  essa  falta  de  realismo  é  uma  limitação  críti¬ 
ca,  especialmente  em  aplicações  de  novos  produtos. 

Pesquisas  recentes  têm  demonstrado  que  esse  méto¬ 
do  pode  ter  habilidade  preditiva  adequada  quando  com¬ 
parado  com  métodos  conjuntos  tradicionais  [27].  Esta 


abordagem  é  melhor  usada  quando  modelos  agregados 
são  preferidos,  pois  idiossincrasias  individuais  podem  ser 
compensadas  nos  resultados  agregados.  Logo,  se  o  núme¬ 
ro  de  fatores  não  pode  ser  reduzido  a  um  nível  aceitável 
com  o  qual  possa  ser  tratado  por  qualquer  dos  outros  mé¬ 
todos  conjuntos,  então  um  modelo  auto-explicado  pode 
ser  um  método  alternativo  viável. 

Modelos  conjuntos  adaptativos  ou  híbridos 

Uma  segunda  abordagem  é  o  modelo  adaptativo,  ou  híbri¬ 
do,  assim  chamado  por  combinar  o  modelo  auto-explicado 
com  o  modelo  conjunto  de  utilidades  parciais  [23,  24].  Ele 
utiliza  valores  auto-explicados  para  criar  um  pequeno  sub¬ 
conjunto  de  estímulos  selecionados  de  um  delineamento 
fatorial  fracionário.  Os  estímulos  são  então  avaliados  de 
uma  maneira  semelhante  à  análise  conjunta  tradicional. 
Os  conjuntos  de  estímulos  diferem  entre  respondentes,  e 
apesar  de  cada  respondente  avaliar  apenas  uma  pequena 
quantia,  todos  os  estímulos  são  avaliados  coletivamente 
por  uma  parte  dos  respondentes.  A  abordagem  de  integrar 
a  informação  do  respondente  para  simplificar  ou  aumentar 
as  tarefas  de  escolha  tem  conduzido  a  diversos  esforços  de 
pesquisas  recentes  que  têm  por  meta  diferentes  aspectos 
do  delineamento  de  pesquisa  [3,  44, 101, 106]. 

Uma  das  mais  populares  variantes  dessa  abordagem  é 
ACA,  um  programa  conjunto  desenvolvido  pela  Sawtooth 
Software  [87].  ACA  emprega  avaliações  auto-explicadas 
para  reduzir  o  tamanho  do  projeto  fatorial  e  tornar  o  pro¬ 
cesso  mais  maleável.  E  particulamente  útil  quando  o  estu¬ 
do  inclui  um  grande  número  de  atributos  não  apropriado 
para  as  outras  abordagens.  Aqui  o  programa  primeiro  cole¬ 
ta  avaliações  auto-explicadas  de  cada  fator.  Em  seguida  es¬ 
sas  avaliações  são  usadas  na  geração  de  estímulos  tais  que 
os  fatores  menos  importantes  são  rapidamente  eliminados 
dos  estímulos.  Além  disso,  cada  estímulo  contém  apenas 
um  pequeno  número  de  fatores  (de  três  a  seis)  para  man¬ 
ter  a  tarefa  de  escolha  melhor  administrável.  Este  processo 
adaptativo  só  pode  ser  conseguido  através  do  programa  as¬ 
sociado,  tornando  esta  abordagem  inapropriada  para  qual¬ 
quer  tipo  de  projeto  não-interativo  (p.ex.,  consultas  por  es¬ 
crito).  No  entanto,  sua  flexibilidade  de  acomodar  grandes 
quantias  de  atributos  com  tarefas  simples  de  escolha  tem 
tornado  o  mesmo  um  dos  métodos  mais  amplamente  uti¬ 
lizados.  Além  disso,  sua  habilidade  preditiva  relativa  tem 
se  mostrado  comparável  à  análise  conjunta  tradicional, 
tornando-o  assim  uma  alternativa  apropriada  quando  o  nú¬ 
mero  de  atributos  é  grande  [27,  47, 105, 115, 119]. 

Escolha  entre  modelos  auto- 
explicado  e  adaptativo/ híbrido 

Quando  nos  deparamos  com  um  número  de  fatores  que 
não  pode  ser  acomodado  nos  métodos  conjuntos  discuti¬ 
dos  até  o  presente  momento,  os  modelos  auto-explicado 
e  adaptativo  ou  híbrido  preservam  pelo  menos  uma  par¬ 
te  dos  princípios  inerentes  à  análise  conjunta.  Ao  com- 
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parar  essas  duas  extensões,  os  métodos  auto -explicados 
têm  uma  confiabilidade  ligeiramente  menor,  apesar  de 
desenvolvimentos  recentes  poderem  fornecer  alguma 
melhora.  Quando  os  métodos  dos  modelos  híbrido  e 
auto-explicado  são  comparados  com  técnicas  de  perfil 
completo,  os  resultados  são  confundidos,  com  desempe¬ 
nho  um  pouco  superior  do  método  híbrido  ou  adaptati- 
vo,  particularmente  ACA  [38].  Apesar  de  mais  pesquisa 
ser  necessária  para  confirmar  as  comparações  entre  os 
métodos,  os  estudos  empíricos  indicam  que  os  métodos 
adaptativos  ou  híbridos  e  as  mais  novas  formas  de  mo¬ 
delos  auto-explicados  oferecem  alternativas  viáveis  em 
relação  à  análise  conjunta  tradicional  quando  lidamos 
com  muitos  fatores. 

Análises  conjuntas  baseadas  em  escolhas: 
acréscimo  de  outro  toque  de  realismo 

Nos  últimos  anos,  muitos  pesquisadores  na  área  de  análi¬ 
se  conjunta  têm  direcionado  seus  esforços  para  uma  nova 
metodologia  conjunta  que  forneça  maior  realismo  na  ta¬ 
refa  de  escolha.  Com  o  objetivo  prioritário  de  compreen¬ 
der  o  processo  de  tomada  de  decisão  do  respondente  e 
prever  o  comportamento  no  mercado,  a  análise  conjunta 
tradicional  considera  que  a  tarefa  de  julgamento,  baseada 
em  ordenamento  ou  avaliação,  capta  as  escolhas  do  res¬ 
pondente.  Entretanto,  pesquisadores  argumentam  que 
essa  não  é  a  forma  mais  realista  de  descrever  um  processo 
de  decisão  real  do  respondente,  e  outros  apontam  para  a 
falta  de  teoria  formal  que  conecte  esses  julgamentos  me¬ 
didos  com  escolha  [59]. 

O  que  surgiu  é  uma  metodologia  conjunta  alterna¬ 
tiva,  conhecida  como  conjunta  baseada  em  escolhas, 
com  a  validade  inerente  de  pedir  ao  respondente  para 
escolher  um  estímulo  de  perfil  completo  a  partir  de  um 
conjunto  de  estímulos  alternativos  conhecido  como 
conjunto  escolha.  Isso  é  muito  mais  representativo  do 
real  processo  de  selecionar  um  produto  a  partir  de  um 
conjunto  de  produtos  competitivos.  Além  disso,  a  análi¬ 
se  conjunta  baseada  em  escolhas  fornece  uma  opção  de 
não  escolher  qualquer  um  dos  estímulos  apresentados 
ao  incluir  uma  opção  de  não-escolha  no  conjunto  esco¬ 
lha.  Enquanto  a  análise  conjunta  tradicional  considera 
que  as  preferências  dos  respondentes  sempre  serão  alo¬ 
cadas  em  meio  ao  conjunto  de  estímulos,  a  abordagem 
baseada  em  escolhas  permite  a  contração  do  mercado 
se  todas  as  alternativas  em  um  conjunto  escolha  care¬ 
cem  de  atrativos. 

Uma  ilustração  simples  de  perfil  completo 
versus  conjunta  baseada  em  escolhas 

Antes  de  discutirmos  alguns  dos  detalhes  mais  técnicos  da 
análise  conjunta  baseada  em  escolhas  e  de  como  ela  difere 
das  outras  metodologias  conjuntas,  examinemos  primei¬ 
ramente  as  diferenças  na  criação  de  estímulos  e  então  ve¬ 
jamos  o  processo  real  de  coleta  de  dados. 


Criação  de  estímulos.  A  primeira  diferença  entre  per¬ 
fil  completo  e  conjunta  baseada  em  escolhas  é  o  tipo 
de  estímulos.  Ambos  usam  uma  forma  de  estímulo  de 
perfil  completo,  mas  a  tarefa  de  escolha  é  bastante  di¬ 
ferente.  Examinemos  um  exemplo  simples  para  fins  de 
ilustração. 


Uma  companhia  de  telefones  celulares  deseja  estimar  o 
potencial  de  mercado  para  três  opções  de  serviço  que 
podem  ser  acrescentadas  na  taxa  de  serviço  básico  de 
$14,95  por  mês  e  de  $0,50  por  minuto  de  ligação: 

ICA  Chamadas  listadas  com  uma  taxa  de  serviço  de 
$2,75  por  mês 

CW  Espera  de  chamada  com  uma  taxa  de  serviço  de 
$3,50  por  mês 

TWC  Chamada  com  três  linhas  com  uma  taxa  de  ser¬ 
viço  de  $3,50  por  mês 

Estímulos  de  perfil  completo.  A  análise  conjunta 
tradicional  é  realizada  com  estímulos  de  perfil  com¬ 
pleto  representando  as  diversas  combinações  de  ser¬ 
viços,  variando  do  serviço  básico  até  o  serviço  básico 
com  as  três  opções.  O  conjunto  completo  de  perfis 
(planejamento  fatorial)  é  exibido  na  Tabela  7-7.  O 
estímulo  1  representa  o  serviço  básico  sem  opções,  o 
estímulo  2  é  o  serviço  básico  mais  o  serviço  de  cha¬ 
madas  listadas,  e  assim  por  diante  até  o  estímulo  8, 
que  corresponde  ao  serviço  básico  mais  as  três  opções 
(chamadas  listadas,  espera  de  chamada  e  chamada 
com  três  linhas). 

Estímulos  baseados  em  escolhas.  Em  uma  aborda¬ 
gem  baseada  em  escolha,  apresenta-se  ao  responden¬ 
te  uma  série  de  conjuntos  escolha.  Cada  conjunto  es¬ 
colha  tem  diversos  estímulos  de  perfil  completo.  Um 
projeto  baseado  em  escolhas  também  é  mostrado  na 
Tabela  7-7.  O  primeiro  conjunto  escolha  consiste  de 
cinco  dos  estímulos  de  perfil  completo  (estímulos  1, 
2,  4,  5  e  6)  e  uma  opção  do  tipo  “nenhum  deles”.  O 
respondente  então  escolhe  apenas  um  dos  perfis  no 
conjunto  escolha  (“mais  preferido”  ou  “mais  deseja¬ 
do”)  ou  a  opção  “nenhuma  escolha”.  Um  exemplo  de 
tarefa  de  conjunto  escolha  para  o  conjunto  6  é  exibido 
na  Tabela  7-8.  A  preparação  de  estímulos  e  conjuntos 
escolha  é  baseada  nos  princípios  de  delineamento  ex¬ 
perimental  [44,  59]  e  é  objeto  de  considerável  esforço 
de  pesquisa  para  refinar  e  melhorar  a  tarefa  de  esco¬ 
lha  [3, 14,40,  44,  81]. 


Coleta  de  dados.  Dadas  as  diferentes  maneiras  como 
estímulos  são  formados,  as  tarefas  de  escolha  diante  do 
respondente  são  bastante  distintas.  Como  veremos,  o  pes¬ 
quisador  deve  escolher  entre  uma  tarefa  de  escolha  mais 
simples  no  método  de  perfil  completo  e  a  tarefa  baseada 
em  escolha  que  é  mais  realista. 
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TABELA  7-7  Uma  comparação  de  planejamentos  de  estímulos  usados  em  análises  conjuntas  tradicional  e  baseada  em 
escolhas 


ANÁLISE  CONJUNTA  TRADICIONAL 

Níveis  de  fatores^ 

Conjunta  baseada  em  escolhas 

Estímulo 

ICA 

cw 

TWC 

Conjunto  escolha  Estímulos  no  conjunto  escolha'’ 

1 

0 

0 

0 

1 

1 , 2,  4,  5,  6,  e  nenhuma  escolha 

2 

1 

0 

0 

2 

2,  3,  5,  6,  7,  e  nenhuma  escolha 

3 

0 

1 

0 

3 

1 , 3,  4,  6,  7,  8,  e  nenhuma  escolha 

4 

0 

0 

1 

4 

2,  4,  5,  7,  8,  e  nenhuma  escolha 

5 

1 

1 

0 

5 

3,  5,  6,  8,  e  nenhuma  escolha 

6 

1 

0 

0 

6 

4,  6,  7,  e  nenhuma  escolha 

7 

0 

1 

1 

7 

1 , 5,  7,  8,  e  nenhuma  escolha 

8 

1 

1 

1 

8 

1 , 2,  6,  8,  e  nenhuma  escolha 

9 

1 , 2,  3,  7,  e  nenhuma  escolha 

10 

2,  3,  4,  8,  e  nenhuma  escolha 

11 

1 , 3,  4,  5,  e  nenhuma  escolha 

‘Níveis:  1  =  opção  de  serviço  incluída;  0  =  opção  de  serviço  não-incluída. 

‘Estímulos  usados  em  conjuntos  escolha  são  aqueles  definidos  no  planejamento  para  a  análise  conjunta  tradicional. 


Método  de  perfil  completo.  Para  a  abordagem  de  perfil 
completo,  o  respondente  é  solicitado  a  avaliar  ou  orde¬ 
nar  cada  um  dos  oito  perfis.  O  respondente  avalia  cada 
estímulo  separadamente  e  fornece  uma  avaliação  de 
preferências.  A  tarefa  é  relativamente  simples  e  pode  ser 
realizada  muito  rapidamente  após  umas  poucas  tarefas 
de  aquecimento.  Como  anteriormente  discutido,  quando 
o  número  de  fatores  e  níveis  aumenta  (lembre  de  nosso 
exemplo  anterior  de  quatro  fatores  com  quatro  níveis 
cada,  gerando-se  256  estímulos),  a  tarefa  pode  se  tornar 
muito  grande  e  exigir  alguma  forma  de  subconjunto  de 
estímulos,  que  ainda  pode  ser  substancial. 

Método  baseado  em  escolha.  Para  a  abordagem  ba¬ 
seada  em  escolhas,  o  número  de  perfis  pode  ou  não  va¬ 
riar  ao  longo  dos  conjuntos  escolha  [59].  Além  disso, 
a  quantia  de  escolhas  feitas  (uma  para  cada  um  dos  11 
conjuntos  escolha)  é,  na  verdade,  maior  neste  caso  do 
que  o  exigido  neste  exemplo.  No  entanto,  quando  o  nú¬ 
mero  de  fatores  e  níveis  aumenta,  o  delineamento  ba¬ 
seado  em  escolhas  demanda  consideravelmente  menos 
avaliações. 


Resumo.  As  vantagens  da  abordagem  baseada  em  es¬ 
colhas  são  o  realismo  adicional  e  a  habilidade  de  estimar 
termos  de  interação.  Depois  que  cada  respondente  esco¬ 
lheu  um  estímulo  para  cada  conjunto  escolha,  os  dados 
podem  ser  analisados  no  nível  desagregado  (responden- 
tes  individuais)  ou  agregado  ao  longo  dos  respondentes 
(segmentos  ou  alguns  outros  agrupamentos  homogêneos 
de  respondentes)  para  estimar  as  utilidades  parciais  con¬ 
juntas  para  cada  nível  e  os  termos  de  interação.  A  partir 
desses  resultados,  podemos  avaliar  as  contribuições  de 
cada  fator  e  a  interação  fator-nível  e  estimar  as  possíveis 
participações  de  mercado  de  perfis  concorrentes. 


Características  únicas  de  análise 
conjunta  baseada  em  escolhas 

A  natureza  básica  da  análise  conjunta  baseada  em  esco¬ 
lhas  e  seus  antecedentes  no  campo  teórico  de  integração 
de  informação  [58]  levou  a  uma  perspectiva  um  pouco 
mais  técnica  do  que  a  encontrada  nas  outras  metodologias 
conjuntas.  Embora  as  outras  metodologias  sejam  basea¬ 
das  em  experimentos  válidos  e  princípios  estatísticos,  a 
complexidade  adicional  em  delineamentos  de  estímulos 
e  estimação  tem  causado  muitos  esforços  no  desenvol¬ 
vimento  nessas  áreas.  A  partir  desses  esforços,  os  pes¬ 
quisadores  agora  têm  uma  compreensão  mais  clara  das 
questões  envolvidas  em  cada  estágio.  As  seções  a  seguir 
detalham  algumas  das  áreas  e  questões  nas  quais  a  análise 
conjunta  baseada  em  escolhas  é  única  entre  as  metodolo¬ 
gias  conjuntas. 

Tipo  de  processo  de  tomada  de  decisão  retratada.  A 

análise  conjunta  tradicional  sempre  foi  associada  a  uma 
abordagem  intensiva  de  informações  para  tomada  de  de¬ 
cisões,  pois  ela  envolve  o  exame  dos  estímulos  de  perfil 
completo  compostos  de  níveis  de  cada  atributo.  Cada 
atributo  é  igualmente  representado  e  considerado  em 
um  único  perfil.  Mas  na  análise  conjunta  baseada  em  es¬ 
colhas,  os  pesquisadores  estão  chegando  à  conclusão  de 
que  a  tarefa  de  escolha  pode  invocar  um  tipo  diferente 
de  processo  de  tomada  de  decisão.  Ao  escolherem  en¬ 
tre  estímulos,  os  clientes  parecem  fazê-lo  em  meio  a  um 
subconjunto  menor  de  fatores  em  relação  ao  qual  com¬ 
parações  e,  afinal,  escolhas  são  feitas  [39].  Isso  caminha 
paralelamente  com  os  tipos  de  decisões  associadas  a  es¬ 
tratégias  simplificadoras  ou  restritas  a  tempo,  cada  uma 
caracterizada  por  uma  menor  profundidade  de  proces¬ 
samento.  Logo,  cada  metodologia  conjunta  fornece  di¬ 
ferentes  visões  sobre  o  processo  de  tomada  de  decisões. 
Como  os  pesquisadores  podem  não  querer  selecionar 
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TABELA  7-8  Exemplo  de  um  conjunto  escolha  em  análise  conjunta  baseada  em  escolhas 


Qual  sistema  de  chamada  você  escolheria? 

1 

2 

3 

4 

Sistema  de  base  a  $1 4,95/mês  e 
$0,05/mlnuto  mais: 

•  TWC:  chamada  com  três  linhas 
por  $3, 50/mês 

Sistema  de  base  a  $1 4,95/mês  e 
$0, 05/minuto  mais: 

•  ICA:  chamadas  listadas  a 
$2, 75/mês 

Sistema  de  base  a  $1 4,95/mês  e 
$0, 05/minuto  mais: 

•  CW:  espera  de  chamada  a 
$3, 50/mês  e 

•  TWC:  chamada  com  três  linhas 
a  $3,50/mês 

Nenhum  destes 

apenas  uma  metodologia,  uma  estratégia  emergente  é 
empregar  ambas  e  extrair  perspectivas  únicas  de  cada 
uma  [39, 80]. 

Delineamento  de  conjnnto  escolha.  Talvez  a  maior  van¬ 
tagem  da  análise  conjunta  baseada  em  escolhas  seja  o  pro¬ 
cesso  realista  de  escolha  representado  pelo  conjunto  esco¬ 
lha.  Desenvolvimentos  recentes  melhoraram  ainda  mais  a 
tarefa  de  escolha,  permitindo  relações  adicionais  dentro 
do  modelo  de  escolha  a  ser  analisado  enquanto  se  aumen¬ 
ta  a  efetividade  do  delineamento  do  conjunto  escolha: 

•  Um  esforço  recente  mostrou  como  o  conjunto  de  escolha 
pode  ser  criado  para  garantir  equilíbrio  não  entre  níveis  de 
fatores,  mas  entre  as  utilidades  dos  estímulos  [40].  A  esco¬ 
lha  mais  realista  e  informativa  ocorre  entre  alternativas  pro¬ 
ximamente  comparáveis,  e  não  na  situação  em  que  um  ou 
mais  estímulos  são  sensivelmente  inferiores  ou  superiores. 
No  entanto,  o  processo  de  delineamento  de  estímulos  é  ti¬ 
picamente  focado  na  meta  de  ortogonalidade  e  equilíbrio 
entre  os  atributos.  Isso  fornece  uma  tarefa  mais  realista, 
criando  estímulos  com  níveis  de  utilidade  mais  compará¬ 
veis,  aumentando  o  envolvimento  do  cliente  e  fornecendo 
melhores  resultados. 

•  Uma  opção  na  criação  de  um  conjunto  escolha  é  a  alterna¬ 
tiva  "nenhuma  escolha",  na  qual  o  respondente  tem  a  opor¬ 
tunidade  de  escolher  nenhuma  das  opções  especificadas 
[32].  Esta  possibilidade  dá  ao  respondente  um  nível  extra 
de  realismo  enquanto  também  fornece  ao  pesquisador  uma 
maneira  de  estabelecer  efeitos  absolutos  e  relativos. 

•  Muitas  vezes,  devem  ser  acomodados  elementos  específi¬ 
cos  da  tarefa  de  escolha,  como  pares  proibidos,  efeitos  es¬ 
pecíficos  de  níveis,  ou  efeitos  cruzados  entre  níveis  (como 
marcas),  que  demandam  tarefas  de  escolha  especialmente 
planejadas  que  são  mais  facilmente  conseguidas  através  da 
análise  conjunta  baseada  em  escolhas  [16,  85].  Além  disso, 
em  um  método  envolvendo  informação  adicional  dos  res- 
pondentes,  são  criados  conjuntos  escolha  que  ajustam  as 
preferências  únicas  de  cada  indivíduo  e  atingem  uma  me¬ 
lhor  precisão  preditiva  em  situações  de  mercado  [12]. 

Cada  um  desses  desenvolvimentos  são  característicos 
dos  esforços  pretendidos  ao  se  melhorar  a  tarefa  de  esco¬ 
lha  em  análise  conjunta  baseada  em  escolhas  para  conferir 
um  método  mais  realista  e  eficiente  de  avaliar  preferência 
de  clientes. 

Técnica  de  estimação.  A  fundamentação  conceituai  da 
análise  conjunta  baseada  em  escolhas  é  a  psicologia  [60, 


104],  mas  foi  o  desenvolvimento  da  técnica  de  estimação 
logit  multinomial  [64]  que  forneceu  um  método  operacio¬ 
nal  para  estimar  esses  tipos  de  modelos  de  escolha.  Ape¬ 
sar  de  esforços  consideráveis  terem  refinado  a  técnica  e 
tornado  a  mesma  amplamente  disponível,  ela  ainda  re¬ 
presenta  uma  metodologia  mais  complexa  do  que  aquelas 
associadas  a  outras  metodologias  conjuntas. 

A  abordagem  baseada  em  escolha  foi  originalmente 
estimada  apenas  no  nível  agregado,  mas  desenvolvimen¬ 
tos  têm  permitido  a  formação  de  modelos  no  nível  de  seg¬ 
mentos  (conhecidos  como  modelos  de  classe  latente)  e  até 
mesmo  modelos  individuais  através  de  estimação  bayesia- 
na  [6,  56,  91,  103].  Este  desenvolvimento  estimulou  uma 
adoção  até  mais  ampla  de  métodos  baseados  em  escolhas, 
viabilizando  modelos  desagregados  mais  propícios  para 
emprego  em  simuladores  de  escolha  e  outras  aplicações. 

Um  aspecto  particular  que  ainda  não  está  resolvido  em 
modelos  agregados  ou  no  uso  de  simuladores  de  escolha  é 
a  propriedade  de  IIA  (independência  de  alternativas  irre¬ 
levantes),  uma  suposição  que  torna  problemática  a  previ¬ 
são  de  alternativas  semelhantes.  Apesar  de  a  exploração 
de  todas  as  questões  inerentes  a  IIA  estar  além  do  escopo 
dessa  discussão,  deve-se  advertir  o  pesquisador  quando 
usar  modelos  de  nível  agregado  estimados  pela  análise 
conjunta  baseada  em  escolhas  para  entender  as  ramifica¬ 
ções  dessa  suposição. 

Algumas  vantagens  e  limitações  da 
análise  conjunta  baseada  em  escolhas 

A  crescente  aceitação  da  análise  conjunta  baseada  em  es¬ 
colhas  entre  praticantes  da  pesquisa  de  marketing  deve-se 
principalmente  à  crença  de  que  a  obtenção  de  preferên¬ 
cias  por  meio  de  respondentes  que  escolhem  um  único 
estímulo  de  um  conjunto  de  estímulos  é  mais  realista  - 
e,  portanto,  um  método  melhor  -  para  se  aproximar  de 
processos  de  decisão  reais.  Entretanto,  o  realismo  acres¬ 
centado  pela  tarefa  de  escolha  é  acompanhado  de  várias 
negociações  que  o  pesquisador  deve  considerar  antes  de 
selecionar  a  análise  conjunta  baseada  em  escolhas. 

A  tarefa  de  escolha.  Cada  conjunto  escolha  contém 
diversos  estímulos,  e  cada  estímulo,  diversos  fatores  em 
diferentes  níveis,  semelhantes  aos  estímulos  de  perfil 
completo.  Portanto,  o  respondente  deve  processar  uma 
quantidade  consideravelmente  maior  de  informação  do 
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que  em  outras  metodologias  conjuntas  ao  fazer  uma  es¬ 
colha  em  cada  conjunto  escolha.  A  Sawtooth  Software, 
criadora  do  sistema  de  análise  conjunta  baseada  em  es¬ 
colhas  (CBC),  acredita  que  as  escolhas  que  envolvem 
mais  que  seis  atributos  provavelmente  irão  confundir  e 
sobrecarregar  o  respondente  [88].  Apesar  de  o  método 
baseado  em  escolha  imitar  decisões  reais  com  mais  h- 
delidade,  a  inclusão  de  muitos  atributos  cria  uma  tarefa 
formidável  que  termina  com  menos  informação  do  que 
teria  sido  obtida  por  meio  da  avaliação  de  cada  estímulo 
individualmente. 

Precisão  preditiva.  Na  prática,  as  três  metodologias  con¬ 
juntas  permitem  tipos  parecidos  de  análises,  simulações  e 
relatos,  ainda  que  os  processos  de  estimação  sejam  dife¬ 
rentes.  Os  modelos  baseados  em  escolhas  ainda  têm  de 
estar  sujeitos  a  testes  empíricos  mais  completos,  apesar  de 
alguns  pesquisadores  acreditarem  que  eles  têm  vantagem 
para  prever  o  comportamento  de  escolha,  particularmente 
quando  modelos  no  nível  de  segmentos  ou  agregados  são 
desejados  [108].  Contudo,  testes  empíricos  indicam  pouca 
diferença  entre  modelos  baseados  em  avaliações  em  nível 
individual  ajustados  para  levar  em  conta  as  não-escolhas  e 
os  modelos  multinomiais  generalizados  logit  baseados  em 
escolhas  [68]. 

Na  comparação  das  duas  abordagens  (baseadas  em 
avaliações  ou  em  escolhas)  em  termos  da  habilidade  de 
prever  participações  de  mercado  em  uma  amostra  de 
validação  no  nível  individual  [21],  ambas  prevêem  bem 

-  REGRAS  PRÁTICAS  7-7  - 

Modelos  conjuntos  alternativos 

•  Quando  10  ou  mais  atributos  são  incluídos  na  variável 
estatística  conjunta,  dois  modelos  alternativos 
encontram-se  disponíveis: 

•  Modelos  adaptativos  podem  facilmente  acomodar 
até  30  atributos,  mas  requerem  uma  entrevista  via 
computador 

•  Modelos  auto-explicados  podem  ser  feitos  através  de 
qualquer  forma  de  coleta  de  dados,  mas  representam 
um  desvio  de  métodos  conjuntos  tradicionais 

•  Modelos  conjuntos  baseados  em  escolhas  tornaram-se 
o  formato  mais  popular  de  todos,  ainda  que  eles  não 
acomodem  geralmente  mais  do  que  seis  atributos,  com 
popularidade  baseada  em: 

•  Uso  de  uma  tarefa  realista  de  escolha  para  seleção 
dos  estímulos  de  maior  preferência  a  partir  de  um 
conjunto  escolha  de  estímulos,  incluindo  uma  opção 
do  tipo  "nenhuma  escolha" 

•  Habilidade  para  estimar  mais  facilmente  efeitos  de 
interação 

•  Disponibilidade  crescente  de  programas 
computacionais,  particularmente  com  opções 
bayesianas  de  estimação 


escolhas  da  amostra  de  validação,  com  nenhuma  técnica 
dominante  e  os  resultados  se  misturando  em  diferentes 
situações.  No  fim,  a  decisão  de  usar  um  método  no  lugar 
do  outro  é  ditada  pelos  objetivos  e  pelo  escopo  do  estu¬ 
do,  pela  familiaridade  do  pesquisador  com  cada  método, 
e  pelo  software  disponível  para  analisar  adequadamente 
os  dados. 

Aplicações  administrativas.  Modelos  baseados  em  es¬ 
colha  estimados  no  nível  agregado  fornecem  os  valores 
e  a  signihcância  estatística  de  todas  as  estimativas,  facil¬ 
mente  produzem  previsões  realistas  de  participações  de 
mercado  para  novos  estímulos  [44,  108]  e  fornecem  as 
garantias  extras  de  que  as  “escolhas”  entre  os  estímu¬ 
los  foram  usadas  para  calibrar  o  modelo.  No  entanto,  os 
modelos  conjuntos  de  escolha  agregados  impedem  a  seg¬ 
mentação  do  mercado.  O  desenvolvimento  de  segmenta¬ 
ção  ou  mesmo  de  modelos  de  nível  individual  foi  a  res¬ 
posta  a  tal  necessidade  [56, 103, 111].  A  capacidade  deles 
de  representar  termos  de  interação  e  complexas  relações 
entre  atributos  fornece  uma  visão  melhor  dos  processos 
reais  de  escolha  e  das  relações  agregadas  esperadas  vis¬ 
tas  através  de  simuladores  de  escolha.  No  entanto,  para 
a  maioria  das  situações  básicas  de  escolha,  os  modelos 
baseados  em  avaliação  descritos  anteriormente  são  ade¬ 
quados  para  estudos  de  segmentação  e  para  a  simulação 
de  participações  de  escolha.  Novamente,  o  pesquisador 
deve  decidir  sobre  o  nível  de  realismo  versus  a  comple¬ 
xidade  desejada  em  qualquer  aplicação  de  análise  con¬ 
junta. 

Disponibilidade  de  programas  de  computador.  A  boa 

notícia  é  que  para  pesquisadores  estão  agora  disponíveis 
diversos  programas  baseados  em  escolha  que  auxiliam 
em  todas  as  fases  do  projeto  da  pesquisa,  da  estimação  do 
modelo  e  da  interpretação  [42,  88].  A  notícia  ruim  é  que 
as  recentes  pesquisas  de  acadêmicos  e  de  pesquisadores 
aplicados  estão  sendo  integradas  lentamente  a  esses  pro¬ 
gramas  disponíveis  comercialmente.  Muitos  dos  avanços 
em  pesquisa  ainda  são  encontrados  apenas  em  um  domí¬ 
nio  limitado  e  não  estão  disponíveis  para  amplo  uso.  Es¬ 
ses  aperfeiçoamentos  e  competências  melhoradas,  após 
rigorosa  validação  da  comunidade  científica,  deverão  se 
tornar  uma  parte  padrão  de  todos  os  programas  baseados 
em  escolhas. 

Resumo 

A  análise  conjunta  baseada  em  escolha  é  uma  metodo¬ 
logia  emergente  que  promete  aumentar  as  capacidades 
interpretativas  e  preditivas  da  análise  conjunta.  O  amplo 
interesse  e  pesquisa  nos  melhoramentos  em  quase  todas 
as  áreas  da  metodologia  fornecerão  os  fundamentos  ne¬ 
cessários  para  o  crescimento  contínuo,  a  disponibilidade 
e  a  aceitação  desse  método.  Isso  acrescentará  um  compo¬ 
nente  distinto  ao  kit  de  ferramentas  do  pesquisador  para 
compreender  as  preferências  do  consumidor. 
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Visão  geral  das  três  metodologias  conjuntas 

A  análise  conjunta  evoluiu,  desde  sua  origem,  a  partir  do 
que  agora  conhecemos  como  análise  conjunta  tradicio¬ 
nal,  para  desenvolver  duas  metodologias  adicionais,  que 
abordam  duas  questões  substanciais:  lidar  com  grandes 
números  de  atributos  e  tornar  a  tarefa  de  escolha  mais 
realista  [74].  Cada  metodologia  tem  características  dis¬ 
tintas  que  ajudam  a  dehnir  as  situações  nas  quais  é  mais 
aplicável  (veja  nossa  discussão  anterior  no  estágio  2). 
Entretanto,  em  muitas  situações,  duas  ou  mais  metodo¬ 
logias  são  adequadas,  e  o  pesquisador  tem  a  opção  de 
selecionar  uma  ou,  mais  freqüentemente  técnicas  com¬ 
binadas.  Somente  conhecendo  as  vantagens  e  desvanta¬ 
gens  de  cada  método  é  que  o  pesquisador  pode  fazer  a 
escolha  mais  apropriada.  Os  pesquisadores  interessados 
em  análise  conjunta  são  encorajados  a  continuar  a  mo¬ 
nitorar  os  desenvolvimentos  dessa  técnica  multivariada 
amplamente  empregada. 


UMA  ILUSTRAÇÃO  DE 
ANÁLISE  CONJUNTA 

Nesta  seção  examinamos  os  passos  em  uma  aplicação  de 
análise  conjunta  para  produzir  um  problema  de  delinea¬ 
mento.  A  discussão  segue  o  processo  de  construção  de 
modelo  introduzido  no  Capítulo  1  e  se  concentra  (1)  no 
delineamento  dos  estímulos,  (2)  na  estimação  e  interpre¬ 
tação  das  utilidades  parciais  conjuntas,  e  (3)  na  aplica¬ 
ção  de  um  simulador  conjunto  para  prever  participações 
de  mercado  para  a  formulação  de  um  novo  produto.  O 
módulo  CONJOINT  do  SPSS  é  usado  nas  fases  de  deli¬ 
neamento,  análise  e  simulador  de  escolha  desse  exemplo 
[97].  Resultados  comparáveis  são  obtidos  com  os  outros 
programas  conjuntos  disponíveis  para  uso  acadêmico  e 
comercial.  A  base  de  dados  de  respostas  conjuntas  está 
disponível  na  Web  em  www.bookman.com.br. 

Estágio  1:  Objetivos  da  análise  conjunta 

A  análise  conjunta,  como  discutido  anteriormente,  tem 
sido  efetivamente  aplicada  em  situações  de  desenvolvi¬ 
mento  de  produtos  que  exigem  (1)  uma  compreensão  de 
preferências  de  clientes  sobre  atributos  e  (2)  um  método 
para  simular  resposta  de  clientela  a  vários  planejamentos 
de  produtos.  Através  da  aplicação  da  análise  conjunta, 
pesquisadores  podem  desenvolver  estimativas  agregadas 
(p.ex.,  nível  de  segmentos)  de  preferências  de  clientes  ou 
estimativas  de  modelos  desagregados  (ou  seja,  nível  indi¬ 
vidual)  a  partir  das  quais  podem  ser  obtidos  segmentos. 


A  HBAT  estava  seriamente  considerando  o  planeja¬ 
mento  de  um  novo  detergente  industrial  para  uso  não 
somente  em  sua  própria  indústria,  mas  em  muitas  fá¬ 
bricas.  Ao  desenvolver  o  conceito  do  produto,  a  HBAT 


queria  uma  compreensão  mais  direta  das  necessidades  e 
preferências  de  seus  clientes  industriais.  Assim,  em  um 
estudo  adjunto  àquele  descrito  no  Capítulo  1,  a  HBAT 
escolheu  entre  86  clientes  industriais  para  um  experi¬ 
mento  de  análise  conjunta. 

Antes  que  o  estudo  conjunto  real  fosse  executado, 
equipes  internas  de  pesquisa  de  mercado,  em  consulta 
com  o  grupo  de  desenvolvimento  do  produto,  identifi¬ 
caram  cinco  fatores  como  os  atributos  determinantes  no 
segmento  alvo  do  mercado  do  detergente  industrial.  Os 
cinco  atributos  são  mostrados  na  Tabela  7-9.  A  pesquisa 
com  grupos  de  interesse  confirmou  que  esses  cinco  atri¬ 
butos  representam  os  principais  determinantes  de  valor 
em  um  detergente  industrial  para  este  segmento,  per¬ 
mitindo  assim  que  a  fase  de  delineamento  prossiga  com 
melhor  especificação  dos  atributos  e  de  seus  níveis. 


Estágio  2:  Projeto  da  análise  conjunta 

As  decisões  nesta  fase  são  (1)  selecionar  a  metodologia 
conjunta  a  ser  empregada,  (2)  delinear  os  estímulos  a  se¬ 
rem  avaliados,  (3)  especificar  a  forma  do  modelo  básico  e 
(4)  selecionar  o  método  de  coleta  de  dados. 

Seleção  de  uma  metodologia  conjunta 

A  primeira  questão  a  ser  resolvida  é  a  seleção  da  me¬ 
todologia  conjunta  entre  as  três  opções  -  tradicional, 
adaptativa/híbrida  ou  baseada  em  escolhas.  A  escolha 
do  método  deve  se  sustentar  não  apenas  em  considera¬ 
ções  de  planejamento  (p.ex.,  número  de  atributos,  tipo 
de  administração  de  levantamento  etc.),  mas  também  na 
adequação  da  tarefa  de  escolha  para  a  decisão  de  produ¬ 
to  sob  estudo. 


Dado  o  pequeno  número  de  fatores  (cinco),  as  três  me¬ 
todologias  seriam  adequadas.  Como  a  ênfase  era  em 
uma  compreensão  direta  da  estrutura  de  preferência  e 
a  decisão  foi  prevista  como  uma  de  elevado  envolvimen¬ 
to  do  cliente,  a  metodologia  escolhida  foi  a  tradicional, 
adequada  em  termos  de  carga  de  resposta  sobre  o  res- 
pondente  e  profundidade  de  informação  representada. 
A  análise  conjunta  baseada  em  escolhas  também  foi 
fortemente  considerada,  mas  a  ausência  de  interações 
propostas  e  o  desejo  de  reduzir  a  complexidade  de  tare¬ 
fa  levaram  à  seleção  do  método  conjunto  tradicional.  A 
abordagem  adaptativa  não  foi  fortemente  considerada, 
dado  o  pequeno  número  de  atributos  e  o  desejo  de  utili¬ 
zar  métodos  tradicionais  de  levantamento,  como  aqueles 
por  escrito. 


Delineamento  de  estimulos 

Com  o  método  tradicional  de  perfil  completo  selecionado, 
o  próximo  passo  envolve  o  delineamento  de  estímulos. 
Apesar  de  os  atributos  já  terem  sido  escolhidos,  o  pesqui- 
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TABELA  7-9  Atributos  e  níveis  para  o  experimento  de  análise  conjunta  HBAT  envolvendo  planejamento 
de  um  detergente  industrial 


Descrição  do  atributo 

Níveis 

Forma  do  produto 

Líquido  pré-misturado 

Líquido  concentrado 

Pó 

Número  de  aplicações  por  frasco 

50 

100 

200 

Adição  de  desinfetante  ao  detergente 

Sim 

Não 

Formulação  biodegradável 

Não 

Sim 

Preço  por  aplicação  típica 

35  centavos 

49  centavos 

79  centavos 

sador  deve  tomar  muito  cuidado  durante  este  estágio  ao 
especificar  os  níveis  de  atributos  para  operacionalizar  os 
atributos  no  planejamento  dos  estímulos.  Entre  as  consi¬ 
derações  a  serem  abordadas  estão  a  natureza  dos  níveis 
(garantindo  que  eles  são  acionáveis  e  comunicáveis),  a 
magnitude  e  o  intervalo  dos  níveis  para  cada  atributo,  e  o 
potencial  para  correlação  inter-atributos. 


Definição  de  níveis.  A  primeira  consideração  é  garan¬ 
tir  que  cada  nível  seja  acionável  e  comunicável.  A  pes¬ 
quisa  de  grupo  de  foco  estabeleceu  níveis  específicos 
para  cada  atributo  (ver  Tabela  7-9).  Cada  um  dos  níveis 
foi  planejado  para  (1)  empregar  terminologia  usada  na 
indústria  e  (2)  representar  aspectos  do  produto  rotinei¬ 
ramente  especificados  em  decisões  de  compra. 

Magnitndes  e  amplitudes  dos  níveis.  Os  três  atributos 
de  Forma  do  Produto,  Desinfetante  e  Biodegradabilida- 
de  apenas  retratam  características  específicas;  dois  atri¬ 
butos  precisam  de  um  exame  complementar  quanto  à 
adequação  dos  intervalos  dos  níveis.  Primeiro,  Número 
de  Aplicações  varia  de  50  a  200.  Dada  a  forma  escolhida 
do  produto,  esses  níveis  foram  escolhidos  para  resul¬ 
tarem  nos  casos  típicos  de  embalagens  encontradas  no 
ambiente  industrial,  variando  de  frascos  pequenos  para 
indivíduos  a  containers  maiores  normalmente  associa¬ 
dos  com  operações  centralizadas  de  manutenção. 

A  seguir,  os  três  níveis  de  Preço  por  Aplicação  foram 
determinados  a  partir  do  exame  de  produtos  existentes. 
Desse  modo,  eles  foram  considerados  realistas  e  repre¬ 
sentando  os  preços  mais  comuns  do  mercado  corrente. 
Deve  ser  observado  que  os  níveis  de  preço  são  conside¬ 
rados  monotônicos  (ou  seja,  têm  uma  ordenação),  mas 
não  lineares,  pois  os  intervalos  (diferenças  entre  níveis) 
não  são  consistentes*. 

Correlação  inter-atributos.  O  tipo  de  produto  não 
sugere  fatores  intangíveis  que  contribuiriam  com  cor¬ 
relação  inter-atributos,  e  os  atributos  foram  especifi¬ 
camente  definidos  para  minimizarem  tal  correlação. 
Todas  as  possíveis  combinações  de  níveis  foram  exa¬ 
minadas  para  se  identificar  qualquer  combinação  ina¬ 
dequada  e  nenhuma  foi  encontrada. 


Pré-teste.  Finalmente,  um  pré-teste  de  pequena  escala 
e  um  estudo  de  avaliação  foram  conduzidos  para  garan¬ 
tir  que  as  medidas  foram  compreendidas  e  representa¬ 
ram  alternativas  razoáveis  quando  formadas  nos  estímu¬ 
los.  Os  resultados  indicaram  nenhum  problema  com  os 
níveis,  permitindo  assim  que  o  processo  continuasse. 


Especificação  da  forma  básica  do  modelo 

Com  os  níveis  especificados,  o  pesquisador  deve  a  seguir 
especificar  o  tipo  de  forma  de  modelo  a  ser  usada.  Fazen¬ 
do  isso,  duas  questões  críticas  devem  ser  abordadas:  (1) 
se  interações  devem  ser  representadas  entre  os  atributos, 
e  (2)  o  tipo  de  relação  entre  os  níveis  (utilidade  parcial, 
linear  ou  quadrática)  para  cada  atributo. 


Forma  do  modelo.  Após  cuidadosa  consideração,  os 
pesquisadores  da  HBAT  estavam  confiantes  ao  assu¬ 
mir  que  uma  regra  de  composição  aditiva  era  adequada. 
Apesar  de  a  pesquisa  ter  mostrado  que  freqüentemente 
o  preço  tem  interações  com  outros  fatores,  foi  considera¬ 
do  que  os  outros  fatores  eram  razoavelmente  ortogonais 
e  que  não  eram  necessários  termos  de  interação.  Essa 
suposição  permitiu  o  uso  de  modelos  agregados  ou  desa¬ 
gregados  quando  necessário. 

Relações  de  utilidade  parcial.  Três  dos  atributos  {For¬ 
ma  do  Produto,  Aplicações  por  Frasco  e  Preço  por  Apli¬ 
cação)  têm  mais  de  dois  níveis,  exigindo  desse  modo 
uma  decisão  sobre  o  tipo  de  relação  de  utilidades  par¬ 
ciais  a  ser  empregada.  O  atributo  Forma  do  Produto  re¬ 
presenta  distintos  tipos  de  produtos,  e  assim  estimativas 
separadas  de  utilidades  parciais  são  apropriadas.  O  atri¬ 
buto  Aplicação  por  Frasco  também  apresenta  três  níveis, 
apesar  de  não  terem  intervalos  iguais.  Logo,  estimativas 
separadas  de  utilidades  parciais  também  foram  usadas 
aqui.  Finalmente,  preço  também  foi  especificado  com 
estimativas  separadas  de  utilidades  parciais,  pois  os  in¬ 
tervalos  não  são  constantes  entre  níveis. 

Desses  três  fatores,  somente  Preço  por  Aplicação  foi 
especificado  como  monotônico,  por  conta  da  relação  im¬ 
plicada  com  preço.  Forma  do  Produto  representa  níveis 
separados  sem  ordem  pré-concebida.  O  i&lor  Aplicações 
por  Frasco  não  foi  considerado  monotônico,  apesar  de 

(Continua) 


*  N.  de  R.  T.:  A  frase  correta  seria  “não  são  constantes”. 
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OS  níveis  serem  definidos  em  termos  numéricos  (p.ex.,  50 
aplicações  por  frasco).  Nesta  situação,  nenhum  conheci¬ 
mento  anterior  levou  os  pesquisadores  a  proporem  que 
as  utilidades  parciais  devessem  aumentar  ou  diminuir 
consistentemente  ao  longo  desses  níveis. 


Seleção  do  método  de  coleta  de  dados 

O  passo  final  no  delineamento  da  análise  conjunta  gira 
em  torno  da  coleta  real  de  preferências  dos  responden- 
tes.  Fazendo-se  isso,  diversos  pontos  devem  ser  tratados, 
incluindo  a  seleção  do  método  de  apresentação,  a  criação 
real  dos  estímulos  e  a  identificação  de  quaisquer  estímulos 
inaceitáveis,  selecionando-se  uma  medida  de  preferência 
e  finalizando  o  procedimento  de  administração  do  levan¬ 
tamento.  Cada  uma  dessas  questões  é  discutida  a  seguir. 


Seleção  de  método  de  apresentação.  Para  garantir 
realismo  e  permitir  o  uso  de  avaliações  no  lugar  de  or¬ 
denações,  a  HBAT  decidiu  utilizar  o  método  de  perfil 
completo  para  obtenção  de  avaliações  de  respondentes. 
As  abordagens  de  troca  e  de  pares  não  foram  utilizadas 


devido  à  sua  falta  de  realismo  ao  não  se  considerarem 
todos  os  atributos  em  cada  estímulo.  Um  método  híbri¬ 
do  ou  adaptativo  não  foi  necessário  devido  ao  número 
relativamente  pequeno  de  fatores.  Um  método  com  base 
em  escolha  teria  sido  igualmente  adequado,  dado  o  nú¬ 
mero  menor  de  atributos  e  o  realismo  da  tarefa  de  esco¬ 
lha,  mas  o  método  de  perfil  completo  acabou  sendo  es¬ 
colhido  por  conta  da  necessidade  de  resultados  aditivos 
desagregados  com  o  método  mais  simples  de  estimação. 

Planejamento  de  estímnlos.  Escolhendo  a  regra  adi¬ 
tiva,  pesquisadores  foram  capazes  também  de  usar  um 
planejamento  fatorial  fracionário  para  evitar  a  avaliação 
das  108  combinações  possíveis  (3x3x2x2x3).0  com¬ 
ponente  de  planejamento  de  estímulo  do  programa  com¬ 
putacional  gerou  um  conjunto  de  18  descrições  de  perfil 
completo  (ver  Tabela  7-10),  permitindo  a  estimação  dos 
efeitos  principais  ortogonais  para  cada  fator.  Quatro  es¬ 
tímulos  adicionais  foram  gerados  para  servirem  como 
estímulos  de  validação.  Nenhum  dos  estímulos  foi  consi¬ 
derado  inaceitável  depois  de  serem  examinados  quanto 
a  realismo  e  adequação  à  questão  de  pesquisa. 
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TABELA  7-10  Conjunto  de  18  estímulos  de  perfil  completo  usado  no  experimento  de  análise  conjunta  de  HBAT  para  o  planejamento  de  um 
detergente  industrial 


Níveis  de  atributos 

Estímulo  n° 

Forma  do  produto 

Número  de  aplicações 

Qualidade  desinfetante 

Forma  biodegradãvel 

Preço  por  aplicação 

Estímulos  usados  na  estimação  de  utilidades  parciais 

1 

Concentrado 

200 

Sim 

Não 

35  centavos 

2 

Pó 

200 

Sim 

Não 

35  centavos 

3 

Pré-misturado 

100 

Sim 

Sim 

49  centavos 

4 

Pó 

200 

Sim 

Sim 

49  centavos 

5 

Pó 

50 

Sim 

Não 

79  centavos 

6 

Concentrado 

200 

Não 

Sim 

79  centavos 

7 

Pré-misturado 

100 

Sim 

Não 

79  centavos 

8 

Pré-misturado 

200 

Sim 

Não 

49  centavos 

9 

Pó 

100 

Não 

Não 

49  centavos 

10 

Concentrado 

50 

Sim 

Não 

49  centavos 

11 

Pó 

100 

Não 

Não 

35  centavos 

12 

Concentrado 

100 

Sim 

Não 

79  centavos 

13 

Pré-misturado 

200 

Não 

Não 

79  centavos 

14 

Pré-misturado 

50 

Sim 

Não 

35  centavos 

15 

Concentrado 

100 

Sim 

Sim 

35  centavos 

16 

Pré-misturado 

50 

Não 

Sim 

35  centavos 

17 

Concentrado 

50 

Não 

Não 

49  centavos 

18 

Pó 

50 

Sim 

Sim 

79  centavos 

Estímulos  de  validação 

19 

Concentrado 

100 

Sim 

Não 

49  centavos 

20 

Pó 

100 

Não 

Sim 

35  centavos 

21 

Pó 

200 

Sim 

Sim 

79  centavos 

22 

Concentrado 

50 

Não 

Sim 

35  centavos 
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Coletadas  preferências  dos  respondentes.  O  experi¬ 
mento  de  análise  conjunta  foi  aplicado  durante  uma 
entrevista  pessoal.  Após  a  coleta  de  alguns  dados  preli¬ 
minares,  os  respondentes  receberam  um  conjunto  de  22 
cartões,  cada  um  contendo  uma  das  descrições  de  estí¬ 
mulo  de  perfil  completo.  Uma  medida  de  avaliação  de 
preferência  foi  conseguida  apresentando  a  cada  respon- 
dente  um  formulário  com  sete  categorias  de  resposta, 
variando  de  “de  forma  alguma  eu  compraria”  até  “certa¬ 
mente  compraria”.  Os  respondentes  foram  instruídos  a 
colocar  cada  cartão  na  categoria  de  resposta  que  melhor 
descrevesse  suas  intenções  de  compra.  Após  inicialmen¬ 
te  colocarem  os  cartões,  eles  foram  solicitados  a  reverem 
suas  colocações  e  rearranjarem  cartões,  se  necessário.  Os 
estímulos  de  validação  foram  avaliados  ao  mesmo  tem¬ 
po  que  os  outros  estímulos,  mas  retirados  da  análise  no 
estágio  de  estimação.  Ao  fim,  o  entrevistador  registrou  a 
categoria  para  cada  cartão  e  prosseguiu  com  a  entrevis¬ 
ta.  Um  total  de  86  respondentes  completou  com  sucesso 
toda  a  tarefa  conjunta. 


Estágio  3:  Suposições  na  análise  conjunta 

A  suposição  relevante  em  análise  conjunta  é  a  especifica¬ 
ção  da  regra  de  composição  e,  assim,  a  forma  de  modelo 
usada  para  estimar  os  resultados  conjuntos.  Essa  avalia¬ 
ção  deve  ser  baseada  em  termos  conceituais,  bem  como 
questões  práticas. 


Nessa  situação,  a  natureza  do  produto,  a  tangibilidade 
dos  atributos  e  a  falta  de  apelos  intangíveis  ou  emo¬ 
cionais  justificam  o  emprego  de  um  modelo  aditivo.  A 
HBAT  se  sentiu  confiante  para  usar  um  modelo  aditi¬ 
vo  para  essa  situação  de  tomada  de  decisão  industrial. 
Além  disso,  esse  modelo  simplificou  o  delineamento  dos 
estímulos  e  facilitou  os  esforços  de  coleta  de  dados. 


Estágio  4:  Estimação  do  modelo  conjunto 
e  avaliação  do  ajuste  geral  do  modelo 

Com  as  tarefas  conjuntas  especificadas  e  as  respostas  cole¬ 
tadas,  o  próximo  passo  é  utilizar  a  abordagem  apropriada 
de  estimação  para  obter  as  estimativas  de  utilidade  parcial 
e  então  avaliar  a  qualidade  geral  do  ajuste.  Fazendo  isso, 
o  pesquisador  deve  considerar  não  apenas  as  respostas 
usadas  na  estimação,  mas  também  aquelas  coletadas  para 
fins  de  validação. 

Estimação  do  modelo 

Sabendo-se  que  a  medida  de  preferência  usada  era  mé¬ 
trica,  pode-se  empregar  a  abordagem  tradicional  baseada 
em  regressão  ou  a  nova  metodologia  bayesiana.  Como  o 
planejamento  fatorial  fracionário  forneceu  estímulos  sufi¬ 


cientes  para  estimação  de  modelos  desagregados,  a  abor¬ 
dagem  tradicional  foi  empregada.  No  entanto,  deve  ser 
notado  que  a  estimação  bayesiana  teria  sido  igualmente 
apropriada,  particularmente  porque  efeitos  adicionais  de 
interação  eram  desejados. 


A  estimação  de  utilidades  parciais  de  cada  atributo  foi 
primeiramente  executada  para  cada  respondente  sepa¬ 
radamente,  e  os  resultados  foram  então  agregados  para 
se  obter  um  resultado  geral.  Estimativas  separadas  de 
utilidades  parciais  foram  inicialmente  feitas  para  todos 
os  níveis,  com  exame  das  estimativas  individuais  empre¬ 
endido  para  se  examinar  a  possibilidade  de  se  colocarem 
restrições  na  forma  de  relação  de  um  fator  (ou  seja,  em¬ 
pregar  uma  forma  de  relação  linear  ou  quadrática).  A 
Tabela  7-11  mostra  os  resultados  para  a  amostra  geral, 
bem  como  para  os  primeiros  cinco  respondentes  no  con¬ 
junto  de  dados.  O  exame  dos  resultados  gerais  sugere 
que  talvez  uma  relação  linear  pudesse  ser  estimada  para 
a  variável  preço  (ou  seja,  os  valores  de  utilidade  par¬ 
cial  diminuem  de  1,13  para  0,08  e  para  -1,21  à  medida 
que  o  preço  por  aplicação  sobe  de  35  para  49  e  para  79 
centavos).  No  entanto,  uma  revisão  dos  resultados  indi¬ 
viduais  mostra  que  apenas  três  dos  cinco  respondentes 
(107, 123  e  135)  tinham  estimativas  de  utilidades  parciais 
para  fatores  de  preço  que  eram  de  um  padrão  geralmen¬ 
te  linear.  Para  o  respondente  129,  o  padrão  era  essen¬ 
cialmente  estável  e  o  respondente  110  tinha  um  padrão 
um  tanto  ilógico,  no  qual  utilidades  parciais  na  verdade 
aumentavam  quando  se  ia  de  49  para  79  centavos.  Logo, 
a  aplicação  de  uma  forma  linear  para  o  fator  de  preço 
iria  distorcer  gravemente  a  relação  entre  níveis,  e  a  esti¬ 
mação  de  valores  de  utilidades  parciais  separados  para  o 
atributo  de  Preço  por  Aplicação  foi  mantida. 


Avaliação  da  qualidade  do  ajuste 

Para  resultados  desagregados  e  agregados,  três  medi¬ 
das  de  qualidade  do  ajuste  são  fornecidas.  Preferência 
foi  medida  usando-se  avaliações  (dados  métricos);  logo, 
correlações  de  Pearson  foram  calculadas  para  a  amos¬ 
tra  de  estimação.  Os  valores  de  avaliação  também  foram 
convertidos  para  ordenações,  e  uma  medida  tau  de  Ken- 
dall  foi  calculada.  A  amostra  de  teste  tinha  apenas  qua¬ 
tro  estímulos,  e  assim  a  qualidade  de  ajuste,  para  fins  de 
validação,  usou  somente  a  medida  de  ordenação  do  tau 
de  Kendall. 

Ao  contrário  de  muitas  outras  técnicas  multivariadas, 
quando  se  avaliam  resultados  desagregados  nenhum  tes¬ 
te  direto  de  significância  estatística  avalia  as  medidas  de 
qualidade  de  ajuste  acima  descritas.  Podemos  usar,  po¬ 
rém,  níveis  de  correlação  geralmente  aceitos  para  avaliar 
qualidade  de  ajuste  nas  fases  de  estimação  e  de  validação. 
Ao  se  estabelecer  qualquer  referência  para  avaliar  as  me¬ 
didas  de  qualidade  do  ajuste,  o  pesquisador  deve  observar 
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tanto  os  valores  muito  baixos  quanto  os  muito  altos,  pois 
podem  indicar  respondentes  aos  quais  a  tarefa  de  escolha 
não  foi  aplicável. 

Avaliação  de  baixos  valores  de  qualidade  do  ajuste.  Na 

avaliação  de  baixos  valores,  a  referência  óbvia  é  algum 
valor  mínimo  de  correlação  entre  os  escores  reais  de  pre¬ 
ferência  e  os  valores  de  utilidade  previstos.  Várias  pers¬ 
pectivas  podem  ser  usadas: 

•  A  primeira  vê  a  distribuição  de  valores  para  as  medidas  de 
qualidade  do  ajuste.  Valores  atípicos  podem  indicar  respon¬ 
dentes  aos  quais  a  tarefa  de  escolha  não  foi  aplicável  quan¬ 
do  se  compara  com  os  outros  respondentes. 

•  Segundo,  os  níveis  reais  de  correlação  devem  ser  conside¬ 
rados.  Com  o  número  tipicamente  pequeno  de  observações 
(estímulos)  para  cada  respondente,  uma  abordagem  seria 
estabelecer  algum  nível  mínimo  de  correlação,  semelhante 
à  medida  ajustada  em  regressão  multivariada  (ver  Capí¬ 
tulo  4  para  mais  detalhes) 


Neste  exemplo,  o  processo  de  estimação  usou  18  estímu¬ 
los  e  cinco  atributos  como  variáveis  independentes.  Em 
tal  situação,  um  de  aproximadamente  0,300  resulta 
em  um  ajustado  de  zero.  Logo,  uma  correlação  mí¬ 
nima  de  0,55  (a  raiz  quadrada  de  0,300)  garantiria  que 
o  superajuste  foi  acomodado.  O  pesquisador  também 
pode  querer  estabelecer  um  valor  de  referência  mínimo 
que  corresponde  a  um  nível  de  ajuste.  Por  exemplo,  se  o 
pesquisador  desejasse  que  o  processo  de  estimação  ex¬ 
plicasse  pelo  menos  50%  da  variação,  uma  correlação  de 
0,707  seria  necessária. 

Assim,  para  a  amostra  de  estimação,  um  nível  mí¬ 
nimo  da  qualidade  do  ajuste  de  0,55  foi  estabelecido 
para  a  correlação  Pearson  (de  base  métrica)  com  um 
nível  desejado  de  0,707  (correspondente  a  um  R?  de 
50%).  Ao  longo  dos  86  respondentes,  somente  três  ti¬ 
nham  valores  menores  que  0,707  e  todos  eles  estavam 
acima  do  valor  de  referência  mínimo  de  0,55  (ver  Ta¬ 
bela  7-12). 

Os  valores  tau  de  Kendall,  apesar  de  geralmente 
serem  mais  baixos  em  valor,  dados  seus  usos  de  orde¬ 
nação  no  lugar  de  avaliação,  demonstram  o  mesmo 
padrão  geral.  Para  a  amostra  de  validação,  quatro 
respondentes  (110,  229,  266  e  372)  têm  valores  tau  de 
Kendall  particularmente  baixos  (todos  na  faixa  de  0,40 
ou  menos).  Apesar  de  um  desses  respondentes  (266) 
também  apresentar  baixos  valores  de  estimação,  os 
outros  três  têm  valores  baixos  somente  no  processo  de 
validação. 


Avaliação  de  valores  de  qualidade  do  ajuste  muito  al¬ 
tos.  Medidas  extremamente  altas  de  qualidade  do 
ajuste  também  devem  ser  examinadas;  elas  podem  in¬ 
dicar  que  as  tarefas  de  escolha  não  captaram  o  proces¬ 
so  de  decisão,  o  que  é  parecido  com  o  caso  de  valores 


extremamente  baixos.  Por  exemplo,  valores  de  1,0  in¬ 
dicam  que  as  utilidades  parciais  estimadas  captaram 
perfeitamente  o  processo  de  escolha,  o  que  pode  acon¬ 
tecer  quando  o  respondente  utiliza  somente  um  peque¬ 
no  número  de  atributos.  Pode  indicar  também  um  res¬ 
pondente  que  não  seguiu  o  espírito  da  tarefa  e  assim 
fornece  resultados  sem  representatividade.  A  despeito 
de  a  avaliação  de  tais  valores  exigir  um  certo  grau  de 
julgamento  por  parte  do  pesquisador,  é  importante  ava¬ 
liar  os  resultados  para  cada  valor  para  garantir  que  eles 
sejam  verdadeiramente  representativos  do  processo  de 
escolha. 


Três  respondentes  (225,  396  e  586)  foram  identificados 
com  base  em  seus  valores  muito  elevados  de  qualidade 
do  ajuste  para  a  amostra  de  estimação.  Os  valores  de 
qualidade  do  ajuste  para  a  amostra  de  estimação  são 
0,990,  1,000  e  0,974,  respectivamente,  e  os  três  têm  va¬ 
lores  de  qualidade  do  ajuste  de  1,000  para  a  amostra  de 
validação.  Assim,  todos  devem  ser  examinados  para  ver 
se  as  estimativas  de  utilidade  parcial  representam  estru¬ 
turas  de  preferência  razoáveis. 

Quando  se  olha  para  as  estimativas  de  utilidade  par¬ 
cial,  emergem  estruturas  de  preferência  bastante  dife¬ 
rentes  (ver  Tabela  7-13).  Para  o  respondente  225,  todos 
os  atributos  são  valorados  em  algum  grau,  com  Preço 
por  Aplicação  e  Desinfetante  sendo  os  mais  importan¬ 
tes.  No  entanto,  quando  examinamos  o  respondente  396, 
percebemos  um  padrão  totalmente  diferente.  Apenas 
Preço  por  Aplicação  tem  utilidades  parciais  estimadas,  o 
que  indica  que  a  decisão  foi  tomada  somente  sobre  este 
atributo.  O  respondente  586  colocou  alguma  importân¬ 
cia  sobre  Forma  do  Produto  e  Número  de  Aplicações, 
mas  Preço  por  Aplicação  ainda  desempenhou  um  papel 
mais  importante. 

Como  resultado,  o  pesquisador  deve  determinar  se 
esses  respondentes  são  mantidos  com  base  na  adequa¬ 
ção  de  suas  estruturas  de  preferência.  Nesta  situação,  os 
três  respondentes  serão  mantidos.  Para  o  respondente 
225,  a  estrutura  de  preferência  parece  bastante  razoável. 
Para  os  outros  dois  respondentes,  mesmo  que  suas  es¬ 
truturas  de  preferência  estejam  altamente  concentradas 
no  atributo  de  Preço  por  Aplicação,  elas  ainda  represen¬ 
tam  um  padrão  sensato  que  refletiria  as  preferências  de 
clientes  específicos. 


Avaliação  de  níveis  de  qualidade  do  ajuste  de  amostra  de 
validação.  Além  disso,  o  pesquisador  deve  também  exa¬ 
minar  os  níveis  de  qualidade  do  ajuste  para  a  amostra  de 
validação.  Aqui,  o  foco  é  sobre  baixos  valores  de  ajuste, 
uma  vez  que  o  número  relativamente  pequeno  de  estí¬ 
mulos  faz  com  que  valores  maiores  sejam  possíveis  com  a 
expectativa  razoável  de  que  o  modelo  estimado  se  ajuste 
perfeitamente  aos  estímulos  de  validação. 
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TABELA  7-12  Medidas  de  qualidade  do  ajuste  para  resultados  da  análise  conjunta 


Respondente 

Amostra  de  estimação 

Amostra  de 
validação 

Respondente 

Amostra  de  estimação 

Amostra  de 
validação 

Pearson 

Tau  de  Kendall 

Tau  de  Kendall 

Pearson 

Tau  de  Kendall 

Tau  de  Kendall 

107 

0,929 

0,784 

0,707 

363 

0,947 

0,819 

0,548 

110 

0,756 

0,636 

0,408 

364 

0,863 

0,760 

0,707 

123 

0,851 

0,753 

0,707 

366 

0,828 

0,751 

0,548 

129 

0,945 

0,718 

0,816 

368 

0,928 

0,783 

0,775 

135 

0,957 

0,876 

0,816 

370 

0,783 

0,690 

0,913 

155 

0,946 

0,736 

0,707 

372 

0,950 

0,813 

0,183 

161 

0,947 

0,841 

0,913 

382 

0,705 

0,463 

0,548 

162 

0,880 

0,828 

0,667 

396 

1,000 

1,000 

1,000 

168 

0,990 

0,848 

0,913 

399 

0,948 

0,766 

0,913 

170 

0,808 

0,635 

0,667 

401 

0,985 

0,869 

0,913 

171 

0,792 

0,648 

0,548 

416 

0,947 

0,762 

0,816 

173 

0,920 

0,783 

0,548 

421 

0,887 

0,732 

0,548 

174 

0,967 

0,785 

0,913 

422 

0,897 

0,832 

1,000 

181 

0,890 

0,771 

0,913 

425 

0,945 

0,743 

0,707 

187 

0,963 

0,858 

0,913 

428 

0,967 

0,834 

0,913 

193 

0,946 

0,820 

0,816 

433 

0,864 

0,754 

0,548 

194 

0,634 

0,470 

0,913 

440 

0,903 

0,778 

0,816 

197 

0,869 

0,731 

0,548 

441 

0,835 

0,666 

0,548 

211 

0,960 

0,839 

0,707 

453 

0,926 

0,815 

0,913 

222 

0,907 

0,761 

0,707 

454 

0,894 

0,661 

0,816 

225 

0,990 

0,931 

1,000 

467 

0,878 

0,798 

0,913 

229 

0,737 

0,582 

0,236 

471 

0,955 

0,840 

0,707 

235 

0,771 

0,639 

0,775 

472 

0,899 

0,748 

0,707 

236 

0,927 

0,843 

0,707 

475 

0,960 

0,875 

0,667 

240 

0,955 

0,735 

0,816 

476 

0,722 

0,538 

0,775 

260 

0,939 

0,738 

0,775 

492 

0,944 

0,791 

0,816 

261 

0,965 

0,847 

0,707 

502 

0,946 

0,832 

0,707 

266 

0,570 

0,287 

0,236 

507 

0,857 

0,746 

0,548 

271 

0,811 

0,654 

0,707 

514 

0,924 

0,795 

0,707 

277 

0,843 

0,718 

0,707 

516 

0,936 

0,850 

0,548 

287 

0,892 

0,744 

0,913 

518 

0,902 

0,803 

1,000 

300 

0,961 

0,885 

0,707 

520 

0,888 

0,812 

0,913 

302 

0,962 

0,871 

0,816 

522 

0,957 

0,903 

0,548 

303 

0,898 

0,821 

1,000 

528 

0,917 

0,797 

0,816 

309 

0,876 

0,821 

0,800 

535 

0,883 

0,748 

0,816 

318 

0,896 

0,713 

0,816 

538 

0,827 

0,665 

1,000 

323 

0,874 

0,762 

0,816 

557 

0,948 

0,854 

0,913 

336 

0,878 

0,780 

0,667 

559 

0,900 

0,767 

0,913 

348 

0,949 

0,747 

0,816 

578 

0,905 

0,726 

0,707 

350 

0,970 

0,861 

0,816 

580 

0,714 

0,614 

0,913 

354 

0,795 

0,516 

0,707 

586 

0,974 

0,862 

1,000 

356 

0,893 

0,780 

0,913 

589 

0,934 

0,679 

0,913 

357 

0,915 

0,730 

0,913 

592 

0,931 

0,832 

0,913 

Agregado 

0,957 

0,876 

0,816 
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Com  todos  os  respondentes  tendo  valores  de  qualidade 
do  ajuste  para  o  processo  de  estimação  acima  do  valor  de 
referência,  o  foco  se  desvia  para  o  processo  de  validação. 
Aqui  vemos  quatro  respondentes  (110,  229,  266  e  372) 
com  baixos  valores  de  qualidade  de  ajuste.  Assim,  para 
manter  a  caracterização  mais  apropriada  das  estruturas 
de  preferência  da  amostra,  esses  quatro  respondentes 
serão  candidatos  para  eliminação.  A  decisão  final  será 
tomada  depois  que  as  utilidades  parciais  forem  examina¬ 
das  quanto  a  padrões  de  consistência  teórica. 


Resumo 

O  processo  de  estimação  do  modelo  e  avaliação  de  ajuste 
do  mesmo  requer  julgamento  sensato  por  parte  do  pesqui¬ 
sador.  Alguns  respondentes  podem  ter  valores  de  qualidade 
do  ajuste  tão  baixos  que  eles  acabam  sendo  facilmente  ex¬ 
cluídos,  mas  na  maioria  dos  casos  o  pesquisador  deve  ava¬ 
liar  aqueles  respondentes  atípicos  e  avaliar  se  eles  represen¬ 
tam  estruturas  apropriadas  de  preferência.  Fazendo  isso, 
considerações  são  feitas  não  apenas  sobre  as  estimativas 
individuais  de  utilidade  parcial,  mas  sobre  suas  caracteri¬ 
zações  coletivas  da  estrutura  de  preferência.  Essa  avaliação 
deve  ser  complementada  examinando-se  a  correspondência 
dos  padrões  de  utilidades  parciais  estimadas  com  quaisquer 
padrões  teóricos  que  possam  estar  disponíveis.  Discutimos 
este  processo  com  mais  detalhes  na  próxima  seção. 

Estágio  5:  Interpretação  dos  resultados 

A  primeira  tarefa  é  examinar  as  utilidades  parciais  e  ava¬ 
liar  se  existem  inversões  (violação  de  relações  monotôni- 
cas)  que  provocariam  a  eliminação  de  algum  respondente. 
Para  auxiliar  nesta  tarefa,  as  utilidades  parciais  são  rees¬ 
calonadas  para  fornecerem  uma  medida  de  comparação. 
Com  quaisquer  inversões  identificadas,  o  foco  se  desvia 
para  a  interpretação  das  estimativas  das  utilidades  par¬ 
ciais  e  o  exame  do  escore  de  importância  de  cada  respon¬ 
dente  para  os  atributos. 


Reescalonamento 

Comparar  estimativas  de  utilidades  parciais  nos  atribu¬ 
tos  e  entre  respondentes  pode  às  vezes  ser  difícil  dada  a 
natureza  dos  coeficientes  estimados.  Eles  são  centrados 
em  torno  de  zero,  tornando  uma  comparação  direta  difí¬ 
cil  sem  qualquer  ponto  óbvio  de  referência.  Um  método 
para  simplificar  o  processo  de  interpretação  é  o  reescalo¬ 
namento  das  utilidades  parciais  para  um  padrão  em  co¬ 
mum,  o  que  tipicamente  envolve  um  processo  de  dois  pas¬ 
sos.  Primeiro,  dentro  de  cada  atributo,  a  utilidade  parcial 
mínima  é  marcada  como  zero  e  as  demais  são  expressas 
como  valores  acima  de  zero  (o  que  facilmente  se  consegue 
acrescentando-se  a  utilidade  parcial  mínima  a  todos  os  ní¬ 
veis  dentro  de  cada  atributo).  Em  seguida,  as  utilidades 
parciais  são  totalizadas  e  reescalonadas  proporcionalmen¬ 
te  para  igualar  a  100  vezes  o  número  de  atributos.  Este 
tipo  de  reescalonamento  não  afeta  a  magnitude  relativa 
de  qualquer  utilidade  parcial,  mas  fornece  uma  escala  em 
comum  ao  longo  de  todos  os  valores  de  utilidades  parciais 
para  comparação  nos  atributos  e  respondentes. 


A  Tabela  7-14  apresenta  o  processo  de  reescalonamento 
e  os  resultados  para  o  respondente  107  no  estudo  HB  AT. 
O  processo  descrito  é  usado  com  um  reescalonamento 
tal  que  a  soma  das  utilidades  parciais  nos  cinco  atributos 
é  500.  Como  mostrado  na  tabela,  o  passo  1  restabelece 
cada  utilidade  parcial  dentro  de  cada  atributo  como  a 
diferença  em  relação  ao  menor  nível  no  atributo.  De¬ 
pois,  as  utilidades  parciais  são  totalizadas  e  reescalona¬ 
das  para  igualar  a  500  (100  x  5).  Quando  reescalonada,  a 
menor  utilidade  parcial  em  cada  atributo  tem  um  valor 
de  zero.  Outras  utilidades  parciais  agora  podem  ser  com¬ 
paradas  dentro  ou  entre  respondentes,  sabendo-se  que 
elas  estão  todas  na  mesma  escala. 


Exame  das  estimativas  de  utilidades  parciais 

Agora  que  as  utilidades  parciais  estão  re -escalonadas,  o 
pesquisador  pode  examinar  as  estimativas  de  utilidades  par¬ 
ciais  para  cada  respondente  para  compreender  não  somente 


TABELA  7-14  Reescalonamento  de  estimativas  de  utilidades  parciais  para  o  respondente  107 


Forma  do  produto 

Número  de  aplicações 

Desinfetante 

Biodegradável 

Preço  por  aplicação 

Pré-misturado 

Concentrado  Pó 

50 

100  200 

Sim 

Não 

Não 

Sim 

$0,35 

$0,49 

$0,79 

Estimativas  originais  de  utiiidade  parciai 

-0,0556 

0,61 1 1  -0,5556 

0,4444 

0,6111  -1,0556 

-0,2083 

0,2083 

0,5417 

-0,5417 

1 ,4444 

0,9444 

-2,3889 

Passo  1.  Restabelecimento  de  utilidades  parciais  em  reiação  aos  níveis  mínimos  dentro  de  cada  atributo’ 

0,5000 

1,1667  0,00 

1,500 

1 ,6667  0,00 

0,00 

0,4166 

1 ,0834 

0,00 

3,8333 

3,3333 

0,00 

Passo  2.  Reescaionamento  de  estimativas  de  utiiidade  parciai" 

18,52 

43,21  0,00 

55,56 

61 ,73  0,00 

0,00 

15,43 

40,13 

0,00 

141,96 

123,46 

0,00 

“Utilidade  parcial  mínima  sobre  cada  atributo  somada  a  outras  utilidades  parciais  daquele  atributo  [p.ex.,  a  utilidade  parcial  mínima  de  forma  de  produto  é  0,5556, 
que,  quando  somada  a  um  valor  pré-misturado  (0,5556),  se  iguala  a  0,5000] 

“o  total  de  utilidades  parciais  restabelecidas  é  proporcionalmente  reescalonado  para  um  total  de  500  [p.ex.,  total  de  utilidades  parciais  restabelecidas  é  13,50; 
assim,  utilidade  parcial  pré-misturada  é  reescalonada  para  18,52  (0,500/13,50  x  500)] 
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as  diferenças  entre  níveis  dentro  de  um  fator  ou  ao  longo 
deles,  mas  também  entre  respondentes.  Os  perfis  criados 
para  cada  respondente  baseados  nas  utilidades  parciais 
permitem  ao  pesquisador  que  ele  rapidamente  categorize 
a  estrutura  de  preferência  de  um  respondente  ou  mesmo 
de  conjuntos  de  respondentes.  A  despeito  de  técnicas  mais 
sofisticadas  poderem  ser  usadas,  como  análise  de  agrupa¬ 
mentos  (ver  Capítulo  8  para  uma  discussão  mais  detalhada), 
mesmo  uma  inspeção  visual  identificará  padrões.  Se  uma  re¬ 
lação  monotônica  é  assumida  entre  os  níveis  de  um  atribu¬ 
to,  então  o  pesquisador  deve  também  identificar  quaisquer 
inversões  (ou  seja,  padrões  teoricamente  inconsistentes  de 
utilidades  parciais),  como  discutido  na  próxima  seção. 


A  Figura  7-5  mostra  a  diversidade  de  estimativas  de  utili¬ 
dades  parciais  nos  cinco  atributos  para  três  respondentes 
selecionados  (107,  123  e  135),  bem  como  os  resultados 
agregados  compilados  para  todos  os  respondentes.  Os 
resultados  agregados  podem  ser  imaginados  como  o  res¬ 
pondente  médio,  em  relação  ao  qual  o  pesquisador  pode 
ver  as  estruturas  de  preferência  de  cada  respondente  se¬ 
paradamente,  como  retratado  pelas  utilidades  parciais, 
para  conquistar  visões  únicas  sobre  cada  indivíduo. 

Por  exemplo,  para  o  atributo  Forma  do  Produto,  os 
resultados  agregados  indicam  que  Concentrado  (utilida¬ 
de  parcial  de  28,8)  é  a  forma  preferida,  seguida  de  perto 
por  Pó  (20,1)  e  então  por  Pré-misturado  (0,0).  Quando 
vemos  os  três  respondentes,  podemos  perceber  que  o 
de  número  123  tem  um  padrão  quase  idêntico,  apesar 
de  apresentar  utilidades  parciais  para  Concentrado  e  Pó 
ligeiramente  maiores.  Para  o  respondente  107,  Concen¬ 
trado  (43,2)  também  é  o  preferido,  mas  Pré-misturado 
(18,5)  é  o  segundo  preferido,  seguido  por  Pó  (0,0).  O 
respondente  135  tem  um  padrão  quase  invertido  em  re¬ 
lação  aos  resultados  agregados,  com  Pó  (51,7)  sendo  o 
mais  elevado  em  todo  o  conjunto  de  utilidades  parciais 
exibido  aqui,  e  Pré-misturado  (8,6)  e  Concentrado  (0,0) 
com  valores  muito  baixos. 

Em  retrospecto,  podemos  ver  como  os  resultados 
agregados  retratam  o  grupo  geral,  mas  também  devemos 
estar  cientes  das  diferenças  entre  respondentes.  Para 
apenas  estes  três  respondentes,  percebemos  que  dois 
preferem  Concentrado  no  lugar  das  demais  formas,  ape¬ 
sar  de  esta  também  ser  a  forma  de  menor  valor  para  ou¬ 
tro  respondente  que  valoriza  mais  o  Pó.  Podemos  dizer 
também  que  Pré-misturado  geralmente  recebe  um  valor 
pequeno,  apesar  de  não  ser  o  nível  de  menor  valor  para 
todos  os  respondentes,  como  poderia  ser  assumido  se  so¬ 
mente  os  resultados  agregados  fossem  vistos. 


Inversões 

Uma  forma  específica  de  exame  de  utilidades  parciais  en¬ 
volve  a  busca  por  inversões  -  aqueles  padrões  de  utilida¬ 
des  parciais  que  são  teoricamente  inconsistentes.  Como 
observado  anteriormente,  alguns  atributos  podem  ter  pa¬ 


drões  implicados  entre  as  utilidades  parciais,  relações  tipi¬ 
camente  relações  monotônicas  que  definem  pelo  menos  a 
ordem  dos  níveis  em  termos  de  preferência.  Por  exemplo, 
em  um  contexto  de  vendas,  distância  de  percurso  deve¬ 
ria  ser  monotônica,  de  modo  que  lojas  mais  afastadas  são 
menos  preferidas  do  que  as  mais  próximas.  Essas  relações 
são  definidas  pelo  pesquisador,  e  devem  então  ser  refleti¬ 
das  nas  utilidades  parciais  estimadas. 

Identificação.  A  primeira  tarefa  é  rever  todos  os  pa¬ 
drões  de  utilidade  parcial  e  identificar  qualquer  um  que 
possa  refletir  inversões.  A  abordagem  mais  direta  é  o  exa¬ 
me  das  diferenças  entre  níveis  adjacentes  que  devam  ser 
monotonicamente  relacionados.  Por  exemplo,  se  o  nível 
A  é  suposto  como  preferível  em  relação  ao  B,  então  a  di¬ 
ferença  entre  as  utilidades  parciais  dos  níveis  A  e  B  (ou 
seja,  utilidade  parcial  do  nível  A  menos  a  utilidade  parcial 
do  nível  B)  deve  ser  positiva. 


Em  nosso  exemplo,  Preço  por  Aplicação  foi  considerado 
monotônico,  de  modo  que  aumento  do  preço  por  aplica¬ 
ção  deve  diminuir  a  preferência  (e  portanto  as  utilidades 
parciais  estimadas).  Se  novamente  olharmos  a  Figura  7-5, 
podemos  perceber  que  os  padrões  de  utilidades  parciais 
para  respondentes  agregados  e  individuais  seguem  todos 
o  padrão  esperado.  Apesar  de  alguma  variabilidade  ser 
encontrada  em  cada  nível,  vemos  que  o  padrão  monotôni¬ 
co  (35  centavos  é  preferido  em  relação  a  49  centavos,  com 
79  centavos  menos  preferido)  é  mantido. 

Quando  inspecionamos  o  conjunto  inteiro  de  respon¬ 
dentes,  porém,  encontramos  padrões  que  parecem  indicar 
uma  inversão  da  relação  monotônica.  A  Figura  7-6  ilustra 
tais  padrões,  bem  como  um  exemplo  do  comportamen¬ 
to  de  utilidades  parciais  que  segue  a  relação  monotônica. 
Primeiro,  o  respondente  229  tem  o  padrão  esperado,  com 
39*  centavos  como  o  preferido,  seguido  de  49  centavos  e, 
por  último,  79  centavos.  Q  respondente  382  mostra  um 
comportamento  inesperado  entre  os  dois  primeiros  ní¬ 
veis  (39*  e  49  centavos),  onde  a  utilidade  parcial  na  reali¬ 
dade  aumenta  para  49  centavos  quando  comparada  com 
35  centavos.  Um  segundo  exemplo  é  a  inversão  entre  os 
níveis  de  49  e  79  centavos  para  o  respondente  110.  Aqui 
encontramos  uma  diminuição  entre  35  e  49  centavos,  mas 
em  seguida  um  aumento  entre  49  e  79  centavos. 

A  medida  que  olhamos  a  amostra  inteira,  diversas 
possíveis  inversões  podem  ser  identificadas.  A  Tabela 
7-15  contém  todos  os  pares  de  utilidades  parciais  que  exi¬ 
bem  padrões  contrários  à  relação  monotônica  (ou  seja, 
a  diferença  de  utilidades  parciais  é  positiva  ao  invés  de 
negativa  ou  nula).  Sete  respondentes  tinham  potenciais 
inversões  quando  se  consideraram  os  dois  primeiros  ní¬ 
veis  (35  e  49  centavos),  ao  passo  que  cinco  respondentes 
tinham  potenciais  inversões  para  os  dois  últimos  níveis 
(49  e  79  centavos). 


*  N.  de  R.  T.:  O  número  correto  é  35. 
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Uma  questão  importante  ainda  deve  ser  respondida: 
quão  grande  uma  diferença  deve  ser  para  denotar  uma 
inversão?  Qualquer  diferença  maior  que  zero  constitui 
teoricamente  a  relação  monotônica.  Abordagens  subjeti¬ 
vas  e  empíricas  para  a  identificação  de  inversões  têm  sido 
discutidas.  Um  pesquisador  jamais  deve  confiar  totalmen¬ 
te  em  abordagens  somente  subjetivas  ou  empíricas,  pois 
qualquer  uma  delas  deve  atuar  apenas  como  uma  orien¬ 
tação  para  o  julgamento  do  pesquisador  na  avaliação  da 
adequação  das  utilidades  parciais  na  representação  da  es¬ 
trutura  de  preferência  do  respondente. 


Revendo  as  potenciais  inversões  na  Tabela  7-15,  pode¬ 
mos  ver  que  em  cada  caso  um  ou  mais  respondentes  têm 
diferenças  de  utilidades  parciais  que  são  consideravel¬ 
mente  mais  altas  do  que  as  demais.  Por  exemplo,  nas 
diferenças  entre  os  níveis  1  e  2,  o  respondente  382  tem 
uma  indiferença  de  112,68,  enquanto  a  segunda  maior 
diferença  é  de  15,87.  Analogamente,  para  as  diferenças 
entre  os  níveis  2  e  3,  os  respondentes  110  e  129  têm  va¬ 
lores  muito  maiores  (83,33  e  55,56,  respectivamente)  do 
que  os  demais.  Se  usássemos  uma  abordagem  mais  qua¬ 
litativa  para  examinarmos  a  distribuição  das  diferenças, 
esses  três  respondentes  pareceriam  provavelmente  cate¬ 
gorizados  como  apresentando  inversões  que  justificam 
suas  remoções. 

Uma  técnica  mais  quantitativa  é  o  exame  estatísti¬ 
co  das  diferenças.  Apesar  de  não  existir  um  teste  esta¬ 
tístico  disponível,  um  método  é  calcular  o  erro  padrão 
das  diferenças  entre  os  níveis  1  e  2  e  2  e  3  (7,49  e  5,33, 
respectivamente)  e  usá-los  para  especificar  um  inter¬ 
valo  de  confiança.  Usando  um  nível  de  confiança  de 
99%,  os  intervalos  de  confiança  seriam  de  19,32  (7,49 
X  2,58)  para  as  diferenças  entre  os  níveis  1  e  2,  e  de 
13,75  entre  os  níveis  2  e  3.  Aplicando  tais  resultados 


em  torno  de  uma  diferença  de  zero,  percebemos  que 
os  valores  atípicos  identificados  em  nossa  inspeção  vi¬ 
sual  também  ficam  fora  dos  intervalos  de  confiança. 

A  combinação  desses  dois  métodos  conduz  à  iden¬ 
tificação  de  três  respondentes  (382,  110  e  129)  com  in¬ 
versões  em  suas  estimativas  de  utilidades  parciais.  O 
pesquisador  agora  encara  o  trabalho  de  identificar  a 
abordagem  para  lidar  com  essas  inversões. 


Ações  corretivas  para  inversões  e  níveis  rnins  de  qnali- 
dade  do  ajnste.  Como  anteriormente  discutido,  as  três 
ações  corretivas  básicas  para  inversão  são  não  fazer  coisa 
alguma  se  as  inversões  são  pequenas  o  bastante  ou  se  re¬ 
sultados  desagregados  são  o  único  foco  da  análise,  aplicar 
restrições  no  processo  de  estimação,  ou  eliminar  os  res¬ 
pondentes.  A  questão  sobre  inversões  é  distinta,  e  a  esco¬ 
lha  final  para  a  ação  corretiva  deve  ser  combinada  a  ações 
corretivas  para  respondentes  com  baixos  níveis  de  ajuste 
de  estimação  ou  validação. 


Dada  a  ênfase  sobre  a  estrutura  de  preferência  de  respon¬ 
dentes,  a  HBAT  sentiu  que  a  única  ação  corretiva  apro¬ 
priada  seria  a  eliminação  de  respondentes  com  inversões 
substanciais.  Além  disso,  respondentes  também  deveriam 
ser  eliminados  se  níveis  significativamente  baixos  de  ajus¬ 
te  de  estimação  ou  de  validação  fossem  detectados.  Três 
respondentes  tinham  inversões  (110, 129  e  382),  enquan¬ 
to  quatro  respondentes  tinham  baixos  níveis  de  ajuste 
do  modelo  (110,  229,  266  e  372).  Apenas  um  respondente 
falhou  em  ambos  os  critérios,  mas  os  seis  foram  elimina¬ 
dos,  resultando  em  uma  amostra  de  80  respondentes.  A 
eliminação  foi  feita  para  garantir  o  conjunto  mais  repre¬ 
sentativo  de  respondentes  para  descrever  as  estruturas  de 

{Continua) 


*  N.  de  R.  T.:  O  número  correto  é  35. 
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TABELA  7-15  Identificação  de  inversões  da  relação  monotônica  no  atributo  de  preço  por  aplicação 


Possíveis  inversões  entre 
nívei  1  (35  centavos)  e  nívei  2  (49  centavos) 

Possíveis  inversões  entre 
nívei  2  (49  centavos)  e  nívei  3  (79  centavos) 

Respondente 

Diferença  de  utilidades  parciais’ 

Respondente 

Diferença  de  utilidades  parciais’ 

382 

112,68 

110 

83,33 

194 

15,87 

129 

55,56 

580 

12,82 

194 

15,87 

260 

12,66 

538 

12,82 

370 

11,90 

440 

8,77 

336 

11,49 

514 

9,80 

“A  diferença  esperada  de  utilidades  parciais  é  negativa  (ou  seja,  uma  queda  em  utilidade  quando  você  passa  de  35  para  49  centavos 
ou  de  49  para  79  centavos).  Valores  positivos  indicam  uma  possível  violação  da  relação  monotônica. 


(Continuação) 

preferência,  enquanto  também  se  mantém  um  tamanho 
adequado  de  amostra.  A  amostra  reduzida  será  usada 
para  interpretação  adicional  ou  análise  posterior. 


Cálculo  da  importância  de  atributo 

Uma  abordagem  final  para  examinar  a  estrutura  de  pre¬ 
ferência  de  utilidades  parciais  é  calcular  importância  de 
atributos.  Esses  valores  refletem  o  impacto  relativo  que 
cada  atributo  tem  no  cálculo  de  preferência  geral  (ou  seja, 
escores  de  utilidade).  Como  anteriormente  descrito,  esses 
valores  são  calculados  para  cada  respondente  e  fornecem 
mais  uma  base  concisa  de  comparação  entre  as  estruturas 
de  preferência  de  respondentes. 


A  Tabela  7-16  compara  os  valores  de  importância  obti¬ 
dos  de  cada  atributo  para  os  resultados  agregados  e  desa¬ 
gregados  de  três  respondentes.  Apesar  de  percebermos 
uma  consistência  geral  nos  resultados,  cada  respondente 
tem  aspectos  únicos  uns  em  relação  aos  outros  e  em  re¬ 
lação  aos  resultados  agregados.  As  maiores  diferenças 
são  vistas  para  o  atributo  de  Preço  por  Aplicação,  apesar 
de  uma  variação  substancial  ser  também  percebida  nos 
atributos  de  Biodegradabilidade  e  Número  de  Aplica¬ 
ções.  Apenas  esses  resultados  limitados  mostram  a  vasta 
gama  de  perfis  de  utilidade  parcial  entre  os  responden¬ 
tes  e  destacam  a  necessidade  de  uma  completa  descrição 
das  estruturas  de  preferência  nos  níveis  desagregado  e 
agregado. 


Uma  extensão  da  análise  conjunta  é  definir  grupos  de 
respondentes  com  estimativas  similares  de  utilidade  parcial 
ou  de  valores  de  importância  dos  fatores  usando  análise 
de  agrupamentos.  Esses  segmentos  podem  então  ter  seus 
perfis  caracterizados  e  avaliados  quanto  a  suas  estruturas 
únicas  de  preferência  e  ao  seu  potencial  de  mercado. 

Estágio  6:  Validação  dos  resultados 

O  passo  final  é  avaliar  a  validade  interna  e  externa  da  ta¬ 
refa  conjunta.  Como  anteriormente  observado,  validade 


interna  envolve  confirmação  da  regra  de  composição  sele¬ 
cionada  (ou  seja,  aditiva  ou  interativa).  Uma  abordagem 
é  comparar  modelos  alternativos  (aditivos  versus  intera¬ 
tivos)  em  um  estudo  de  pré-teste.  A  segunda  abordagem 
é  se  certificar  de  que  os  níveis  de  ajuste  do  modelo  são 
aceitáveis  para  cada  respondente.  Validação  externa  en¬ 
volve  em  geral  a  habilidade  da  análise  conjunta  de  pre¬ 
ver  escolhas  reais  e,  em  termos  específicos,  a  questão  da 
representatividade  da  amostra.  O  processo  de  validação 
com  os  estímulos  de  validação  é  o  método  mais  comum 
para  avaliar  validade  externa,  enquanto  a  garantia  de  re¬ 
presentatividade  da  amostra  exige  análise  fora  do  proces¬ 
so  de  modelagem  conjunta. 


Os  níveis  elevados  de  precisão  preditiva  para  os  estímulos 
de  estimação  e  de  validação  entre  os  respondentes  confir¬ 
mam  a  regra  de  composição  aditiva  para  esse  conjunto  de 
respondentes.  Em  termos  de  validade  externa,  o  processo 
de  validação  identificou  quatro  respondentes  com  baixos 
níveis  de  ajuste  do  modelo,  e  eles  foram  excluídos  da  aná¬ 
lise.  A  questão  da  representatividade  da  amostra  deve 
ser  abordada  com  base  no  planejamento  da  pesquisa  em 
vez  de  uma  avaliação  específica  dos  resultados  conjuntos. 
Nesta  situação,  a  HBAT  deve  provavelmente  proceder 
com  um  projeto  de  maior  escala  com  maior  cobertura  de 
suas  bases  de  clientela  para  garantir  representatividade. 
Outra  consideração  é  a  inclusão  de  não-clientes,  espe¬ 
cialmente  se  a  meta  é  compreender  o  mercado  como  um 
todo,  e  não  apenas  os  clientes  da  HBAT. 


Uma  aplicação  gerencial:  uso  de 
um  simulador  de  escolha 

Além  de  compreender  as  estruturas  de  preferência  agrega¬ 
da  e  individual  dos  respondentes,  as  estimativas  de  utilidade 
parcial  fornecem  um  método  útil  para  representar  a  estru¬ 
tura  de  preferência  de  respondentes  usando  outras  técnicas 
multivariadas  (p.ex.,  o  emprego  de  utilidades  parciais  ou 
escores  de  importância  de  atributos  em  regressão  múltipla 
ou  análise  de  agrupamentos)  ou  aplicações.  Uma  aplicação 
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TABELA  7-16  Valores  obtidos  de  importância  de  atributo  para  amostra  geral  e  três  respondentes  selecionados 

Importância  derivada  de  atributo^ 

Forma  do  produto  Número  de  aplicações  Desinfetante  Biodegradável  Preço  por  aplicação 

Amostra  geral" 

15,1  17,6  18,6  9,6  39,1 


Respondentes  selecionados 


107 

14,3 

20,4 

5,1 

13,3 

46,9 

123 

11,4 

7,6 

9,5 

12,4 

59,1 

135 

12,8 

12,8 

4,2 

4,2 

66,0 

“Escores  de  importância  de  atributos  somam  100  nos  cinco  atributos  para  cada  respondente. 

"Baseada  nos  80  respondentes  remanescentes  após  a  eliminação  de  6  respondentes  como  ação  corretiva  contra  inversões  e  baixo  ajuste  de  modeio. 


específica  é  o  simulador  de  escolhas,  que  utiliza  as  estimati¬ 
vas  de  utilidade  parcial  para  fazer  previsões  de  escolha  entre 
conjuntos  especificados  de  estímulos.  O  respondente  pode 
construir  um  conjunto  de  estímulos  para  representar  qual¬ 
quer  posição  competitiva  (ou  seja,  o  mercado  competitivo 
corrente  ou  a  entrada  de  um  novo  produto)  e  então  usar  o 
simulador  de  escolhas  para  simular  o  mercado  e  derivar  esti¬ 
mativas  de  participações  de  mercado  entre  os  estímulos. 

O  processo  de  executar  uma  simulação  de  escolhas 
envolve  três  etapas:  (1)  especificar  o  cenário,  (2)  simular 
escolhas  e  (3)  calcular  participações  de  preferências.  Cada 
um  desses  passos  é  discutido  em  termos  de  nosso  exemplo 
conjunto  do  detergente  industrial. 

Passo  1:  Especificação  dos  cenários 

A  HBAT  também  usou  os  resultados  conjuntos  para  si¬ 
mular  escolhas  entre  três  possíveis  produtos.  Os  produ¬ 
tos  eram  formulados  para  identificar  se  uma  nova  linha 
de  produtos  poderia  ser  viável.  Desse  modo,  duas  confi¬ 
gurações  de  produto  foram  também  desenvolvidas  para 
representar  os  produtos  existentes. 


Produtos  1  e  2  são  os  existentes,  enquanto  o  produto  3 

é  novo. 

•  Produto  1.  Um  detergente  pré-misturado  em  um  for¬ 
mato  de  uso  manual  (50  aplicações  por  frasco)  que  seja 
seguro  para  o  ambiente  (biodegradável)  e  ainda  atenda 
a  todos  os  padrões  sanitários  (desinfetante)  a  apenas  79 
centavos  por  aplicação. 

•  Produto  2.  Uma  versão  industrial  do  produto  1  com 
as  características  ambientais  e  sanitárias,  mas  em  uma 
forma  concentrada  em  grandes  embalagens  (200  aplica¬ 
ções)  ao  preço  baixo  de  49  centavos  por  aplicação. 

•  Produto  3.  Um  valor  real  de  detergente  em  pó  em  ta¬ 
manhos  econômicos  (200  aplicações  por  frasco)  pelo 
menor  preço  possível  de  35  centavos  por  aplicação. 


Passo  2:  Simulação  de  escolhas 

Uma  vez  que  as  configurações  de  produto  foram  especi¬ 
ficadas,  elas  foram  submetidas  ao  simulador  de  escolha 


usando  os  resultados  dos  80  respondentes  que  restaram. 
Neste  processo,  as  utilidades  parciais  para  cada  respon¬ 
dente  foram  utilizadas  para  calcular  a  utilidade  esperada 
de  cada  produto. 


Por  exemplo,  para  o  respondente  107  (ver  Tabela 
7-11),  a  utilidade  do  produto  1  é  calculada  tomando-se 
as  estimativas  da  utilidade  parcial  daquele  responden¬ 
te  para  os  níveis  de  pré-misturado  (-0,0556),  50  apli¬ 
cações  por  frasco  (0,4444),  biodegradável  (-0,5417), 
desinfetante  (-0,2083)  e  79  centavos  por  aplicação 
(-2,3889),  mais  a  constante  (4,111)  para  um  valor  total 
de  utilidade  de  1,361.  Valores  de  utilidade  para  os  ou¬ 
tros  dois  produtos  foram  calculados  de  uma  maneira 
parecida.  Deve  ser  observado  que  utilidades  reescalo¬ 
nadas  também  podem  ser  usadas  tão  facilmente  quan¬ 
to,  pois  a  previsão  de  preferências  de  escolha  no  passo 
seguinte  se  concentra  no  tamanho  relativo  dos  valores 
de  utilidade. 


Assim,  o  processo  deriva  um  conjunto  de  valores  de 
utilidade  para  cada  produto  único  para  cada  indivíduo. 
Desse  modo,  a  preferência  de  cada  respondente  é  usa¬ 
da  para  simular  as  escolhas  esperadas  daquele  indivíduo 
quando  se  defronta  com  tal  escolha  de  produtos.  Os  três 
produtos  utilizados  no  simulador  de  escolhas  são  mais 
representativos  do  efeito  de  impacto  diferencial  entre 
produtos  quando  a  similaridade  entre  os  mesmos  é  mi¬ 
nimizada. 

Passo  3;  Cálculo  da  participação  de  preferência 

O  simulador  de  escolha  então  calculou  as  estimativas  de 
preferência  para  os  produtos  para  cada  respondente.  Pre¬ 
visões  para  as  participações  de  mercado  esperadas  foram 
feitas  com  dois  modelos  de  escolha:  o  modelo  de  utilidade 
máxima  e  um  modelo  probabilístico.  O  modelo  de  utilida¬ 
de  máxima  conta  o  número  de  vezes  que  cada  um  dos  três 
produtos  teve  a  mais  alta  utilidade  no  conjunto  de  respon¬ 
dentes. 
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Como  visto  na  Tabela  7-17,  o  produto  1  foi  preferido 
(teve  o  maior  valor  de  preferência  previsto)  por  apenas 
6,88%  dos  respondentes.  O  produto  2  foi  o  próximo,  pre¬ 
ferido  por  21,5%*,  e  o  de  maior  preferência  foi  o  produto 
3,  com  71,88%.  Os  percentuais  fracionários  são  decor¬ 
rentes  de  previsões  empatadas  entre  os  produtos  2  e  3. 


Uma  segunda  abordagem  para  prever  participações 
de  mercado  é  um  modelo  de  probabilidade,  como  o  BTL 
ou  o  modelo  logit.  Ambos  avaliam  a  preferência  relativa 
de  cada  produto  e  estimam  a  proporção  de  vezes  que  um 
respondente  ou  o  conjunto  de  respondentes  irá  comprar 
um  produto. 


Como  exemplo  dos  cálculos,  os  resultados  agregados 
podem  ser  usados.  Os  valores  agregados  de  preferên¬ 
cia  previstos  para  os  produtos  são  2,5,  4,9  e  5,9  para  os 
produtos  1,  2  e  3,  respectivamente.  As  participações  de 
mercado  previstas  dos  resultados  do  modelo  agregado 
usando  BTL  são  então  calculadas  por 

Participação  de  mercadOp^„j^j„  ^  =  2,5/(2,5  -i-  4,9  -t  5,9)  = 
0,188,  ou  18,8% 

Participação  de  mercadOp^^j^^ 2  =  4,9/(2,5  -i-  4,9  -t  5,9)  = 
0,368,  ou  36,8% 

Participação  de  mercadOpj„jm„3=  5,9/(2,5  -i-  4,9  -t  5,9)  = 
0,444,  ou  44,4% 

Esses  resultados  são  muito  próximos  àqueles  obtidos 
a  partir  do  uso  das  utilidades  individuais  de  responden¬ 
tes,  como  mostrado  na  Tabela  7-17. 

Resultados  análogos  são  obtidos  usando-se  o  mode¬ 
lo  probabilístico  logit  e  também  são  exibidos  na  Tabela 
7-17.  Usando  o  modelo  recomendado  em  situações  que 
envolvem  escolhas  repetitivas  (modelos  de  probabi¬ 
lidade),  como  no  caso  de  um  detergente  industrial,  a 
HBAT  tem  estimativas  de  participações  de  mercado 
que  indicam  uma  ordenação  do  produto  3,  produto  2  e, 
finalmente,  produto  1. 


Deve  ser  lembrado  que  tais  resultados  representam  a 
amostra  inteira,  e  as  participações  de  mercado  podem  di¬ 
ferir  dentro  de  segmentos  específicos  dos  respondentes. 

*  N.  de  R.  T.:  O  número  correto  é  21,25%. 


Resumo 

A  análise  conjunta  enfatiza  mais  a  habilidade  do  pesqui¬ 
sador  ou  do  administrador  em  teorizar  sobre  o  comporta¬ 
mento  de  escolha  do  que  o  faz  em  técnica  analítica.  Como 
tal,  ela  deve  ser  vista  principalmente  como  exploratória, 
pois  muitos  de  seus  resultados  são  diretamente  atribuíveis 
a  suposições  básicas  feitas  durante  o  curso  do  delinea¬ 
mento  e  da  execução  do  estudo.  Este  capítulo  ajuda  você 
a  fazer  o  seguinte: 

Explicar  os  usos  administrativos  da  análise  conjunta.  A 

análise  conjunta  é  uma  técnica  multivariada  desenvolvida 
especificamente  para  entender  como  respondentes  desen¬ 
volvem  preferências  por  objetos  (produtos,  serviços  ou 
idéias).  A  flexibilidade  da  análise  conjunta  significa  que 
ela  pode  ser  usada  em  praticamente  qualquer  área  na  qual 
decisões  são  estudadas.  A  análise  conjunta  assume  que 
qualquer  conjunto  de  objetos  (p.ex.,  marcas,  companhias) 
ou  conceitos  (posicionamento,  benefícios,  imagens)  é  ava¬ 
liado  como  uma  coleção  de  atributos.  Tendo  determinado 
a  contribuição  de  cada  fator  para  a  avaliação  geral  do  con¬ 
sumidor,  o  pesquisador  pode  então  (1)  definir  o  objeto  ou 
conceito  com  a  combinação  ótima  de  características,  (2) 
mostrar  as  contribuições  relativas  de  cada  atributo  e  cada 
nível  à  avaliação  geral  do  objeto,  (3)  usar  estimativas  de 
comprador  ou  julgamentos  de  consumidor  para  prever 
preferências  entre  objetos  com  diferentes  conjuntos  de 
características,  (4)  isolar  grupos  de  clientes  potenciais  que 
colocam  importância  distinta  sobre  as  características  para 
definir  segmentos  de  alto  e  baixo  potencial,  e  (5)  identificar 
oportunidades  de  marketing  pela  exploração  do  potencial 
de  mercado  para  combinações  de  características  que  não 
estão  correntemente  disponíveis.  O  conhecimento  da  estru¬ 
tura  de  preferência  para  cada  indivíduo  permite  uma  flexi¬ 
bilidade  quase  ilimitada  para  examinar  reações  individuais 
e  agregadas  para  uma  vasta  gama  de  questões  relacionadas 
a  produtos  ou  serviços. 

Conhecer  as  diretrizes  para  seleção  de  variáveis  a  serem 
examinadas  pela  análise  conjnnta.  A  análise  conjunta 
emprega  uma  variável  estatística  muito  parecida  em  for¬ 
ma  com  aquela  que  vimos  em  outras  técnicas  multivaria- 
das.  A  variável  estatística  conjunta  é  uma  combinação 
linear  de  efeitos  das  variáveis  independentes  (fatores) 
sobre  uma  variável  dependente.  O  pesquisador  especifi¬ 
ca  as  variáveis  independentes  (fatores)  e  seus  níveis,  mas 


TABELA  7-17  Resultados  de  simulador  de  escolhas  para  as  formulações  de  três  produtos 

PREVISÕES  DE  PARTICIPAÇÃO  DE  MERCADO 


Modelos  probabilfsticos 

Formulação  do  produto 

Modelo  de  utilidade  máxima  (%) 

BTL  (%) 

Logit  (%) 

1 

6,88 

18,00 

7,85 

2 

21,25 

36,58 

29,09 

3 

71,88 

45,42 

63,06 
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O  respondente  apenas  fornece  informação  sobre  a  medi¬ 
da  dependente.  O  planejamento  dos  estímulos  envolve 
a  especificação  da  variável  estatística  conjunta  pela  sele¬ 
ção  dos  fatores  e  níveis  a  serem  incluídos  nos  estímulos. 
Quando  operacionaliza  fatores  ou  níveis,  o  pesquisador 
deve  garantir  que  as  medidas  são  comunicáveis  e  acioná¬ 
veis.  Tendo  selecionado  os  fatores  e  garantido  que  as  me¬ 
didas  atendem  a  tais  condições,  o  pesquisador  ainda  deve 
abordar  três  questões  específicas  à  definição  de  fatores:  o 
número  de  fatores  a  serem  incluídos,  multicolinearidade 
entre  os  fatores,  e  o  papel  ímpar  do  preço  como  fator. 

Formular  o  plano  experimental  para  uma  análise  conjun¬ 
ta.  Para  a  análise  conjunta  explicar  a  estrutura  de  prefe¬ 
rência  de  um  respondente  somente  com  base  em  avalia¬ 
ções  gerais  de  um  conjunto  de  estímulos,  o  pesquisador 
deve  tomar  duas  decisões-chave  com  relação  ao  modelo 
conjunto  inerente:  a  especificação  da  regra  de  composição 
a  ser  usada,  e  a  seleção  do  tipo  de  relações  entre  estima¬ 
tivas  de  utilidades  parciais.  Tais  decisões  afetam  tanto  o 
planejamento  dos  estímulos  quanto  a  análise  das  avalia¬ 
ções  do  respondente.  A  regra  de  composição  descreve 
como  o  pesquisador  postula  que  o  respondente  combina 
as  utilidades  parciais  dos  fatores  para  obter  utilidade  ge¬ 
ral.  É  uma  decisão  crítica,  pois  ela  define  a  natureza  bási¬ 
ca  da  estrutura  de  preferência  que  será  estimada.  A  regra 
de  composição  mais  comum  é  um  modelo  aditivo.  A  regra 
de  composição  usando  efeitos  de  interação  é  semelhante 
à  forma  aditiva  no  sentido  de  assumir  que  o  cliente  soma 
as  utilidades  parciais  para  obter  um  total  geral  ao  longo 
do  conjunto  de  atributos.  Ela  se  diferencia  no  sentido  de 
que  permite  que  certas  combinações  de  níveis  sejam  mais 
ou  menos  do  que  apenas  suas  somas.  A  escolha  de  uma 
regra  de  composição  determina  os  tipos  e  quantia  de  tra¬ 
tamentos  ou  estímulos  que  o  respondente  deve  avaliar, 
junto  com  a  forma  do  método  de  estimação  usado.  Pon¬ 
derações  acompanham  o  uso  de  uma  abordagem  em  vez 
de  outra.  Uma  forma  aditiva  requer  menos  avaliações  do 
respondente  e  torna  mais  fácil  a  obtenção  de  estimativas 
para  as  utilidades  parciais.  No  entanto,  a  forma  interativa 
é  uma  representação  mais  precisa,  pois  respondentes  utili¬ 
zam  regras  de  decisão  mais  complexas  na  avaliação  de  um 
produto  ou  serviço. 

Entender  como  criar  planejamentos  fatoriais.  Tendo 
especificado  os  fatores  e  níveis,  mais  a  forma  básica  do 
modelo,  o  pesquisador  deve  a  seguir  tomar  três  decisões 
envolvendo  coleta  de  dados:  o  tipo  de  método  de  apresen¬ 
tação  para  os  estímulos  (troca,  perfil  completo  ou  compa¬ 
ração  aos  pares),  o  tipo  de  variável  de  resposta  e  o  método 
de  coleta  de  dados.  O  objetivo  prioritário  é  apresentar  as 
combinações  de  atributos  (estímulos)  aos  respondentes  da 
maneira  mais  realista  e  eficiente  possível.  Em  uma  análise 
conjunta  simples  com  um  pequeno  número  de  fatores  e 
níveis,  o  respondente  avalia  todos  os  possíveis  estímulos, 
naquilo  que  é  conhecido  como  planejamento  fatorial.  A 


medida  que  a  quantia  de  fatores  e  níveis  aumenta,  tal  deli¬ 
neamento  se  torna  impraticável.  Assim,  com  o  número  de 
tarefas  de  escolha  especificado,  o  que  é  necessário  é  um 
método  para  desenvolver  um  subconjunto  dos  estímulos 
totais  que  ainda  fornecem  a  informação  necessária  para  se 
fazerem  estimativas  precisas  e  realistas  de  utilidades  par¬ 
ciais.  O  processo  de  seleção  de  um  subconjunto  de  todos 
os  possíveis  estímulos  deve  ser  feito  de  uma  maneira  que 
se  preserve  a  ortogonalidade  (nenhuma  correlação  entre 
níveis  de  um  atributo)  e  equilíbrio  (cada  nível  aparece  em 
um  fator  o  mesmo  número  de  vezes)  do  planejamento. 
Um  planejamento  fatorial  fracionário  é  o  método  mais 
comum  para  definir  um  subconjunto  de  estímulos  para 
avaliação.  O  processo  desenvolve  uma  amostra  de  possí¬ 
veis  estímulos,  com  o  número  de  estímulos  dependendo 
do  tipo  de  regra  de  composição  assumida  como  sendo 
usada  pelos  respondentes.  Se  a  quantia  de  fatores  se  torna 
muito  grande  e  a  análise  conjunta  adapta tiva  não  é  aceitá¬ 
vel,  pode  ser  empregado  um  planejamento  de  ligação  no 
qual  os  fatores  são  divididos  em  subconjuntos  de  tamanho 
adequado,  com  alguns  atributos  se  sobrepondo  entre  os 
conjuntos,  de  forma  que  cada  conjunto  tem  um  fator  em 
comum  com  outros  conjuntos  de  fatores.  Os  estímulos  são 
então  construídos  para  cada  subconjunto  de  maneira  que 
os  respondentes  jamais  vêem  o  número  original  de  fatores 
em  um  único  perfil. 

Explicar  o  impacto  da  escolha  entre  ordenação  e  avaliação 
como  medida  de  preferência.  A  medida  de  preferência  - 
ordenação  versus  avaliação  (p.ex.,  uma  escala  de  1  a  10)  - 
também  deve  ser  escolhida.  Apesar  de  o  método  de  troca 
empregar  apenas  dados  de  ordenação,  tanto  o  método  de 
comparação  aos  pares  quanto  o  de  perfil  completo  podem 
avaliar  preferências  via  obtenção  de  uma  avaliação  de 
preferência  de  um  estímulo  sobre  o  outro  ou  apenas  uma 
medida  binária.  Uma  medida  de  preferência  de  ordena¬ 
ção  é  provavelmente  mais  confiável,  pois  é  mais  fácil  do 
que  avaliação  com  um  número  razoavelmente  pequeno 
(20  ou  menos)  de  estímulos,  e  fornece  maior  flexibilidade 
na  estimação  de  diferentes  tipos  de  regras  de  composição. 
Em  contraste,  escalas  de  avaliação  são  facilmente  analisa¬ 
das  e  administradas,  até  mesmo  pelo  correio.  No  entanto, 
os  respondentes  podem  ser  menos  discriminatórios  em 
seus  julgamentos  do  que  em  processos  de  ordenação.  A 
decisão  sobre  o  tipo  de  medida  de  preferência  a  ser  usa¬ 
da  deve  ser  baseada  em  aspectos  práticos  e  conceituais. 
Muitos  pesquisadores  preferem  a  medida  de  ordenação 
porque  ela  representa  o  processo  de  escolha  inerente  à 
análise  conjunta  -  escolher  entre  objetos.  Sob  um  pon¬ 
to  de  vista  prático,  porém,  o  esforço  de  ordenar  grandes 
quantias  de  estímulos  se  torna  exagerado,  particularmente 
quando  a  coleta  de  dados  é  feita  em  um  ambiente  que  não 
entrevista  pessoal.  A  medida  de  avaliação  tem  a  vantagem 
intrínseca  de  ser  fácil  de  administrar  em  qualquer  tipo  de 
contexto  de  coleta  de  dados,  apesar  de  ainda  ter  desvan¬ 
tagens.  Se  os  respondentes  não  estão  engajados  e  envolvi- 
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dos  na  tarefa  de  escolha,  uma  medida  de  avaliação  pode 
fornecer  pouca  diferenciação  entre  perfis  (p.ex.,  todos  os 
perfis  avaliados  como  aproximadamente  o  mesmo).  Além 
disso,  à  medida  que  a  tarefa  de  escolha  se  torna  mais  com¬ 
plicada  com  estímulos  adicionais,  o  pesquisador  deve  se 
preocupar  não  apenas  com  o  cansaço,  mas  também  com  a 
confiabilidade  das  avaliações  ao  longo  dos  estímulos. 

Avaliar  a  importância  relativa  das  variáveis  preditoras 
e  de  cada  um  de  seus  níveis  nos  julgamentos  do  cliente. 

O  método  mais  comum  de  interpretação  é  um  exame  das 
estimativas  das  utilidades  parciais  para  cada  fator  a  fim 
de  determinar  a  magnitude  e  o  padrão  das  mesmas.  Es¬ 
timativas  de  utilidade  parcial  são  tipicamente  escalona¬ 
das  de  forma  que  quanto  maior  a  utilidade  parcial  (seja 
positiva  ou  negativa),  maior  o  impacto  da  mesma  sobre 
a  utilidade  geral.  Além  de  retratar  o  impacto  de  cada  ní¬ 
vel  com  as  estimativas  de  utilidade  parcial,  a  análise  con¬ 
junta  pode  avaliar  a  importância  relativa  de  cada  fator. 
Como  estimativas  de  utilidade  parcial  são  tipicamente 
convertidas  a  uma  escala  comum,  a  maior  contribuição  à 
utilidade  geral  -  e,  portanto,  o  fator  mais  importante  -  é 
o  fator  com  o  maior  intervalo  (da  menor  à  maior)  de  uti¬ 
lidades  parciais.  Os  valores  de  importância  de  cada  fator 
podem  ser  convertidos  a  percentuais  que  somam  100% 
dividindo-se  o  intervalo  de  cada  fator  pela  soma  de  todos 
os  valores  de  amplitudes.  Ao  avaliar  qualquer  conjunto 
de  estimativas  de  utilidades  parciais,  o  pesquisador  deve 
considerar  tanto  a  relevância  prática  quanto  as  relações 
teóricas  entre  níveis.  Em  termos  de  relevância  prática,  a 
principal  consideração  é  o  grau  de  diferenciação  entre 
utilidades  parciais  dentro  de  cada  atributo.  Muitas  vezes, 
um  atributo  tem  uma  estrutura  teórica  para  as  relações 
entre  níveis.  A  mais  comum  é  a  relação  monotônica,  tal 
que  as  utilidades  parciais  do  nível  C  devem  ser  maiores 
do  que  aquelas  do  nível  B,  que,  por  sua  vez,  devem  ser 
maiores  do  que  as  utilidades  parciais  do  nível  A.  Surge 
um  problema  quando  as  utilidades  parciais  não  seguem 
o  padrão  teorizado  e  violam  a  relação  monotônica  assu¬ 
mida,  provocando  aquilo  que  costuma  ser  chamado  de 
inversão.  Inversões  podem  causar  sérias  distorções  na 
representação  de  uma  estrutura  de  preferência. 

Aplicar  um  simulador  de  escolhas  para  resultados  cou- 
juutos  para  a  previsão  de  julgameutos  do  clieute  de  uo- 
vas  combiuações  de  atributos.  Descobertas  conjuntas 
revelam  a  importância  relativa  dos  atributos  e  o  impac¬ 
to  de  níveis  específicos  sobre  estruturas  de  preferência. 
Outro  objetivo  prioritário  da  análise  conjunta  é  conduzir 
análises  do  tipo  “e  se...”  para  prever  a  participação  de 
preferências  que  um  estímulo  (real  ou  hipotético)  pode 
captar  em  vários  cenários  competitivos  de  interesse  à  ad¬ 
ministração.  Simuladores  de  escolha  permitem  ao  pes¬ 
quisador  simular  qualquer  número  de  cenários  competi¬ 
tivos  e  então  estimar  como  os  respondentes  reagiriam  a 
cada  cenário.  O  seu  real  benefício,  no  entanto,  envolve 


a  habilidade  do  pesquisador  em  especificar  condições 
ou  relações  entre  os  estímulos  para  representar  mais 
realisticamente  condições  de  mercado.  Por  exemplo,  to¬ 
dos  os  objetos  competirão  igualmente  com  os  demais? 
A  similaridade  entre  os  objetos  cria  diferentes  padrões 
de  preferência?  Podem  ser  incluídas  na  simulação  as  ca¬ 
racterísticas  não  medidas  do  mercado?  Quando  se  usa 
um  simulador  de  escolhas,  pelo  menos  três  tipos  básicos 
de  efeitos  devem  ser  incluídos:  (1)  impacto  diferencial 
-  o  impacto  de  qualquer  atributo/nível  é  mais  importan¬ 
te  quando  o  respondente  valora  aquele  objeto  entre  os 
dois  mais  relevantes,  indicando  seu  papel  na  escolha  real 
entre  esses  objetos;  (2)  substituição  diferencial  -  a  simi¬ 
laridade  entre  objetos  afeta  a  escolha,  com  objetos  pare¬ 
cidos  compartilhando  preferência  geral  (p.ex.,  quando  se 
escolhe  entre  pegar  um  ônibus  ou  dirigir  um  carro,  acres¬ 
centar  ônibus  de  cores  diferentes  não  aumentará  a  chan¬ 
ce  de  se  pegar  um  ônibus,  mas  os  dois  objetos  dividiram 
a  chance  geral  de  pegar  um  ônibus);  e  (3)  melhoramento 
diferencial  -  dois  objetos  muito  parecidos  do  mesmo  tipo 
básico  podem  ser  distinguidos  por  pequenas  diferenças 
em  um  atributo  que  é  relativamente  irrelevante  quando 
se  comparam  dois  objetos  de  tipos  diferentes.  O  passo  fi¬ 
nal  na  simulação  conjunta  é  prever  preferência  para  cada 
indivíduo  e  então  calcular  a  participação  de  preferências 
para  cada  estímulo  agregando-se  as  escolhas  individuais. 

Comparar  um  modelo  de  efeitos  principais  e  um  mode¬ 
lo  com  termos  de  interação  e  mostrar  como  se  avalia  a 
validade  de  um  modelo  versus  o  outro.  Um  benefício 
chave  da  análise  conjunta  é  a  habilidade  de  representar 
muitos  tipos  de  relações  na  variável  estatística  conjun¬ 
ta.  Uma  consideração  crucial  é  o  tipo  de  efeitos  (efeitos 
principais  somados  com  quaisquer  termos  de  interação 
desejados)  que  devem  ser  incluídos,  pois  eles  demandam 
modificações  no  planejamento  de  pesquisa.  O  emprego 
de  termos  de  interação  adiciona  generalidade  à  regra  de 
composição.  A  adição  de  termos  de  interação  apresen¬ 
ta  certas  desvantagens:  (1)  cada  termo  de  interação  re¬ 
quer  uma  estimativa  adicional  de  utilidade  parcial  com 
pelo  menos  um  estímulo  extra  para  cada  respondente 
avaliar.  A  menos  que  o  pesquisador  saiba  exatamente 
quais  termos  de  interação  estimar,  o  número  de  estímu¬ 
los  cresce  dramaticamente.  Além  disso,  se  respondentes 
não  usam  um  modelo  interativo,  a  estimação  de  termos 
de  interação  adicionais  na  variável  estatística  conjunta 
reduz  a  eficiência  estatística  (mais  estimativas  de  utili¬ 
dades  parciais)  do  processo  de  estimação  e  ainda  torna 
a  tarefa  conjunta  mais  árdua.  (2)  Mesmo  quando  usadas 
por  respondentes,  interações  prevêem  substancialmente 
menos  variância  do  que  efeitos  aditivos,  geralmente  não 
excedendo  um  aumento  de  5  a  10%  na  variância  explica¬ 
da.  Assim,  em  muitos  casos,  o  poder  preditivo  aumenta¬ 
do  será  mínimo.  (3)  Termos  de  interação  são  freqüente- 
mente  substanciais  em  casos  para  os  quais  atributos  são 
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menos  tangíveis,  particularmente  quando  reações  esté¬ 
ticas  ou  emocionais  executam  um  papel  importante.  O 
potencial  para  explicação  ampliada  a  partir  de  termos  de 
interação  deve  ser  equilibrado  com  as  conseqüências  ne¬ 
gativas  do  acréscimo  dos  mesmos.  O  termo  de  interação 
é  mais  efetivo  quando  o  pesquisador  pode  teorizar  que 
porções  não-explicadas  de  utilidade  são  associadas  com 
apenas  certos  níveis  de  um  atributo. 

Reconhecer  as  limitações  da  análise  conjnnta  tradicional 
e  selecionar  a  metodologia  alternativa  adeqnada  (p.ex., 
análise  conjnnta  baseada  em  escolhas  on  adaptativa) 
qnando  necessário.  Os  métodos  de  perfil  completo  ou 
de  troca  não  são  gerenciáveis  com  mais  de  10  atributos, 
entretanto  muitos  estudos  conjuntos  precisam  incorpo¬ 
rar  20,  30  ou  mesmo  mais  atributos.  Nestes  casos,  alguma 
forma  adaptada  ou  reduzida  de  análise  conjunta  é  usa¬ 
da  para  simplificar  o  esforço  de  coleta  de  dados  e  ainda 
representar  uma  decisão  realista  de  escolha.  As  duas 
opções  incluem  (1)  uma  análise  conjunta  adaptativa/au- 
to-explicada  para  lidar  com  um  grande  número  de  atribu¬ 
tos,  e  (2)  uma  análise  conjunta  baseada  em  escolhas  para 
fornecer  tarefas  de  escolha  mais  realistas.  No  modelo 
auto-explicado,  o  respondente  fornece  uma  avaliação  do 
quão  desejável  é  cada  nível  de  um  atributo  e  então  valora 
a  importância  relativa  do  atributo  como  um  todo.  Com  o 
modelo  adaptativo  (híbrido),  os  modelos  conjuntos  auto- 
explicado  e  de  utilidade  parcial  são  combinados.  Os  valo¬ 
res  auto-explicados  são  utilizados  para  criar  um  pequeno 
subconjunto  de  estímulos  selecionados  a  partir  de  um 
planejamento  fatorial  fracionário.  Os  estímulos  são  então 
avaliados  de  uma  maneira  semelhante  à  análise  conjunta 
tradicional.  Os  conjuntos  de  estímulos  diferem  entre  res- 
pondentes,  e,  apesar  de  cada  respondente  avaliar  somen¬ 
te  um  pequeno  número,  coletivamente  todos  os  estímu¬ 
los  são  avaliados  por  uma  parte  dos  respondentes.  Para 
tornar  a  tarefa  conjunta  mais  realista,  uma  metodologia 
conjunta  alternativa,  conhecida  como  conjunta  baseada 
em  escolhas,  pode  ser  usada.  Pede-se  ao  respondente  que 
ele  escolha  um  estímulo  de  perfil  completo  a  partir  de  um 
conjunto  de  estímulos  alternativos  conhecido  como  con¬ 
junto  escolha.  Este  processo  é  muito  mais  representativo 
do  processo  real  de  seleção  de  um  produto  a  partir  de  um 
conjunto  de  produtos  competitivos.  Além  disso,  a  análise 
conjunta  baseada  em  escolhas  oferece  uma  opção  de  não 
escolher  qualquer  um  dos  estímulos  apresentados  pela 
inclusão  de  uma  opção  do  tipo  “Nenhuma  das  alterna¬ 
tivas”  no  conjunto  escolha.  Apesar  de  análise  conjunta 
tradicional  assumir  que  as  preferências  dos  respondentes 
sempre  serão  alocadas  no  conjunto  de  estímulos,  a  abor¬ 
dagem  baseada  em  escolhas  permite  a  contração  do  mer¬ 
cado  se  todas  as  alternativas  em  um  conjunto  escolha  são 
não-atraentes. 

Para  usar  análise  conjunta,  o  pesquisador  deve  avaliar 
muitas  facetas  do  processo  de  tomada  de  decisões.  Nosso 
foco  tem  sido  o  fornecimento  de  uma  melhor  compreen¬ 


são  dos  princípios  da  análise  conjunta  e  de  como  eles 
representam  o  processo  de  escolha  do  consumidor.  Esta 
compreensão  deve  permitir  que  pesquisadores  evitem  a 
má  aplicação  desta  técnica  relativamente  nova  e  poderosa 
sempre  que  estiver  diante  da  necessidade  de  entender  jul¬ 
gamentos  de  escolha  e  estruturas  de  preferência. 

Questões 

1.  Peça  a  três  colegas  de  classe  para  avaliarem  combinações  de 
escolhas  com  base  nessas  variáveis  e  níveis  relativos  ao  seu 
estilo  de  livro-texto  preferido  para  uma  aula  e  especifique  a 
regra  de  composição  que  você  imagina  que  eles  emprega¬ 
rão.  Colete  informações  com  os  métodos  de  troca  e  de  perfil 
completo. 


Fator 

Nível 

Profundidade 

Aborda  com  grande  profundidade 
cada  assunto. 

Introduz  cada  assunto  em  linhas  gerais. 

Ilustrações 

Cada  capítulo  inclui  imagens  engraça¬ 
das. 

Referências 

Tópicos  ilustrativos  são  apresentados. 
Cada  capítulo  inclui  gráficos  para  ilus¬ 
trar  as  questões  numéricas. 

Referências  gerais  são  incluídas  no 
final  do  texto. 

Cada  capítulo  inclui  referências  especí¬ 
ficas  para  os  tópicos  cobertos. 

2.  Quão  difícil  foi  para  os  respondentes  lidarem  com  os  con¬ 
ceitos  prolixos  e  levemente  abstratos  que  eles  foram  soli¬ 
citados  a  avaliar?  Como  você  melhoraria  as  descrições  dos 
fatores  ou  níveis?  Qual  método  de  apresentação  foi  mais 
fácil  para  os  respondentes? 

3.  Usando  o  procedimento  numérico  simples  discutido  ante¬ 
riormente  ou  um  programa  de  computador,  analise  os  da¬ 
dos  do  experimento  na  questão  1. 

4.  Planeje  um  experimento  de  análise  conjunta  com  pelo  me¬ 
nos  quatro  variáveis  e  dois  níveis  de  cada  variável  que  seja 
apropriado  a  uma  decisão  de  marketing.  Ao  fazer  isso,  de¬ 
fina  a  regra  de  composição  que  você  usará,  o  planejamento 
experimental  para  criar  estímulos  e  o  método  de  análise. 
Use  pelo  menos  cinco  respondentes  para  apoiar  sua  lógica. 

5.  Quais  são  os  limites  práticos  da  análise  conjunta  em  termos 
de  variáveis  ou  tipos  de  valores  para  cada  variável?  Quais  ti¬ 
pos  de  problemas  de  escolha  são  mais  adequados  ao  estudo 
com  a  análise  conjunta?  Quais  são  os  menos  servidos  pela 
análise  conjunta? 

6.  Como  você  orientaria  um  pesquisador  de  mercado  na  esco¬ 
lha  entre  os  três  tipos  de  metodologias  conjuntas?  Quais  são 
as  questões  mais  importantes  a  considerar,  tendo  em  vista 
as  vantagens  e  desvantagens  de  cada  metodologia? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustram  problemas  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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S  E  Ç  A  o 


Técnicas  de  Interdependência 


VISÃO  GERAL 

Os  métodos  de  dependênoia  descritos  na  Seção  II  fornecem 
ao  pesquisador  diversas  técnicas  para  avaliar  relações  entre 
uma  ou  mais  variáveis  dependentes  e  um  conjunto  de  variá¬ 
veis  independentes.  Foram  discutidos  muitos  métodos  que 
acomodam  todos  os  tipos  (métricas  e  não-métricas)  e  nú¬ 
meros  potencialmente  grandes  de  variáveis  dependentes  e 
independentes  que  poderiam  ser  aplicadas  a  conjuntos  de 
observações.  Mas  e  se  as  variáveis  ou  as  observações  estive¬ 
rem  relacionadas  de  modos  não  captados  pelas  relações  de 
dependência?  E  se  estiver  faltando  a  avaliação  de  interdepen¬ 
dência  (isto  é,  estrutura)?  Uma  das  habilidades  mais  básicas 
dos  seres  humanos  é  classificar  e  categorizar  objetos  e  infor¬ 
mação  em  esquemas  mais  simples,  de  forma  que  podemos 
caracterizar  os  objetos  dentro  de  grupos  em  vez  de  lidar  com 
cada  objeto  individualmente.  O  objetivo  dos  métodos  desta 
seção  é  identificar  a  estrutura  em  um  conjunto  definido  de  va¬ 
riáveis,  observações  ou  objetos.  A  identificação  de  estrutura 
oferece  não  apenas  simplicidade,  mas  também  um  meio  de 
descrição  e  até  mesmo  de  descoberta. 

As  técnicas  de  interdependência,  porém,  estão  concen¬ 
tradas  somente  na  definição  de  estrutura,  avaliando  a  inter¬ 
dependência  sem  quaisquer  relações  de  dependência  asso¬ 
ciadas.  Nenhuma  das  técnicas  de  interdependência  definirá 
a  estrutura  para  otimizar  ou  maximizar  uma  relação  de  depen¬ 
dência.  É  tarefa  do  pesquisador  primeiramente  utilizar  esses 
métodos  na  identificação  de  estrutura  e  então  empregá-la 
onde  for  apropriado.  Os  objetivos  de  relações  de  dependên¬ 
cia  não  são  “incorporados”  nesses  métodos  de  interdepen¬ 
dência  -  eles  avaliam  a  estrutura  para  seus  próprios  objetivos 
e  nenhum  outro. 


CAPÍTULOS  NA  SEÇÃO  III 

A  Seção  III  contém  apenas  dois  capítulos,  os  quais  cobrem 
duas  das  três  técnicas  de  interdependência.  A  primeira,  aná¬ 
lise  fatorial  (Capítulo  3),  foi  discutida  na  Seção  I  como  a  pre¬ 


paração  para  a  análise  multivariada,  pois  ela  nos  fornece  uma 
ferramenta  para  compreender  as  relações  entre  variáveis,  um 
conhecimento  fundamental  para  todas  as  nossas  análises 
multivariadas.  As  questões  de  multicolinearidade  e  parcimô¬ 
nia  de  modelo  são  reflexos  da  estrutura  subjacente  das  va¬ 
riáveis,  e  a  análise  fatorial  fornece  uma  maneira  objetiva  de 
avaliar  os  agrupamentos  de  variáveis  e  a  habilidade  de  incor¬ 
porar  variáveis  compostas  que  refletem  esses  agrupamentos 
de  variáveis  em  outras  técnicas  multivariadas. 

Mas  não  são  apenas  variáveis  que  têm  estrutura.  Apesar 
de  assumirmos  independência  entre  as  observações  e  variá¬ 
veis  em  nossa  estimação  de  relações,  também  sabemos  que 
a  maioria  das  populações  tem  subgrupos  que  compartilham 
características  gerais.  Comerciantes  procuram  mercados- 
alvo  de  grupos  diferenciados  de  consumidores  homogêneos, 
estrategistas  procuram  grupos  de  empresas  semelhantes 
para  identificar  elementos  estratégicos  comuns,  e  criado¬ 
res  de  modelos  financeiros  procuram  títulos  com  princípios 
semelhantes  para  criar  carteiras  de  ações.  Essas  e  muitas 
outras  situações  demandam  técnicas  que  identifiquem  esses 
grupos  de  objetos  semelhantes  com  base  em  um  conjunto  de 
características. 

Este  objetivo  é  atendido  pela  análise  de  agrupamentos, 
0  tópico  do  Capítulo  8.  Análise  de  agrupamentos,  em  termos 
ideais,  é  adequada  para  definir  grupos  de  objetos  com  má¬ 
xima  homogeneidade  dentro  dos  grupos,  enquanto  também 
têm  máxima  heterogeneidade  entre  os  grupos  -  determinando 
os  grupos  mais  semelhantes  que  também  são  os  mais  distin¬ 
tos  uns  dos  outros.  Como  mostramos,  a  análise  de  agrupa¬ 
mentos  tem  uma  rica  tradição  de  aplicação  em  quase  todas 
as  áreas  de  investigação.  Mas  sua  habilidade  de  definir  gru¬ 
pos  de  objetos  semelhantes  é  contrastada  por  sua  natureza 
bastante  subjetiva  e  pelo  papel  instrumental  desempenhado 
pelo  julgamento  do  pesquisador  em  diversas  decisões-chave. 
Este  aspecto  subjetivo  não  diminui  a  utilidade  da  técnica,  mas 
coloca  uma  responsabilidade  maior  sobre  o  pesquisador  para 
uma  completa  compreensão  do  método  e  do  impacto  de  cer¬ 
tas  decisões  sobre  a  solução  final  de  agrupamentos. 

Mas  e  se  apenas  soubermos  quão  semelhantes  são  os 
objetos  e  não  tivermos  idéia  da  origem  daquela  semelhança 
ou  de  como  agrupar  melhor  os  objetos?  Essa  situação  é  dis- 
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cutida  no  Capítulo  9,  “Escalonamento  Multidimensional  e  Aná¬ 
lise  de  Correspondência”.  Escalonamento  multidimensional  é 
uma  técnica  que  começa  com  uma  análise  univariada  -  uma 
única  medida  de  similaridade  entre  objetos  -  e  infere  a  di- 
mensionalidade  das  semelhanças  entre  os  objetos.  Ela  tenta 
responder  esta  questão  básica:  os  objetos  podem  ser  agru¬ 
pados  em  um  espaço  de  uma,  duas,  três  ou  n  dimensões,  de 
forma  a  representar  adequadamente  as  semelhanças  entre 
os  objetos  por  sua  proximidade?  Como  tal,  o  escalonamento 
multidimensional  é  uma  forma  de  análise  decomposicional, 
um  pouco  parecida  com  a  análise  conjunta  (ver  Capítulo  7), 
mas  nesse  caso  apenas  suas  similaridades  são  conhecidas, 
não  as  características  dos  objetos.  Uma  forma  especial  de 
escalonamento  multidimensional  é  a  análise  de  correspon¬ 


dência,  a  qual  analisa  uma  forma  distinta  de  dados  -  variáveis 
categóricas  com  tabulação  cruzada.  A  partir  desses  dados, 
a  análise  de  correspondência  é  capaz  de  retratar  as  relações 
entre  linhas  e  colunas  (p.ex.,  produtos  e  atributos)  em  uma 
perspectiva  dimensional  na  qual  a  proximidade  representa 
semelhança. 

Análise  de  agrupamentos,  análise  fatorial  e  escalona¬ 
mento  multidimensional  fornecem  ao  pesquisador  métodos 
que  trazem  ordem  aos  dados  na  forma  de  estrutura  entre  as 
observações  ou  variáveis.  Desse  modo,  o  pesquisador  pode 
compreender  melhor  as  estruturas  básicas  dos  dados,  o  que 
não  apenas  facilita  a  descrição  dos  dados,  mas  também  for¬ 
nece  uma  fundamentação  para  uma  análise  mais  refinada  das 
relações  de  dependência. 


CAPÍTULO 


Análise  de 


pamentos 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Definir  análise  de  agrupamentos,  seu  papel  e  suas  limitações. 

■  Identificar  as  questões  de  pesquisa  abordadas  pela  análise  de  agrupamentos. 

■  Compreender  como  a  similaridade  entre  objetos  é  medida. 

■  Distinguir  entre  as  várias  medidas  de  distância. 

■  Diferenciar  algoritmos  de  agrupamentos. 

■  Entender  as  diferenças  entre  técnicas  hierárquicas  e  não-hierárquicas  de  agrupamentos. 

■  Descrever  como  selecionar  o  número  de  agrupamentos  a  serem  formados. 

■  Seguir  as  orientações  para  validação  de  agrupamentos. 

■  Construir  perfis  para  os  agrupamentos  obtidos  e  avaliar  a  significãncia  administrativa. 


Apresentação  do  capítulo 

Acadêmicos  e  pesquisadores  de  mercado  freqüentemente  encontram  situações  melhor  resolvidas  pela 
definição  de  grupos  de  objetos  homogêneos,  sejam  eles  indivíduos,  empresas,  produtos  ou  mesmo 
comportamentos.  Opções  de  estratégias  baseadas  na  identificação  de  grupos  dentro  da  população, 
como  segmentação  e  mercado-alvo,  não  seriam  possíveis  sem  uma  metodologia  objetiva.  Essa  mes¬ 
ma  necessidade  é  encontrada  em  outras  áreas,  indo  das  ciências  físicas  (p.ex.,  criar  uma  taxonomia 
biológica  para  a  classificação  de  vários  grupos  de  animais  -  insetos  versus  mamíferos  versus  répteis) 
às  ciências  sociais  (p.ex.,  analisar  vários  perfis  psiquiátricos).  Em  todos  os  casos,  o  pesquisador  está 
procurando  uma  estrutura  “natural”  entre  as  observações  com  base  em  um  perfil  multivariado. 

A  técnica  mais  comumente  usada  para  essa  finalidade  é  a  análise  de  agrupamentos.  A  análise  de 
agrupamentos  reúne  indivíduos  ou  objetos  em  grupos  tais  que  os  objetos  no  mesmo  grupo  são  mais 
parecidos  uns  com  os  outros  do  que  com  os  objetos  de  outros  grupos.  A  idéia  é  maximizar  a  homoge¬ 
neidade  de  objetos  dentro  de  grupos,  ao  mesmo  tempo  em  que  se  maximiza  a  heterogeneidade  entre 
os  grupos.  Este  capítulo  explica  a  natureza  e  o  propósito  da  análise  de  agrupamentos  e  guia  o  pesqui¬ 
sador  na  seleção  e  uso  de  várias  abordagens  para  essa  técnica. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque,  além  das  referências  cruza¬ 
das  nos  termos-chave,  estão  em  itálico.  Exemplos  ilustrativos 
estão  em  quadros. 


Algoritmo  da  vizinhança  mais  distante  Ver  método  de  ligação 
completa. 

Algoritmo  de  agrupamento  Conjunto  de  regras  ou  procedi¬ 
mentos;  é  semelhante  a  uma  equação. 

Centróide  Média  ou  valor  médio  dos  objetos  contidos  no  agru¬ 
pamento  em  cada  variável,  seja  usado  na  variável  estatística 
de  agrupamento  ou  no  processo  de  validação. 
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Centróide  de  agrupamento  Valor  médio  dos  objetos  oontidos 
no  agrupamento  em  todas  as  variáveis  na  variável  estatística 
de  agrupamento. 

Critério  de  agrupamento  cúbico  (CCC)  Uma  medida  direta  de 
heterogeneidade  na  qual  os  maiores  valores  CCC  indicam  a 
soiução  de  agrupamento  í\na\. 

Dendrograma  Representação  gráfica  (gráfico  em  árvore)  dos 
resultados  de  um  procedimento  hierárquico  no  qual  cada 
objeto  é  colocado  em  um  eixo  e  o  outro  eixo  representa  os 
passos  no  procedimento  hierárquico.  Começando  com  cada 
objeto  representado  como  um  agrupamento  separado,  o  den¬ 
drograma  mostra  graficamente  como  os  agrupamentos  são 
combinados  em  cada  passo  do  procedimento  até  que  todos 
estejam  contidos  em  um  único  agrupamento. 

Diagrama  de  perfii  Representação  gráfica  dos  dados  que  aju¬ 
da  a  projetar  observações  atípicas  ou  a  interpretar  a  solução 
final  de  agrupamento.  Normalmente,  as  variáveis  da  variável 
estatística  de  agrupamento  ou  aquelas  usadas  para  a  valida¬ 
ção  são  listadas  ao  longo  do  eixo  horizontal  e  a  escala  é  o 
eixo  vertical.  Linhas  separadas  representam  os  escores  (origi¬ 
nais  ou  padronizados)  para  objetos  individuais  ou  centróides 
de  agrupamentos  em  um  plano  gráfico. 

Diagrama  verticai  Representação  gráfica  de  agrupamentos. 
Os  objetos  separados  são  mostrados  horizontalmente  ao 
longo  do  topo  do  diagrama,  e  o  processo  de  agrupamento 
hierárquico  é  representado  verticalmente  em  combinações  de 
agrupamentos.  Esse  diagrama  é  semelhante  a  um  dendrogra¬ 
ma  invertido  e  auxilia  na  determinação  do  número  apropriado 
de  agrupamentos  na  solução. 

Distância  city-block  Método  de  calcular  distâncias  com  base 
na  soma  das  diferenças  absolutas  das  coordenadas  para  os 
objetos.  Esse  método  assume  que  as  variáveis  na  variável  es¬ 
tatística  de  agrupamento  não  são  correlacionadas  e  que  as 
escalas  das  unidades  são  compatíveis. 

Distância  de  Chebychev  Medida  de  distância  definida  como 
a  maior  diferença  ao  longo  de  todas  as  variáveis  na  variável 
estatística  de  agrupamento.  Suscetível  a  diferenças  de  esca¬ 
la;  logo,  essa  medida  sempre  deve  ser  usada  com  variáveis 
padronizadas. 

Distância  de  Mahaianobis  (D^)  Forma  padronizada  de  distân¬ 
cia  euclidiana.  Resposta  de  escalonamento  em  termos  de 
desvios-padrão  que  padroniza  os  dados,  com  ajustes  feitos 
para  correlações  entre  as  variáveis. 

Distância  de  Manhattan  Ver  distância  city-block. 

Distância  euciidiana  Medida  mais  comumente  usada  da  simila¬ 
ridade  entre  dois  objetos.  Essencialmente,  é  uma  medida  do 
comprimento  de  um  segmento  de  reta  desenhado  entre  dois 
objetos,  quando  representados  graficamente. 

Distância  euciidiana  absoiuta  Ver  distânoia  euclidiana  qua¬ 
drada. 

Distância  euciidiana  quadrada  Medida  de  similaridade  que 
representa  a  soma  das  distâncias  quadradas  sem  calcular 
a  raiz  quadrada  (como  se  faz  para  calcular  distância  eucli¬ 
diana). 

Efeito  de  estiio  resposta  Série  de  respostas  sistemáticas  de 
um  respondente  que  refletem  um  viés  ou  padrão  consistente. 


Exemplos  incluem  responder  de  que  um  objeto  sempre  de¬ 
sempenha  bem  ou  mal,  ao  longo  de  todos  os  atributos,  com 
pouca  ou  nenhuma  variação. 

Função  distância  normalizada  Processo  que  computa  medi¬ 
das  de  distância  com  base  em  escores  de  dados  originais 
que  foram  padronizados  com  uma  média  de  0  e  um  desvio- 
padrão  de  1,  para  remover  o  viés  introduzido  por  diferenças 
em  escalas  de  diversas  variáveis. 

Grupo  de  entropia  Grupo  de  objetos  independentes  de  qual¬ 
quer  agrupamento  (ou  seja,  eles  não  se  ajustam  a  agrupa¬ 
mento  nenhum)  que  podem  ser  considerados  atípicos  e  pos¬ 
sivelmente  eliminados  da  análise  de  agrupamentos. 

Heterogeneidade  Uma  medida  de  diversidade  de  todas  as  ob¬ 
servações  ao  longo  dos  agrupamentos  que  é  usada  como  um 
elemento  geral  em  regras  de  parada.  Um  grande  aumento  na 
heterogeneidade  quando  dois  agrupamentos  são  combina¬ 
dos  indica  que  existe  uma  estrutura  mais  natural  quando  os 
dois  agrupamentos  são  separados. 

Ligação  média  Algoritmo  de  agrupamento  hierárquico  que  re¬ 
presenta  a  similaridade  como  a  distância  média  entre  todos 
os  objetos  em  um  agrupamento  e  todos  os  objetos  de  outro. 
Essa  técnica  tende  a  combinar  agrupamentos  com  pequenas 
variâncias. 

Método  centróide  Algoritmo  de  agrupamento  hierárquico  no 
qual  a  similaridade  entre  agrupamentos  é  medida  como  a  dis¬ 
tância  entre  oentróides  de  agrupamentos.  Quando  dois  agru¬ 
pamentos  são  combinados,  um  novo  centróide  é  computado. 
Logo,  os  centróides  de  agrupamentos  migram,  ou  se  movem, 
conforme  os  agrupamentos  são  combinados. 

Método  da  referência  paralela  Procedimento  de  agrupamento 
não-hierárquico  que  seleciona  as  sementes  de  agrupamentos 
simultaneamente  no  início.  Objetos  dentro  das  distâncias  de 
referência  são  designados  para  a  semente  mais  próxima.  Dis¬ 
tâncias  de  referência  podem  ser  ajustadas  para  incluir  menos 
ou  mais  objetos  nos  agrupamentos.  Esse  método  é  o  oposto 
do  método  da  referênoia  seqüenoial. 

Método  da  referência  seqüencial  Procedimento  de  agrupa¬ 
mento  não-hierárquico  que  começa  pela  seleção  de  uma 
semente  de  agrupamento.  Todos  os  objetos  dentro  de  uma 
distância  pré-especificada  são  então  incluídos  no  agrupa¬ 
mento.  Sementes  de  agrupamentos  subseqüentes  são  sele¬ 
cionadas  até  que  todos  os  objetos  estejam  reunidos  em  um 
agrupamento. 

Método  da  vizinhança  mais  próxima  Ver  método  da  ligação 
individual. 

Método  de  ligação  completa  Algoritmo  de  agrupamento  hierár- 
quioo  no  qual  similaridade  entre  objetos  se  baseia  na  distân¬ 
cia  mãxima  entre  objetos  em  dois  agrupamentos  (a  distância 
entre  os  membros  mais  distintos  de  cada  agrupamento).  Em 
cada  estágio  da  aglomeração,  os  dois  agrupamentos  com  a 
menor  distância  máxima  (mais  parecidos)  são  combinados. 

Método  de  ligação  individual  Algoritmo  de  agrupamento  hie¬ 
rárquico  no  qual  a  similaridade  é  definida  como  a  distância 
mínima  entre  qualquer  objeto  em  um  agrupamento  e  qual¬ 
quer  objeto  de  outro,  o  que  simplesmente  significa  a  distância 
entre  os  objetos  mais  próximos  de  dois  agrupamentos.  Esse 
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procedimento  tem  o  potencial  de  criar  agrupamentos  menos 
compactos  ou  mesmo  em  cadeia.  É  diferente  do  método  de 
ligação  completa,  que  usa  a  distância  máxima  entre  objetos 
no  agrupamento. 

Método  de  Ward  Procedimento  de  agrupamento  hierárguioo  no 
qual  a  similaridade  usada  para  juntar  agrupamentos  é  calcu¬ 
lada  como  a  soma  de  quadrados  entre  os  dois  agrupamentos 
somados  sobre  todas  as  variáveis.  Esse  método  tende  a  resul¬ 
tar  em  agrupamentos  de  tamanhos  aproximadamente  Iguais 
devido  à  sua  minimizaçâo  de  variação  interna. 

Método  divisivo  Procedimento  de  agrupamento  hierárquico 
que  começa  com  todos  os  objetos  em  um  único  agrupa¬ 
mento,  que  é  então  dividido  em  cada  passo  em  dois  agru¬ 
pamentos  adicionais  que  contêm  os  objetos  mais  distintos. 
O  agrupamento  único  é  dividido  em  dois,  e  em  seguida  um 
desses  dois  é  dividido,  formando  um  total  de  três  agrupamen¬ 
tos.  Isso  continua  até  que  todas  as  observações  estejam  em 
agrupamentos  unitários.  Esse  método  é  o  oposto  do  método 
aglomerativo. 

Método  do  diâmetro  Ver  método  de  ligação  completa. 

Métodos  aglomerativos  Procedimento  hierárquico  que  começa 
com  cada  objeto  ou  observação  em  um  grupo  separado.  Em 
cada  passo  que  se  segue,  os  dois  agrupamentos  mais  pare¬ 
cidos  são  combinados  para  construir  um  novo  agrupamento 
agregado.  O  processo  é  repetido  até  que  todos  os  objetos  se¬ 
jam  finalmente  combinados  em  um  único  agrupamento.  Este 
processo  é  o  oposto  do  método  divisivo. 

Multicolinearidade  Grau  em  que  uma  variável  pode  ser  expli¬ 
cada  pelas  outras  variáveis  na  análise.  Quando  a  multicoline¬ 
aridade  aumenta,  ela  complica  a  interpretação  da  variável  es¬ 
tatística  de  agrupamento  por  ser  mais  difícil  de  determinar  o 
efeito  de  qualquer  variável  individual  devido  às  inter-relações 
das  variáveis. 

Objeto  Pessoa,  produto  ou  serviço,  empresa  ou  qualquer  outra 
entidade  que  possa  ser  avaliada  em  uma  quantia  de  atributos. 

Padronização  centrada  em  linha  Ver  padronização  dentro  de 
casos. 

Padronização  interna  Método  de  padronização  no  qual  as  res¬ 
postas  de  um  respondente  não  são  comparadas  com  a  amos¬ 
tra  geral,  mas,  em  vez  disso,  são  comparadas  com  suas  pró¬ 
prias  respostas.  Neste  processo,  também  conhecido  como 
ipsitizing,  as  respostas  médias  dos  respondentes  são  usadas 
para  padronizar  suas  próprias  respostas. 

Procedimento  de  otimização  Procedimento  de  agrupamento 
não-hierárquico  que  permite  a  re-designação  de  objetos  do 
agrupamento  originalmente  designado  para  um  outro  agrupa¬ 
mento  com  base  em  um  critério  de  otimização  geral. 

Procedimentos  hierárquicos  Procedimentos  de  agrupamen¬ 
tos  stepwise  que  envolvem  uma  combinação  (ou  divisão) 
dos  objetos  em  agrupamentos.  Os  dois  procedimentos  alter¬ 
nativos  são  os  métodos  aglomerativo  e  divisivo.  O  resultado 
é  a  construção  de  uma  hierarquia,  ou  estrutura  em  árvore 
{dendrograma),  que  representa  a  formação  dos  agrupamen¬ 
tos.  Tal  procedimento  produz  N  -  1  soluções  de  agrupa¬ 
mento,  onde  N  é  0  número  de  objetos.  Por  exemplo,  se  o 
procedimento  aglomerativo  começar  com  cinco  objetos  em 


grupos  separados,  ele  mostrará  como  quatro  agrupamentos, 
e  em  seguida  três,  dois  e  finalmente  um  agrupamento,  são 
formados. 

Procedimentos  não-hierárquicos  Procedimentos  que  produ¬ 
zem  apenas  uma  solução  de  agrupamento  para  um  conjunto 
de  sementes  de  agrupamentos.  Em  vez  de  usar  o  processo 
de  construção  em  forma  de  árvore  encontrado  nos  proce¬ 
dimentos  hierárquicos,  as  sementes  de  agrupamentos  são 
empregadas  para  reunir  objetos  dentro  de  uma  distância 
pré-especificada  das  sementes.  Por  exemplo,  se  quatro  se¬ 
mentes  de  agrupamentos  são  especificadas,  apenas  quatro 
agrupamentos  são  formados.  Os  procedimentos  não-hierár¬ 
quicos  não  produzem  resultados  para  todos  os  possíveis  nú¬ 
meros  de  agrupamentos,  como  é  feito  com  um  procedimento 
hierárquico. 

Raiz  do  desvio  padrão  quadrático  médio  (RMSSTD)  A  raiz 
quadrada  da  variância  do  novo  agrupamento  formado  pela 
união  de  dois  agrupamentos  ao  longo  da  variável  estatística 
de  agrupamento.  Grandes  aumentos  indicam  que  os  dois 
agrupamentos  representam  uma  estrutura  mais  natural  de  da¬ 
dos  do  que  quando  unidos. 

Regra  de  parada  Aigoritmo  para  determinar  o  número  final  de 
agrupamentos  a  serem  formados.  Sem  qualquer  regra  de  pa¬ 
rada  inerente  ã  análise  de  agrupamentos,  os  pesquisadores 
desenvolveram  diversos  critérios  e  orientações  para  essa  de¬ 
terminação.  Existem  duas  classes  de  regras  que  são  aplica¬ 
das  posthoc  e  calculadas  pelo  pesquisador:  (1)  medidas  de 
similaridade  e  (2)  medidas  estatísticas  adaptadas. 

Semente  de  agrupamento  Centróide  inicial  ou  ponto  de  par¬ 
tida  para  um  agrupamento.  Esses  valores  são  selecionados 
para  iniciar  procedimentos  de  agrupamento  não-hierárquico, 
nos  quais  os  agrupamentos  são  construídos  em  torno  desses 
pontos  pré-especificados. 

Similaridade  Ver  similaridade  entre  objetos. 

Similaridade  entre  objetos  A  correspondência  ou  associação 
de  dois  objetos  baseada  nas  variáveis  da  variável  estatísti¬ 
ca  de  agrupamento.  A  similaridade  pode  ser  medida  de  duas 
formas.  Primeiro,  é  uma  medida  de  associação,  com  coefi¬ 
cientes  de  correlação  positivos  maiores  representando  maior 
similaridade.  Segundo,  a  proximidade  entre  cada  par  de  obje¬ 
tos  pode  avaliar  a  similaridade,  onde  medidas  de  distância  ou 
de  diferença  são  empregadas,  com  as  menores  distâncias  ou 
diferenças  representando  maior  similaridade. 

Solução  de  agrupamento  Um  número  específico  de  agrupa¬ 
mentos  selecionados  como  representativos  da  estrutura  de 
dados  da  amostra  de  objetos. 

Taxonomia  Classificação  empiricamente  obtida  de  objetos 
reais  baseada  em  uma  ou  mais  características,  como  tipifi¬ 
cada  pela  aplicação  de  análise  de  agrupamentos  ou  outros 
procedimentos  de  agregação.  Essa  classificação  pode  ser 
contrastada  com  uma  tipoiogia. 

Tipologia  Classificação  conceituai  de  objetos  baseada  em  uma 
ou  mais  características.  Uma  tipologia  geralmente  não  tenta 
agregar  observações  reais,  mas,  em  vez  disso,  fornece  a  fun¬ 
damentação  teõrica  para  a  criação  de  uma  taxonomia,  a  qual 
agrega  observações  reais. 
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Validade  de  critério  Habilidade  de  agrupamentos  em  mostrar 
as  diferenças  esperadas  em  uma  variável  não  usada  para 
formar  os  agrupamentos.  Por  exemplo,  se  os  agrupamentos 
foram  formados  sobre  avaliações  de  desempenho,  o  analista 
pode  antecipar  que  os  agrupamentos  com  avaliações  mais 
altas  de  desempenho  também  teriam  maiores  escores  de  sa¬ 
tisfação.  Se  essa  relação  ocorrer  em  feste  empírico,  então  a 
validade  de  critério  estã  embasada. 

Vaiidade  preditiva  Ver  validade  de  critério. 

Variável  estatística  de  agrupamento  Conjunto  de  variáveis  ou 
características  que  representam  os  objetos  a  serem  agrupa¬ 
dos.  É  usado  para  calcular  a  similaridade  entre  objetos. 


O  QUE  É  ANÁLISE  DE 
AGRUPAMENTOS? 

Análise  de  agrupamentos  é  um  grupo  de  técnicas  multi- 
variadas  cuja  finalidade  principal  é  agregar  objetos  com 
base  nas  características  que  eles  possuem.  Ela  tem  sido 
chamada  de  análise  Q,  construção  de  tipologia,  análise  de 
classificação  e  taxonomia  numérica.  Essa  variedade  de  no¬ 
mes  se  deve  ao  uso  de  métodos  de  agrupamento  nas  mais 
diversas  áreas,  como  psicologia,  biologia,  sociologia,  eco¬ 
nomia,  engenharia  e  administração.  Apesar  de  os  nomes 
diferirem  nas  disciplinas,  os  métodos  têm  uma  dimensão 
em  comum:  classificação  de  acordo  com  relações  entre  os 
objetos  sendo  agrupados  [1,  2,  4, 10,  22,  27].  Essa  dimen¬ 
são  comum  representa  a  essência  de  todas  as  abordagens 
de  agrupamento  -  a  classificação  de  dados,  como  sugerido 
pelos  agregados  naturais  dos  dados  em  si.  A  análise  de 
agrupamentos  se  assemelha  à  análise  fatorial  (ver  Capítu¬ 
lo  3)  em  seu  objetivo  de  avaliar  estrutura.  Porém,  diferem 
no  sentido  de  que  a  primeira  agrega  objetos  e  a  segunda 
está  prioritariamente  interessada  em  agregar  variáveis. 
Além  disso,  a  análise  fatorial  faz  os  agrupamentos  com 
base  em  padrões  de  variação  (correlação)  nos  dados,  en¬ 
quanto  a  análise  de  agrupamentos  faz  agregados  baseados 
em  distância  (proximidade). 

Análise  de  agrupamentos  como 
uma  técnica  multivariada 

A  análise  de  agrupamentos  classifica  objetos  (p.ex.,  res- 
pondentes,  produtos  ou  outras  entidades)  de  modo  que 
cada  objeto  é  semelhante  aos  outros  no  agrupamento  com 
base  em  um  conjunto  de  características  escolhidas.  Os 
agrupamentos  resultantes  de  objetos  devem  então  exibir 
elevada  homogeneidade  interna  (dentro  dos  agrupamen¬ 
tos)  e  elevada  heterogeneidade  externa  (entre  agrupa¬ 
mentos).  Assim,  se  a  classificação  for  bem  sucedida,  os  ob¬ 
jetos  dentro  dos  agrupamentos  estarão  próximos  quando 
representados  graficamente,  e  diferentes  agrupamentos 
estarão  distantes. 

Em  análise  de  agrupamentos,  o  conceito  da  variável 
estatística  é  novamente  uma  questão  central.  A  variável 


estatística  de  agrupamento  é  o  conjunto  de  variáveis  que 
representam  as  características  usadas  para  comparar 
objetos  na  análise  de  agrupamentos.  Como  a  variável 
estatística  de  agrupamentos  inclui  apenas  as  variáveis 
usadas  para  comparar  objetos,  ela  determina  o  caráter 
dos  objetos. 

A  variável  estatística  em  análise  de  agrupamentos  é 
determinada  de  maneira  muito  diferente  do  que  ocorre 
em  outras  técnicas  multivariadas.  A  análise  de  agrupa¬ 
mentos  é  a  única  técnica  multivariada  que  não  estima  a 
variável  estatística  empiricamente,  mas,  em  vez  disso,  usa 
a  variável  estatística  como  especificada  pelo  pesquisador. 
O  foco  da  análise  de  agrupamentos  é  a  comparação  de 
objetos  com  base  na  variável  estatística,  não  na  estimação 
da  variável  estatística  em  si.  Isso  torna  a  definição  da  va¬ 
riável  estatística  feita  pelo  pesquisador  um  passo  crítico 
na  análise. 

Desenvolvimento  conceitnal  com 
análise  de  agrnpamentos 

A  análise  de  agrupamentos  tem  sido  usada  em  todo  tipo 
de  pesquisa  imaginável.  Variando  da  obtenção  de  taxo- 
nomias  em  biologia  para  agregar  todos  os  organismos 
vivos,  de  classificações  psicológicas  baseadas  em  traços 
de  personalidade  e  outros,  à  análise  de  segmentação  de 
mercados,  a  análise  de  agrupamentos  sempre  teve  uma 
forte  tradição  de  agrupar  indivíduos.  Essa  tradição  foi  es¬ 
tendida  para  classificar  objetos,  incluindo  a  estrutura  de 
mercado,  a  análise  das  semelhanças  e  diferenças  entre  no¬ 
vos  produtos,  e  avaliações  de  desempenho  de  empresas 
para  identificar  agrupamentos  com  base  nas  estratégias  ou 
orientações  estratégicas  de  empresas. 

Em  muitos  casos,  porém,  o  agrupamento  de  objetos  é, 
na  verdade,  um  meio  para  um  fim  em  termos  de  uma  meta 
conceitualmente  definida.  Os  papéis  mais  comuns  que  a 
análise  de  agrupamentos  pode  desempenhar  em  desen¬ 
volvimento  conceituai  incluem  os  seguintes: 

•  Redução  de  dados:  Um  pesquisador  que  tenha  coletado  da¬ 
dos  por  meio  de  um  questionário  pode  se  deparar  com  um 
grande  número  de  observações  que  são  sem  significado  a 
não  ser  que  sejam  classificadas  em  grupos  com  os  quais  se 
possa  lidar.  A  análise  de  agrupamentos  pode  realizar  esse 
procedimento  de  redução  de  dados  objetivamente  pela  re¬ 
dução  da  informação  de  uma  população  inteira  ou  de  uma 
amostra  para  a  informação  sobre  subgrupos  específicos  e 
menores. 


Por  exemplo,  se  podemos  entender  as  atitudes  de  uma 
população  pela  identificação  dos  principais  grupos  den¬ 
tro  da  população,  então  reduzimos  os  dados  para  a  po¬ 
pulação  inteira  em  perfis  de  vários  grupos.  Dessa  ma¬ 
neira,  o  pesquisador  tem  uma  descrição  mais  concisa  e 
compreensível  das  observações,  com  perda  mínima  de 
informação. 
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•  Geração  de  hipóteses:  A  análise  de  agrupamentos  também 
é  útil  quando  um  pesquisador  deseja  desenvolver  hipóteses 
relativas  à  natureza  dos  dados  ou  examinar  hipóteses  pre¬ 
viamente  estabelecidas. 


Por  exemplo,  um  pesquisador  pode  acreditar  que  as 
atitudes  em  relação  ao  consumo  de  refrigerantes  diet 
versus  comuns  possam  ser  usadas  para  separar  os  consu¬ 
midores  de  refrigerantes  em  segmentos  ou  grupos  lógi¬ 
cos.  A  análise  de  agrupamentos  pode  classificar  os  con¬ 
sumidores  de  refrigerantes  por  suas  atitudes  em  relação 
a  refrigerantes  normais  versus  diet,  e  os  agrupamentos 
resultantes,  se  existirem,  podem  ser  caracterizados  por 
similaridades  e  diferenças  demográficas. 


A  explosão  resultante  de  aplicações  da  análise  de 
agrupamentos  em  quase  todas  as  áreas  de  investigação 
cria  não  apenas  uma  riqueza  de  conhecimento  no  seu  uso, 
mas  também  a  necessidade  de  uma  melhor  compreensão 
da  técnica  para  minimizar  seu  mau  emprego. 

Necessidade  de  apoio  conceituai 
em  análise  de  agrupamentos 

Junto  com  os  benefícios  da  análise  de  agrupamentos  vêm 
algumas  advertências  que  devem  ser  observadas  quando 
ela  é  empregada.  Em  cada  caso,  críticas  potenciais  podem 
ser  retrucadas  com  forte  suporte  conceituai  sobre  um  con¬ 
junto  de  questões  que  variam  da  razão  do  porquê  deve 
existir  estrutura  (agrupamentos)  até  os  tipos  de  medidas 
que  devem  ser  usadas  para  caracterizar  os  objetos.  Mes¬ 
mo  quando  a  análise  de  agrupamentos  está  sendo  usada 
em  desenvolvimento  conceituai,  como  mencionado,  al¬ 
gum  suporte  conceituai  é  essencial.  As  críticas  abaixo  são 
as  mais  comuns  que  devem  ser  resolvidas  por  suporte  con¬ 
ceituai  e  não  empírico: 

•  A  análise  de  agrupamentos  é  descritiva,  não-teórica  e  não-in- 
ferencial.  Análise  de  agrupamentos  não  tem  base  estatística 
sobre  a  qual  esboçar  inferências  de  uma  amostra  para  uma 
população,  e  muitos  clamam  que  é  apenas  uma  técnica  explo¬ 
ratória.  Nada  garante  soluções  únicas,  já  que  a  pertinência  a 
um  agrupamento  para  qualquer  número  de  soluções  depen¬ 
de  de  muitos  elementos  do  procedimento,  e  muitas  soluções 
diferentes  podem  ser  obtidas  pela  variação  de  um  ou  mais 
elementos.  Portanto,  se  possível,  a  análise  de  agrupamentos 
deve  ser  aplicada  a  partir  de  um  modo  confirmatório,  usan- 
do-a  para  identificar  grupos  que  já  têm  uma  fundamentação 
conceituai  estabelecida  quanto  à  existência  dos  mesmos. 

•  A  análise  de  agrupamentos  sempre  criará  agrupamentos,  in¬ 
dependentemente  da  existência  real  de  alguma  estrutura  nos 
dados.  Quando  o  pesquisador  usa  a  análise  de  agrupamen¬ 
tos,  ele  está  fazendo  uma  suposição  sobre  alguma  estrutura 
entre  os  objetos.  O  pesquisador  sempre  deve  lembrar  que 
apenas  achar  agrupamentos  não  valida  necessariamente  a 
existência  dos  mesmos.  Somente  com  forte  suporte  concei¬ 
tuai  seguido  de  validação  os  agrupamentos  são  potencial¬ 
mente  significantes  e  relevantes. 


•  A  solução  de  agrupamentos  não  ê  generalizável,  pois  é  to¬ 
talmente  dependente  das  variáveis  usadas  como  base  para 
a  medida  de  similaridade.  Tal  crítica  pode  ser  feita  a  qual¬ 
quer  técnica  estatística,  mas  a  análise  de  agrupamentos  é 
geralmente  considerada  mais  dependente  das  medidas 
usadas  para  caracterizar  os  objetos  do  que  outras  técnicas 
multivariadas.  Com  a  variável  estatística  de  agrupamento 
completamente  especificada  pelo  pesquisador,  a  adição  de 
variáveis  ilegítimas  ou  a  eliminação  de  relevantes  podem 
ter  um  substancial  impacto  sobre  a  solução  resultante. 
Assim,  o  pesquisador  deve  tomar  muito  cuidado  com  as 
variáveis  usadas  na  análise,  garantindo  que  elas  têm  forte 
suporte  teórico. 

Assim,  em  qualquer  uso  da  análise  de  agrupamentos 
o  pesquisador  deve  ter  especial  cuidado  para  garantir  que 
forte  suporte  conceituai  anteceda  a  aplicação  da  técnica. 
Apenas  com  este  suporte  em  mãos  o  pesquisador  deve  en¬ 
tão  tratar  cada  uma  das  decisões  específicas  envolvidas  na 
execução  da  análise  de  agrupamentos. 


COMO  FUNCIONA  A  ANÁLISE 
DE  AGRUPAMENTOS? 

A  análise  de  agrupamentos  executa  uma  tarefa  inata 
a  todos  os  indivíduos  -  reconhecimento  de  padrões  e 
agrupamento.  A  habilidade  humana  de  processar  até 
mesmo  pequenas  diferenças  em  inúmeras  característi¬ 
cas  é  um  processo  cognitivo  inerente  aos  seres  huma¬ 
nos  que  não  é  facilmente  igualável  com  todos  os  nossos 
avanços  tecnológicos.  Considere,  por  exemplo,  a  tarefa 
de  analisar  e  agrupar  rostos  humanos.  Mesmo  a  partir 
do  nascimento,  indivíduos  podem  rapidamente  identi¬ 
ficar  pequenas  diferenças  em  expressões  faciais  e  agru¬ 
par  diferentes  rostos  em  grupos  homogêneos  enquanto 
se  consideram  centenas  de  características  faciais.  No 
entanto,  ainda  batalhamos  por  programas  de  reconhe¬ 
cimento  de  rostos  para  conseguir  realizar  a  mesma  ta¬ 
refa.  O  processo  de  identificação  de  grupos  naturais  é 
um  que  pode  se  tornar  bastante  complexo  de  maneira 
muito  rápida. 

Para  demonstrar  como  a  análise  de  agrupamentos 
opera,  examinamos  um  exemplo  simples  que  ilustra  al¬ 
gumas  das  questões-chave:  medir  similaridade,  formar 
agrupamentos  e  decidir  sobre  o  número  de  agrupamen¬ 
tos  que  melhor  representam  uma  estrutura.  Também 
discutimos  brevemente  o  equilíbrio  de  considerações  ob¬ 
jetivas  e  subjetivas  que  devem  ser  tratadas  por  qualquer 
pesquisador. 

Um  exemplo  simples 

A  natureza  da  análise  de  agrupamentos  e  as  decisões  bá¬ 
sicas  por  parte  do  pesquisador  são  ilustradas  por  um  sim¬ 
ples  exemplo  envolvendo  a  identificação  de  segmentos  de 
clientes  em  um  cenário  de  varejo. 
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Suponha  que  um  pesquisador  de  marketing  queira  de¬ 
terminar  segmentos  de  mercado  em  uma  comunidade 
com  base  em  padrões  de  lealdade  a  marcas  e  lojas.  Uma 
pequena  amostra  de  sete  respondentes  é  selecionada 
como  um  teste  piloto  de  como  a  análise  de  agrupamen¬ 
tos  é  aplicada.  Duas  medidas  de  lealdade  -  (lealdade 
à  loja)  e  Vj  (lealdade  à  marca)  -  foram  feitas  para  cada 
respondente  em  uma  escala  de  0  a  10.  Os  valores  para 
cada  um  dos  sete  respondentes  são  mostrados  na  Figura 
8-1,  juntamente  com  um  diagrama  de  dispersão  que  re¬ 
presenta  cada  observação  sobre  as  duas  variáveis. 


O  objetivo  principal  da  análise  de  agrupamentos  é  de¬ 
finir  a  estrutura  dos  dados  colocando  as  observações  mais 
parecidas  em  grupos.  Para  conseguir  isso,  devemos  tratar 
de  três  questões  básicas: 

1.  Como  medimos  a  similaridade?  Necessitamos  de  um  mé¬ 
todo  de  comparação  simultânea  de  observações  sobre  as 


duas  variáveis  de  agrupamentos  (F^e  Fj).  Diversos  méto¬ 
dos  são  possíveis,  incluindo  a  correlação  entre  objetos  ou 
talvez  uma  medida  de  sua  proximidade  em  um  espaço  bi¬ 
dimensional  tal  que  a  distância  entre  observações  indique 
similaridade. 

2.  Como  formamos  os  agrupamentos?  Não  importa  como  a  si¬ 
milaridade  é  medida,  o  procedimento  deve  agregar  aquelas 
observações  que  são  mais  similares  em  um  agrupamento. 
Esse  procedimento  deve  determinar  a  pertinência  a  grupo 
de  cada  observação  para  cada  conjunto  de  agrupamentos 
formados. 

3.  Quantos  grupos  formamos?  A  tarefa  final  é  selecionar  um 
conjunto  de  agrupamentos  como  a  solução  final.  Fazendo 
isso,  o  pesquisador  se  depara  com  uma  ponderação  a  ser 
feita:  menos  agrupamentos  e  menos  homogeneidade  dentro 
dos  agregados  versus  um  grande  número  de  agrupamentos 
e  maior  homogeneidade  interna.  A  estrutura  simples,  com 
vistas  a  parcimônia,  é  refletida  internamente  com  o  menor 
número  de  agrupamentos  possível.  No  entanto,  quando  o 
número  de  agrupamentos  diminui,  a  heterogeneidade  den¬ 
tro  dos  grupos  necessariamente  aumenta.  Assim,  deve  ha- 


Valores  dos  dados 


Variável  de 
agrupamento 

Respondentes 

A 

B 
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G 

F 
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4 

4 
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7 

6 

F 

2 

5 

7 

7 

6 

7 
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FIGURA  8-1  Valores  de  dados  e  diagrama  de  dispersão  das  sete  observações  com  base  nas  duas  variáveis  de  agrupamento  (V,  e  Vf). 


Diagrama  de  dispersão 
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ver  um  equilíbrio  entre  definir  a  estrutura  mais  básica  (me¬ 
nos  agrupamentos)  e  ainda  conseguir  o  nível  necessário  de 
similaridade*  dentro  dos  agrupamentos. 

Uma  vez  que  temos  os  procedimentos  para  tratar  de 
cada  questão,  podemos  executar  a  análise.  Ilustramos  os 
princípios  inerentes  a  cada  uma  dessas  questões  através 
de  nosso  exemplo  simples. 

Medição  de  similaridade 

A  primeira  tarefa  é  desenvolver  alguma  medida  de  simi¬ 
laridade  entre  os  objetos  a  serem  usados  no  processo  de 
agrupamento.  Similaridade  representa  o  grau  de  corres¬ 
pondência  entre  objetos  ao  longo  de  todas  as  característi¬ 
cas  usadas  na  análise. 


Similaridade  deve  ser  determinada  entre  cada  uma  das 
sete  observações  (respondentes  A-G)  para  permitir  que 
cada  observação  seja  comparada  com  as  demais.  Neste 
exemplo,  similaridade  será  medida  de  acordo  com  a  dis¬ 
tância  euclidiana  (em  linha  reta)  em  cada  par  de  observa¬ 
ções  (ver  Tabela  8-1)  com  base  nas  duas  características  (Uj 
e  Uj).  Neste  caso  bidimensional  (onde  cada  característica 
forma  um  eixo  do  gráfico)  podemos  perceber  distância 
como  a  proximidade  de  cada  ponto  em  relação  aos  outros. 
Ao  usar  a  distância  como  medida  de  proximidade,  deve¬ 
mos  lembrar  que  distâncias  menores  indicam  maior  simi¬ 
laridade,  de  modo  que  as  observações  E  e  F  são  as  mais 
parecidas  (1,414)  e  A  e  F  são  as  mais  distintas  (6,403). 


Formação  de  agrupamentos 

Com  medidas  de  similaridade  já  calculadas,  agora  vamos 
para  a  formação  de  agrupamentos  com  base  na  medida  de 
similaridade  de  cada  observação**.  Geralmente  formamos 
um  número  de  soluções  de  agrupamentos  (uma  solução  de 
dois  agrupamentos,  três  etc.).  Uma  vez  que  os  agrupamen¬ 
tos  são  formados,  escolhemos  então  a  solução  final  a  par¬ 
tir  do  conjunto  de  soluções  possíveis.  Primeiro  discutimos 
como  os  agrupamentos  são  formados  e,  em  seguida,  exa¬ 
minamos  o  processo  para  seleção  de  uma  solução  final. 

*  N.  de  R.  T.:  A  frase  correta  seria  “nível  aceitável  de  heterogeneida¬ 
de  dentro  dos  agrupamentos”. 

**  N.  de  R.  T.:  A  frase  correta  seria  "...  de  cada  par  de  observações”. 


Tendo  calculado  a  medida  de  similaridade,  devemos  de¬ 
senvolver  um  procedimento  para  formação  de  agrupa¬ 
mentos.  Como  mostrado  adiante  neste  capítulo,  muitos 
métodos  têm  sido  propostos,  mas  para  nossos  propósitos 
aqui  usamos  essa  regra  simples: 

Identifique  as  duas  observações  mais  semelhantes 
(mais  próximas)  que  ainda  não  estão  no  mesmo 
agrupamento  e  combine  seus  agrupamentos. 

Aplicamos  essa  regra  repetidamente  para  gerar  vá¬ 
rias  soluções,  começando  com  cada  observação  em  seu 
próprio  “agrupamento”  e  então  combinando  dois  agru¬ 
pamentos  por  vez  até  que  todas  as  observações  estejam 
em  um  único  agrupamento.  Esse  processo  é  o  chamado 
procedimento  hierárquico,  porque  opera  no  estilo  ste- 
pwise  para  formar  um  intervalo  inteiro  de  soluções  de 
agrupamentos.  E  também  um  método  aglomerativo, 
porque  os  agrupamentos  são  formados  pela  combinação 
de  outros  já  existentes. 

A  Tabela  8-2  detalha  os  passos  do  processo  aglome¬ 
rativo  hierárquico,  primeiramente  retratando  o  estado 
inicial  com  todas  as  sete  observações  em  agrupamentos 
unitários,  unindo-os  em  um  processo  aglomerativo  até 
que  apenas  um  agrupamento  permaneça.  O  processo  de 
agrupamento  em  seis  passos  é  descrito  aqui: 

Passo  1:  Identificar  as  duas  observações  mais  próximas 
(E  e  F)  e  combiná-las  em  um  agrupamento,  mu¬ 
dando  de  sete  para  seis  agrupamentos. 

Passo  2:  Encontrar  os  próximos  pares  de  observações 
mais  semelhantes.  Neste  caso,  três  pares  têm 
a  mesma  distância  de  2,000  (E-G,  C-D  e  B-C). 
Para  nossos  propósitos,  comecemos  com  E-G. 
G  é  um  agrupamento  unitário,  mas  E  foi  com¬ 
binado  no  passo  anterior  com  F.  Logo,  o  agru¬ 
pamento  formado  nesse  estágio  agora  tem  três 
membros:  G,  E  e  F. 

Passo  3:  Combinar  os  agrupamentos  unitários  C  e  D  de 
forma  que  agora  temos  quatro  agrupamentos 
Passo  4:  Combinar  B  com  o  agrupamento  de  dois  mem¬ 
bros  C-D  que  foi  formado  no  passo  3.  Neste 
ponto,  temos  agora  três  agrupamentos:  agrupa- 

(Continua) 


TABELA  8-1  Matriz  de  proximidade  de  distâncias  euclidianas  entre  observações 


Observação 

Observação 

A 

B 

C 

D 

E 

F 

G 

A 

- 

B 

3,162 

- 

C 

5,099 

2,000 

- 

D 

5,099 

2,828 

2,000 

- 

E 

5,000 

2,236 

2,236 

4,123 

- 

F 

6,403 

3,606 

3,000 

5,000 

1,414 

- 

G 

3,606 

2,236 

3,606 

5,000 

2,000 

3,162 

- 
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mento  1  (A),  agrupamento  2  (B,  C  e  D)  e  agru¬ 
pamento  3  (E,  F  e  G). 

Passo  5:  Combinar  os  dois  agrupamentos  de  três  mem¬ 
bros  em  um  único  agrupamento  de  seis.  A  me¬ 
nor  distância  seguinte  é  2,236  para  três  pares  de 
observações  (E-B,  B-G  e  C-E).  Usamos  apenas 
uma  dessas  distâncias,  contudo,  já  que  cada  par 
de  observações  contém  um  membro  de  cada  um 
dos  dois  agrupamentos  existentes  (B,  C  e  D  ver¬ 
sus  E,  F  e  G). 

Passo  6:  Combinar  a  observação  A  com  o  agrupamento 
remanescente  (seis  observações)  em  um  único 
agrupamento  a  uma  distância  de  3,162.  Você 
notará  que  distâncias  menores  ou  iguais  a  3,162 
não  são  usadas  por  estarem  entre  membros  do 
mesmo  agrupamento. 

O  processo  de  agrupamento  hierárquico  pode  ser  re¬ 
presentado  graficamente  de  diversas  maneiras.  A  Figura 
8-2  ilustra  dois  métodos.  Primeiro,  como  o  processo  é 
hierárquico,  o  processo  de  agrupamento  pode  ser  mos¬ 
trado  como  uma  série  de  agregados  aninhados  (ver  Fi¬ 
gura  8-2a).  Esse  processo,  contudo,  pode  representar  a 
proximidade  das  observações  para  apenas  duas  ou  três 
variáveis  de  agrupamento  no  gráfico  de  dispersão  ou  no 
gráfico  fridimensional.  Uma  abordagem  mais  comum  é  o 
dendrograma,  que  represenfa  o  processo  de  agrupamen- 
fo  em  um  gráfico  tipo  árvore.  O  eixo  horizontal  retrata  o 
coeficiente  de  aglomeração,  neste  caso  a  distância  usada 
para  unir  agrupamentos.  Essa  abordagem  é  particular¬ 
mente  útil  na  identificação  de  observações  atípicas,  como 
a  observação  A.  Ela  também  revela  o  tamanho  relativo 
dos  variados  agrupamentos,  apesar  de  ficar  intratável 
quando  o  número  de  observações  aumenta. 


Determinação  do  número  de 
agrupamentos  na  solução  final 

Um  método  hierárquico  resulta  em  diversas  soluções  de 
agrupamentos  -  nesse  caso,  começando  com  uma  solução 
de  sete  agrupamentos  e  terminando  com  um.  Qual  solução 


devemos  escolher?  Sabemos  que  quando  nos  afastamos  de 
agrupamentos  unitários  na  solução  de  sete  agrupamentos, 
a  heterogeneidade  aumenta.  Portanto,  por  que  não  ficar¬ 
mos  com  sete  agrupamentos,  a  opção  mais  homogênea 
possível?  O  problema  é  que  não  definimos  nenhuma  estru¬ 
tura  com  sete  agrupamentos.  Assim,  o  pesquisador  deve 
verificar  cada  solução  quanto  à  sua  descrição  da  estrutura 
versus  a  heterogeneidade  dos  agrupamentos.  Primeiro  dis¬ 
cutimos  um  método  simples  para  definir  heterogeneidade 
de  cada  solução  de  agrupamento  e  então  avaliamos  as  so¬ 
luções  para  chegarmos  a  uma  solução  final. 

Medição  de  heterogeneidade.  Qualquer  medida  de  he¬ 
terogeneidade  de  uma  solução  de  agrupamento  deve  re¬ 
presentar  a  diversidade  geral  entre  observações  em  todos 
os  agrupamentos.  Na  solução  inicial  de  uma  abordagem 
aglomerativa  onde  todas  as  observações  estão  em  agru¬ 
pamentos  separados,  a  heterogeneidade  é  minimizada. 
A  medida  que  observações  são  combinadas  para  forma¬ 
rem  agrupamentos,  a  heterogeneidade  aumenta.  Assim,  a 
medida  de  heterogeneidade  deve  começar  com  um  valor 
nulo  e  aumentar  para  mostrar  o  nível  de  heterogeneidade 
quando  agrupamentos  são  combinados. 


Neste  exemplo,  usamos  uma  medida  simples  de  hetero¬ 
geneidade:  a  média  de  todas  as  distâncias  entre  observa¬ 
ções  dentro  de  agrupamentos  (ver  Tabela  8-2).  Como  já 
descrito,  a  medida  deve  aumentar  quando  agrupamentos 
são  combinados: 

•  Na  solução  inicial  com  sete  agrupamentos,  nossa 
medida  de  similaridade  geral  é  0  -  nenhuma  observação 
faz  par  com  outra. 

•  Seis  agrupamentos:  A  similaridade  geral  é  a  distância 
entre  as  duas  observações  (1,414)  reunidas  no  passo  1. 

•  Cinco  agrupamentos:  O  passo  2  forma  um  agrupamento 
de  três  elementos  (E,  F  e  G),  de  modo  que  a  medida  de 
similaridade  geral  é  a  média  das  distâncias  entre  E  e  F 
(1,414),  E  e  G  (2,000)  e  F  e  G  (3,162),  o  que  nos  dá  2,192. 

•  Quatro  agrupamentos:  No  próximo  passo  um  novo 
agrupamento  de  dois  membros  é  formado  com  uma 
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TABELA  8-2  Processo  de  agrupamento  hierárquico  agiomerativo 


Passo 

PROCESSO  DE  AGLOMERAÇÃO 

SOLUÇÃO  DE  AGRUPAMENTO 

Distância  mínima 
entre  observações 
não-agrupadas" 

Par  de 

observações 

Pertinência  a  agrupamento 

Número  de  agrupamentos 

Medida  de  simiiaridade  ge¬ 
rai  (distância  média  dentro 
do  agrupamento) 

Solução  inicial 

(A)  (B)  (C)  (D)  (E)  (F)  (G) 

7 

0 

1 

1,414 

E-F 

(A)  (B)  (C)  (D)  (E-F)  (G) 

6 

1,414 

2 

2,000 

E-G 

(A)  (B)  (C)  (D)  (E-F-G) 

5 

2,192 

3 

2,000 

C-D 

(A)  (B)  (C-D)  (E-F-G) 

4 

2,144 

4 

2,000 

B-C 

(A)  (B-C-D)  (E-F-G) 

3 

2,234 

5 

2,236 

B-E 

(A)  (B-C-D-E-F-G) 

2 

2,896 

6 

3,162 

A-B 

(A-B-C-D-E-F-G) 

1 

3,420 

“Distância  euclidiana  entre  observações. 
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{Conlimmção) 

distância  de  2,000,  o  que  faz  com  que  a  média  geral  caia 
ligeiramente  para  2,144. 

•  Três,  dois  e  um  agrupamento:  Os  últimos  três  passos 
formam  novos  agrupamentos  dessa  maneira  até  que 
seja  formada  uma  solução  com  um  só  agrupamento 
(passo  6),  no  qual  a  média  de  todas  as  distâncias  na 
matriz  de  distâncias  é  3,420. 


Seleção  de  uma  solução  fiual  de  agrupameuto.  Agora, 
como  usamos  essa  medida  geral  de  similaridade  para  se¬ 
lecionar  uma  solução  de  agrupameutos?  Lembre-se  que 
estamos  tentando  obter  a  estrutura  mais  simples  possí¬ 
vel  que  ainda  represente  agrupamentos  homogêneos.  Se 


monitoramos  a  medida  de  heterogeneidade  conforme  o 
número  de  agrupamentos  diminui,  grandes  aumentos  na 
heterogeneidade  indicam  que  dois  agrupamentos  um  tan¬ 
to  dissimilares  foram  unidos  naquele  estágio. 


A  partir  da  Tabela  8-2  podemos  perceber  que  a  medida 
geral  de  heterogeneidade  aumenta  quando  combinamos 
agrupamentos  até  alcançarmos  a  solução  de  um  agrupa¬ 
mento.  Para  escolhermos  uma  solução  final,  examina¬ 
mos  as  mudanças  na  medida  de  homogeneidade*  para 

(Continua) 


*  N.  de  R.  T.:  A  frase  correta  seria  “na  medida  de  heterogeneidade”. 


(a)  Agrupamentos  aninhados 
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FIGURA  8-2  Descrições  gráficas  do  processo  de  agrupamento  hierárquico. 
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(Continuação) 

identificar  grandes  aumentos  indicativos  da  fusão  de 
agrupamentos  distintos: 

•  Quando  juntamos  duas  observações  no  início  (passo 
1)  e  também  quando  fazemos  nosso  primeiro  agrupa¬ 
mento  de  três  membros  (passo  2),  percebemos  grandes 
aumentos. 

•  Nos  dois  passos  seguintes  (3  e  4),  a  medida  geral  não 
muda  substancialmente,  o  que  indica  que  estamos 
formando  outros  agrupamentos  essencialmente  com  a 
mesma  heterogeneidade  dos  agregados  já  existentes. 

•  Quando  avançamos  para  o  passo  5,  o  qual  combina  os 
dois  agrupamentos  de  três  membros,  percebemos  um 
grande  aumento.  Isso  é  indicativo  de  que  reunir  esses 
dois  agrupamentos  resultou  em  um  agregado  que  é  bem 
menos  homogêneo.  Como  resultado,  consideraríamos 

a  solução  do  passo  4  com  três  agrupamentos  muito 
melhor  do  que  a  encontrada  no  passo  5  com  dois  agru¬ 
pamentos. 

•  Também  podemos  notar  que,  no  passo  6,  a  medida  geral 
novamente  aumentou  bastante,  indicando  que  quando 
esta  observação  foi  unida  no  último  passo,  ela  mudou 
substancialmente  a  homogeneidade  do  agrupamento. 
Dado  o  perfil  peculiar  dessa  observação  (observação  A) 
comparada  com  as  outras,  ela  poderia  ser  melhor  de¬ 
signada  como  elemento  do  grupo  de  entropia,  aquelas 
observações  que  são  atípicas  e  independentes  dos  agru¬ 
pamentos  existentes. 

Logo,  quando  revemos  o  intervalo  de  soluções,  aque¬ 
la  de  três  agrupamentos  do  passo  4  parece  a  mais  ade¬ 
quada  para  uma  solução  final,  com  dois  agrupamentos 
de  mesmo  tamanho  e  a  observação  atípica  isolada. 


Considerações  objetivas  versus  subjetivas 

Como  já  deve  estar  claro,  a  seleção  da  solução  final  exi¬ 
ge  muito  julgamento  do  pesquisador  e  é  considerada  por 
muitos  como  muito  subjetiva.  Ainda  que  métodos  mais 
sofisticados  tenham  sido  desenvolvidos  para  auxiliar  na 
avaliação  das  soluções  de  agrupamentos,  ainda  cabe  ao 
pesquisador  tomar  a  decisão  final  quanto  ao  número  de 
agrupamentos  a  ser  aceito  como  solução  final.  Além  disso, 
decisões  sobre  as  características  a  serem  usadas,  os  mé¬ 
todos  de  combinação  de  agrupamentos  e  mesmo  a  inter¬ 
pretação  de  soluções  de  agrupamento  repousam  no  jul¬ 
gamento  do  pesquisador  tanto  quanto  em  qualquer  teste 
empírico. 


Mesmo  este  exemplo  simples  de  apenas  duas  caracte¬ 
rísticas  e  sete  observações  demonstra  a  potencial  com¬ 
plexidade  na  execução  da  análise  de  agrupamentos. 
Pesquisadores  em  ambientes  realistas  se  deparam  com 
análises  contendo  muito  mais  características  com  muito 
mais  observações. 


Portanto,  é  imperativo  que  pesquisadores  empreguem 
todo  suporte  objetivo  disponível  e  que  sejam  guiados  por 


julgamentos  sensatos,  especialmente  nos  estágios  de  pla¬ 
nejamento  e  interpretação. 

Resumo 

O  processo  de  análise  de  agrupamentos,  apesar  de  quase 
natural  em  indivíduos  acostumados  a  reconhecer  padrões 
e  agrupar  objetos  instintivamente,  se  torna  cada  vez  mais 
complexo  à  medida  que  tentamos  reproduzir  o  processo 
através  desta  técnica  multivariada.  O  pesquisador  se  de¬ 
fronta  com  várias  decisões,  muitas  subjetivas  por  nature¬ 
za,  que  afetam  a  solução  final.  No  restante  deste  capítulo, 
discutimos  como  o  pesquisador  pode  empregar  tais  proce¬ 
dimentos  mais  sofisticados  para  lidar  com  a  crescente  com¬ 
plexidade  de  aplicações  no  mundo  real  enquanto  ainda 
atende  à  objetividade  necessária  em  projetos  de  pesquisa. 


PROCESSO  DE  DECISÃO  EM 
ANÁLISE  DE  AGRUPAMENTOS 

A  análise  de  agrupamentos,  como  as  outras  técnicas  mul- 
tivariadas  discutidas  anteriormente,  pode  ser  vista  a  partir 
da  abordagem  de  construção  de  modelo  em  seis  estágios 
introduzida  no  Capítulo  1  (ver  Figura  8-3  para  os  estágios 
1-3  e  Figura  8-6  para  os  estágios  4-6).  Começando  com 
os  objetivos  da  pesquisa,  que  podem  ser  exploratórios  ou 
confirmatórios,  o  delineamento  de  uma  análise  de  agrupa¬ 
mentos  lida  com  o  seguinte: 

•  A  partição  do  conjunto  de  dados  para  formar  agrupamentos 
e  a  seleção  de  uma  solução 

•  Interpretação  dos  agrupamentos  para  compreender  as 
características  de  cada  agrupamento  e  desenvolver  um 
nome  ou  rótulo  que  defina  apropriadamente  a  natureza 
dos  mesmos 

•  Validação  dos  resultados  da  solução  final  (ou  seja,  determi¬ 
nação  de  sua  estabilidade  e  generalização),  com  a  descrição 
das  características  de  cada  agrupamento  para  explicar  como 
eles  podem  diferir  quanto  a  dimensões  relevantes,  como  as 
demográficas 

As  seções  a  seguir  detalham  todas  essas  questões  por 
meio  do  processo  de  construção  de  modelo  em  seis  está¬ 
gios. 

Estágio  1:  Objetivos  da  análise 
de  agrupamentos 

O  objetivo  principal  da  análise  de  agrupamentos  é  divi¬ 
dir  um  conjunto  de  objetos  em  dois  ou  mais  grupos  com 
base  na  similaridade  dos  objetos  em  relação  a  um  conjun¬ 
to  de  características  especificadas  (variável  estatística  de 
agrupamento).  No  alcance  deste  objetivo  básico,  o  pes¬ 
quisador  deve  tratar  de  dois  aspectos-chave:  as  questões 
de  pesquisa  sob  estudo  nesta  análise  e  as  variáveis  usadas 
para  caracterizar  objetos  no  processo  de  agrupamento. 
Discutimos  cada  aspecto  na  seção  a  seguir. 
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FIGURA  8-3  Estágios  1  -3  do  diagrama  de  decisão  da  anáiise  de  agrupamentos. 


Questões  de  pesquisa  em  análise  de  agrupamentos 

Ao  formar  grupos  homogêneos,  a  análise  de  agrupamen¬ 
tos  pode  abordar  qualquer  combinação  de  três  questões 
básicas  de  pesquisa: 


1.  Descrição  taxonômica.  O  uso  mais  tradicional  da  análise 
de  agrupamentos  tem  sido  para  fins  exploratórios  e  para 
a  formação  de  uma  taxonomia  -  uma  classificação  de  ob¬ 
jetos  com  base  empírica.  Como  descrito  anteriormente, 


438  Análise  Multivariada  de  Dados 


a  análise  de  agrupamentos  tem  sido  usada  em  uma  vasta 
gama  de  aplicações  devido  à  sua  habilidade  para  parti¬ 
ção.  Ela  pode  também  gerar  hipóteses  relacionadas  com 
a  estrutura  dos  objetos.  Finalmente,  apesar  de  vista  prin¬ 
cipalmente  como  uma  técnica  exploratória,  a  análise  de 
agrupamentos  pode  ser  usada  para  fins  confirmatórios. 
Em  tais  casos,  uma  tipologia  proposta  (classificação  com 
base  teórica)  pode  ser  comparada  com  aquela  obtida  pela 
análise  de  agrupamentos. 

2.  Simplificação  de  dados.  Pela  definição  de  estrutura  entre 
as  observações,  a  análise  de  agrupamentos  também  desen¬ 
volve  uma  perspectiva  simplificada  agrupando  observações 
para  análise  posterior.  Ao  contrário  da  análise  fatorial,  que 
tenta  fornecer  dimensões  ou  estrutura  para  variáveis  (ver 
Capítulo  3),  a  análise  de  agrupamentos  executa  a  mesma 
tarefa  para  as  observações.  Assim,  em  vez  de  ver  todas 
as  observações  como  únicas,  elas  podem  ser  vistas  como 
membros  de  agrupamentos  e  definidas  por  suas  caracterís¬ 
ticas  gerais. 

3.  Identificação  de  relação.  Com  os  agrupamentos  definidos 
e  a  estrutura  subjacente  dos  dados  representada  nos  agru¬ 
pamentos,  o  pesquisador  tem  um  meio  de  revelar  relações 
entre  as  observações  que  tipicamente  não  é  possível  com  as 
observações  individuais.  Ainda  que  análises  como  a  discri¬ 
minante  sejam  empregadas  para  identificar  relações  empiri¬ 
camente,  ou  os  grupos  sejam  sujeitos  a  métodos  mais  quali¬ 
tativos,  a  estrutura  simplificada  da  análise  de  agrupamentos 
muitas  vezes  representa  relações  ou  similaridades  e  diferen¬ 
ças  não  reveladas  anteriormente. 

Seleção  de  variáveis  de  agrupamento 

Os  objetivos  da  análise  de  agrupamentos  não  podem  ser 
separados  da  seleção  de  variáveis  usadas  para  caracte¬ 
rizar  os  objetos  a  serem  agrupados.  Seja  o  objetivo  ex¬ 
ploratório  ou  confirmai ório,  o  pesquisador  efetivamente 
restringe  os  possíveis  resultados  pelas  variáveis  selecio¬ 
nadas  para  uso.  Os  agrupamentos  obtidos  refletem  a  es¬ 
trutura  inerente  dos  dados  e  são  definidos  apenas  pelas 
variáveis.  Assim,  a  seleção  das  variáveis  a  serem  incluí¬ 
das  na  variável  estatística  de  agrupamento  deve  ser  feita 
em  relação  a  considerações  teóricas  e  conceituais,  bem 
como  práticas. 

Considerações  conceituais.  Oualquer  aplicação  da  aná¬ 
lise  de  agrupamentos  deve  ter  um  argumento  segundo  o 
qual  variáveis  são  selecionadas.  Seja  o  argumento  baseado 
em  uma  teoria  explícita,  pesquisa  anterior,  ou  suposição, 
o  pesquisador  deve  perceber  a  importância  de  incluir 
apenas  aquelas  variáveis  que  (1)  caracterizam  os  objetos 
sendo  agregados  e  (2)  se  relacionam  especificamente  aos 
objetivos  da  análise  de  agrupamentos.  A  técnica  de  aná¬ 
lise  de  agrupamentos  não  tem  meios  de  diferenciar  variá¬ 
veis  relevantes  de  irrelevantes,  e  determina  os  grupos  de 
objetos  mais  consistentes,  mesmo  que  distintos,  ao  longo 
de  todas  as  variáveis.  Assim,  jamais  devem  ser  incluídas 
variáveis  indiscriminadamente.  Em  vez  disso,  deve-se 
escolher  cuidadosamente  as  variáveis  com  o  objetivo  da 
pesquisa  como  critério  de  seleção. 


Por  exemplo,  com  o  conjunto  de  dados  HBAT,  pode¬ 
mos  selecionar  as  13  variáveis  de  percepção  como  as  va¬ 
riáveis  de  agrupamento  para  a  análise.  Dessa  maneira, 
os  agrupamentos  representariam  segmentos  de  clientes 
com  perfis  de  percepção  da  HBAT  parecidos.  Não  obs¬ 
tante,  não  incluiríamos  as  variáveis  de  resultado  (satisfa¬ 
ção,  possibilidade  de  recompra  etc.)  na  mesma  análise, 
pois  elas  são  diferentes  das  percepções  e  parecem  mais 
adequadas  como  variáveis  de  validação. 


Considerações  práticas.  Em  um  sentido  prático,  a  aná¬ 
lise  de  agrupamentos  pode  ser  dramaticamente  afetada 
pela  inclusão  de  apenas  uma  ou  duas  variáveis  inadequa¬ 
das  ou  não-diferenciadas  [17].  O  pesquisador  sempre  é 
encorajado  a  examinar  os  resultados  e  eliminar  as  va¬ 
riáveis  que  não  são  distintas  (ou  seja,  que  não  diferem 
significantemente)  ao  longo  dos  agrupamentos  obtidos. 
Esse  procedimento  permite  que  as  técnicas  de  agrupa¬ 
mento  definam  maximamente  agrupamentos  com  base 
apenas  nas  variáveis  que  exibem  diferenças  ao  longo  dos 
objetos. 

Resumo.  Talvez  mais  do  que  com  outra  técnica  multi¬ 
variada,  percebemos  o  impacto  do  julgamento  do  pesqui¬ 
sador  referente  à  inclusão  de  variáveis  na  análise.  Com 
outras  técnicas  multivariadas,  o  processo  de  estimação 
desenvolve  pesos  para  cada  variável  refletindo  seu  papel 
no  processo  analítico.  A  análise  de  agrupamentos  não 
pondera  discriminadamente  as  variáveis  no  processo  de 
agrupamento,  tornando  criticamente  importante  que  o 

-  REGRAS  PRÁTICAS  8-1  - 

Objetivos  da  análise  de  agrupamentos 

•  A  análise  de  agrupamentos  é  usada  para: 

•  Descrição  taxonômica:  Identificar  grupos  naturais 
dentro  dos  dados 

•  Simplificação  de  dados:  A  habilidade  de  analisar 
grupos  de  observações  semelhantes  em  vez  de  todas 
as  observações  individuais 

•  Identificação  de  relação:  A  estrutura  simplificada 
da  análise  de  agrupamentos  retrata  relações  não 
reveladas  de  outra  forma 

•  Considerações  teóricas,  conceituais  e  práticas  devem 

ser  levadas  em  conta  quando  se  selecionam  variáveis  de 

agrupamento  para  análise: 

•  Somente  variáveis  que  se  relacionam 
especificamente  com  os  objetivos  da  análise  de 
agrupamentos  são  incluídas;  variáveis  irrelevantes 
não  podem  ser  excluídas  da  análise  uma  vez  que  ela 
comece 

•  Variáveis  selecionadas  caracterizam  os  indivíduos 
(objetos)  sendo  agrupados 
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pesquisador  entenda  as  implicações  conceituais  e  práticas 
da  inclusão  e  exclusão  de  variáveis  da  análise. 

Estágio  2:  Projeto  de  pesquisa  em 
análise  de  agrupamentos 

Com  os  objetivos  definidos  e  as  variáveis  selecionadas,  o 
pesquisador  deve  abordar  quatro  questões  antes  de  come¬ 
çar  o  processo  de  partição: 

1.  O  tamanho  da  amostra  é  adequado? 

2.  As  observações  atípicas  podem  ser  detectadas  e,  se  for  o 

caso,  devem  ser  eliminadas? 

3.  Como  a  similaridade  de  objetos  deve  ser  medida? 

4.  Os  dados  devem  ser  padronizados? 

Muitas  abordagens  diferentes  podem  ser  empregadas 
para  responder  a  essas  questões.  No  entanto,  nenhuma 
delas  foi  avaliada  suficientemente  para  fornecer  uma  res¬ 
posta  definitiva  e,  infelizmente,  muitos  dos  métodos  for¬ 
necem  resultados  diferentes  para  o  mesmo  conjunto  de 
dados.  Logo,  a  análise  de  agrupamentos,  juntamente  com 
a  análise  fatorial,  é  tanto  uma  arte  quanto  uma  ciência. 
Por  essa  razão,  nossa  discussão  revê  essas  questões  dando 
exemplos  dos  métodos  mais  comumente  usados  e  avalian¬ 
do  as  limitações  práticas  sempre  que  possível. 

A  importância  dessas  questões  e  das  decisões  tomadas 
em  estágios  posteriores  se  torna  evidente  quando  perce¬ 
bemos  que,  apesar  de  a  análise  de  agrupamentos  buscar 
estrutura  nos  dados,  ela  deve  na  verdade  impor  uma  es¬ 
trutura  por  meio  de  uma  metodologia  selecionada.  A  aná¬ 
lise  de  agrupamentos  não  pode  avaliar  todas  as  partições 
possíveis  porque  mesmo  o  problema  relativamente  pe¬ 
queno  de  dividir  25  objetos  em  5  agrupamentos  disjuntos 
envolve  2,431  x  10^^  partições  possíveis  [2].  Em  vez  disso, 
com  base  nas  decisões  do  pesquisador,  a  técnica  identifi¬ 
ca  um  pequeno  subconjunto  das  possíveis  soluções  como 
“correto”.  Desse  ponto  de  vista,  as  questões  do  projeto  da 
pesquisa  e  a  escolha  de  metodologias  feita  pelo  pesquisa¬ 
dor  talvez  tenham  maior  impacto  do  que  com  qualquer 
outra  técnica  multivariada. 

Tamanho  da  amostra 

A  questão  de  tamanho  amostrai  em  análise  de  agrupa¬ 
mentos  não  se  relaciona  com  quaisquer  problemas  de 
inferência  estatística  (ou  seja,  poder  estatístico).  Em  vez 
disso,  a  amostra  deve  ser  grande  o  bastante  para  forne¬ 
cer  suficiente  representação  de  pequenos  grupos  dentro 
da  população  e  representar  a  estrutura  inerente.  Esta 
questão  de  representação  se  torna  crítica  na  detecção  de 
observações  atípicas  (ver  a  próxima  seção),  com  a  ques¬ 
tão  principal  sendo:  quando  uma  observação  atípica  é  de¬ 
tectada,  ela  é  representativa  de  um  grupo  pequeno  mas 
substantivo?  Grupos  pequenos  irão  naturalmente  apare¬ 
cer  como  pequenas  quantias  de  observações,  particular¬ 
mente  quando  a  amostra  é  pequena.  Por  exemplo,  com 
tamanhos  amostrais  de  100  ou  menos,  grupos  de  até  10% 


da  população  podem  ser  representados  por  apenas  uma 
ou  duas  observações  devido  ao  processo  de  amostragem. 
Em  tais  casos  a  distinção  entre  observações  atípicas  e  re¬ 
presentativas  de  um  pequeno  grupo  é  muito  mais  difícil 
de  fazer.  Amostras  maiores  aumentam  a  chance  de  que 
grupos  pequenos  sejam  representados  por  casos  suficien¬ 
tes  para  tornar  a  presença  dos  mesmos  mais  facilmente 
identificada. 

Como  resultado,  o  pesquisador  deve  garantir  que  a 
amostra  é  suficientemente  grande  para  adequadamente 
representar  todos  os  grupos  relevantes  da  população.  Ao 
determinar  o  tamanho  amostrai,  o  pesquisador  deve  espe¬ 
cificar  os  tamanhos  de  grupos  necessários  para  relevância 
às  questões  de  pesquisa  que  são  feitas.  Obviamente,  se 
os  objetivos  da  análise  demandam  a  identificação  de  pe¬ 
quenos  grupos  dentro  da  população,  o  pesquisador  deve 
buscar  amostras  maiores.  Se  o  pesquisador  porém  está  in¬ 
teressado  somente  em  grupos  maiores  (p.ex.,  segmentos 
importantes  para  campanhas  promocionais),  então  a  dis¬ 
tinção  entre  uma  observação  atípica  e  um  representante 
de  um  pequeno  grupo  é  menos  importante  e  ambos  po¬ 
dem  ser  tratados  de  uma  maneira  semelhante. 

Detecção  de  observações  atípicas 

Na  busca  por  estrutura,  já  discutimos  como  a  análise  de 
agrupamentos  é  sensível  à  inclusão  de  variáveis  irrelevan¬ 
tes.  Mas  a  análise  de  agrupamentos  é  igualmente  sensível 
a  observações  atípicas  (objetos  diferentes  de  todos  os  ou¬ 
tros).  As  observações  atípicas  podem  representar: 

•  Observações  verdadeiramente  aberrantes  que  não  são  re¬ 
presentativas  da  população  geral 

•  Observações  representativas  de  segmentos  pequenos  ou  in¬ 
significantes  na  população,  ou 

•  Uma  subamostragem  de  grupos  reais  na  população  que  pro¬ 
voca  uma  representação  ruim  dos  grupos  na  amostra. 

No  primeiro  caso,  as  observações  atípicas  distorcem  a 
verdadeira  estrutura  e  tornam  os  agrupamentos  obtidos 
não-representativos  da  verdadeira  estrutura  da  popula¬ 
ção.  No  segundo  caso,  a  observação  atípica  é  removida,  de 
forma  que  os  agrupamentos  resultantes  representam  com 
maior  precisão  os  segmentos  relevantes  na  população.  No 
entanto,  no  terceiro  caso  as  observações  atípicas  devem 
ser  incluídas  nas  soluções,  mesmo  que  elas  sejam  mal  re¬ 
presentadas  na  amostra,  pois  elas  representam  grupos  vá¬ 
lidos  e  relevantes.  Por  esta  razão,  um  exame  preliminar 
para  detectar  observações  atípicas  é  sempre  necessário. 

Abordagens  gráficas.  Uma  das  maneiras  mais  fáceis 
de  conduzir  tal  exame  é  preparar  um  diagrama  de  perfil 
gráfico,  listando  as  variáveis  ao  longo  do  eixo  horizon¬ 
tal  e  os  valores  das  variáveis  ao  longo  do  eixo  vertical. 
Cada  ponto  do  gráfico  representa  o  valor  da  variável 
correspondente,  e  os  pontos  são  conectados  para  faci¬ 
litar  a  interpretação  visual.  Perfis  para  todos  os  obje¬ 
tos  são  então  colocados  no  gráfico,  com  uma  linha  para 
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cada  objeto.  As  observações  atípicas  são  os  objetos  com 
perfis  muito  diferentes,  geralmente  caracterizados  por 
valores  extremos  em  uma  ou  mais  variáveis.  Um  exem¬ 
plo  de  diagrama  de  perfil  gráfico  é  mostrado  na  Figura 
8-4. 

Abordagens  empíricas.  Apesar  de  simples,  os  procedi¬ 
mentos  gráficos  se  tornam  inadequados  com  um  grande 
número  de  objetos  e  até  mais  difíceis  quando  o  número  de 
variáveis  aumenta.  Além  disso,  a  detecção  de  observações 
atípicas  deve  se  estender  para  além  do  método  univaria- 
do,  pois  elas  também  podem  ser  definidas  em  um  sentido 
multi variado  como  tendo  perfis  únicos  em  um  conjunto 
inteiro  de  variáveis  que  as  distinguem  de  todas  as  outras 
observações.  Como  resultado,  uma  medida  empírica  se 
faz  necessária  para  facilitar  comparações  ao  longo  de  ob¬ 
jetos.  Para  esses  casos,  os  procedimentos  para  identificar 
observações  atípicas  discutidos  no  Capítulo  2  podem  ser 
aplicados.  A  combinação  de  técnicas  bivariadas  e  multi- 
variadas  fornece  um  conjunto  abrangente  de  ferramen¬ 
tas  para  identificação  de  observações  atípicas  sob  muitas 
perspectivas. 

Outro  método  é  identificar  observações  atípicas  atra¬ 
vés  de  medidas  de  similaridade.  Os  exemplos  mais  óbvios 
de  observações  atípicas  são  observações  singulares  que 
são  as  mais  distintas  das  demais.  No  entanto,  usando  esta 
técnica,  o  pesquisador  está  comprometido  com  a  identifi¬ 
cação  de  observações  atípicas  somente  após  as  soluções 
de  agrupamento  serem  identificadas,  o  que  requer  pelo 
menos  uma  iteração  (identificando  observações  atípicas, 
eliminando-as  do  conjunto  de  dados  e,  em  seguida,  ro¬ 
dando  novamente  a  análise)  na  análise.  A  medida  que  o 
número  de  objetos  a  serem  agregados  aumenta,  fica  mais 
difícil  identificar  todas  as  observações  atípicas  sem  múl¬ 
tiplas  iterações.  Além  disso,  algumas  das  abordagens  de 
agrupamento  são  bastante  sensíveis  à  remoção  de  apenas 


uns  poucos  casos  [14].  Assim,  deve-se  colocar  ênfase  na 
identificação  de  observações  atípicas  antes  que  a  análise 
tenha  início. 

Resumo.  Seja  qual  for  o  método  usado,  observações 
identificadas  como  atípicas  devem  ser  avaliadas  quanto  à 
sua  representatividade  da  população  e  eliminadas  da  aná¬ 
lise  se  forem  consideradas  não-representativas.  Como  em 
outros  casos  de  detecção  de  observações  atípicas,  o  pes¬ 
quisador  deve  demonstrar  cautela  na  eliminação  de  ob¬ 
servações  da  amostra,  pois  tal  eliminação  pode  distorcer  a 
estrutura  real  dos  dados. 

Medidas  de  similaridade 

O  conceito  de  similaridade  é  fundamental  na  análise  de 
agrupamentos.  A  similaridade  entre  objetos  é  uma  medi¬ 
da  empírica  de  correspondência,  ou  semelhança,  entre  ob¬ 
jetos  a  serem  agrupados.  A  comparação  das  duas  técnicas 
de  interdependência  (análise  fatorial  e  análise  de  agrupa¬ 
mentos)  demonstrará  como  funciona  a  similaridade  para 
definir  estrutura  em  ambos  os  casos. 

•  Em  nossa  discussão  de  análise  fatorial,  a  matriz  de  correla¬ 
ção  entre  todos  os  pares  de  variáveis  foi  usada  para  agregar 
variáveis  em  fatores.  O  coeficiente  de  correlação  representa 
a  similaridade  de  cada  variável  com  outra,  quando  vista  ao 
longo  de  todas  as  observações.  Assim,  a  análise  fatorial  reu¬ 
niu  variáveis  que  tinham  fortes  correlações  entre  si. 

•  Um  processo  comparável  ocorre  em  análise  de  agrupamen¬ 
tos.  Aqui,  a  medida  de  similaridade  é  calculada  para  todos 
os  pares  de  objetos,  com  similaridade  baseada  no  perfil  de 
cada  observação  nas  características  especificadas  pelo  pes¬ 
quisador.  Desse  modo,  qualquer  objeto  pode  ser  compara¬ 
do  a  qualquer  outro  por  meio  da  medida  de  similaridade, 
exatamente  como  usamos  correlações  entre  variáveis  em 
análise  fatorial.  O  procedimento  de  análise  de  agrupamen¬ 
tos  então  prossegue  agregando  objetos  semelhantes  em 
agrupamentos. 


FIGURA  8-4  Diagrama  de  perfil. 
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A  similaridade  entre  objetos  pode  ser  medida  de  di¬ 
versas  maneiras,  mas  três  métodos  dominam  as  aplicações 
de  análise  de  agrupamentos:  medidas  correlacionais,  me¬ 
didas  de  distância  e  medidas  de  associação.  Cada  um  des¬ 
ses  métodos  representa  uma  perspectiva  particular  sobre 
similaridade,  dependendo  de  seus  objetivos  e  do  tipo  de 
dados.  Tanto  as  medidas  correlacionais  quanto  as  de  dis¬ 
tância  requerem  dados  métricos,  ao  passo  que  as  medidas 
de  associação  são  para  dados  não-métricos. 

Medidas  correlacionais.  A  medida  de  similaridade  entre 
objetos  em  que  provavelmente  se  pensa  em  primeiro  lugar 
é  o  coeficiente  de  correlação  entre  dois  objetos  medidos  so¬ 
bre  diversas  variáveis.  Com  efeito,  em  vez  de  correlacionar 
dois  conjuntos  de  variáveis,  invertemos  a  matriz  de  dados, 
de  forma  que  as  colunas  representam  os  objetos  e  as  linhas 
correspondem  às  variáveis.  Logo,  o  coeficiente  de  correla¬ 
ção  entre  as  duas  colunas  de  números  é  a  correlação  (ou 
similaridade)  entre  os  perfis  dos  dois  objetos.  Altas  corre¬ 
lações  indicam  similaridade  (a  correspondência  de  padrões 
ao  longo  das  características)  e  baixas  correlações  denotam 


uma  falta  da  mesma.  Esse  procedimento  é  seguido  também 
na  aplicação  de  análise  fatorial  do  tipo  Q  (ver  Capítulo  3). 


A  abordagem  correlacionai  é  ilustrada  usando  o  exem¬ 
plo  de  sete  observações  mostrado  na  Figura  8-4.  Uma 
medida  correlacionai  de  similaridade  não  olha  a  mag¬ 
nitude,  mas  sim  os  padrões  dos  valores.  Na  Tabela  8-3, 
a  qual  contém  as  correlações  entre  essas  sete  observa¬ 
ções,  podemos  perceber  dois  grupos  distintos.  Primeiro, 
os  casos  1,  5  e  7  têm  padrões  semelhantes  e  correlações 
correspondentes  elevadas  e  positivas.  Do  mesmo  modo, 
os  casos  2,  4  e  6  também  têm  correlações  positivas  altas 
entre  eles  mesmos,  mas  correlações  baixas  ou  negativas 
com  as  outras  observações.  O  caso  3  tem  correlações 
baixas  ou  negativas  com  todos  os  demais  casos,  de  modo 
que  talvez  forme  um  grupo  por  si  mesmo. 


Correlações  representam  padrões  ao  longo  das  variá¬ 
veis,  muito  mais  do  que  as  magnitudes,  que  são  compa¬ 
ráveis  a  uma  análise  fatorial  do  tipo  Q  (ver  Capítulo  3). 


TABELA  8-3  Cálculo  de  medidas  de  similaridade  correlacionai  e  de  distância 


Dados  originais 

Caso 

X, 

X, 

X, 

X, 

Xs 

1 

7 

10 

9 

7 

10 

2 

9 

9 

8 

9 

9 

3 

5 

5 

6 

7 

7 

4 

6 

6 

3 

3 

4 

5 

1 

2 

2 

1 

2 

6 

4 

3 

2 

3 

3 

7 

2 

4 

5 

2 

5 

Medida  de  similaridade:  correlação 

Caso 


Caso 

1 

2 

3 

4 

5 

6 

7 

1 

1,00 

2 

-0,147 

1,00 

3 

0,000 

0,000 

1,00 

4 

0,087 

0,516 

-0,824 

1,00 

5 

0,963 

-0,408 

0,000 

-0,060 

1,00 

6 

-0,466 

0,791 

-0,354 

0,699 

-0,645 

1,00 

7 

0,891 

-0,516 

0,165 

-0,239 

0,963 

-0,699 

1,00 

Medida  de  similaridade:  distância  euclidiana 

Caso 


Caso 

1 

2 

3 

4 

5 

6 

7 

1 

nc 

2 

3,32 

nc 

3 

6,86 

6,63 

nc 

4 

10,25 

10,20 

6,00 

nc 

5 

15,78 

16,19 

10,10 

7,07 

nc 

6 

13,11 

13,00 

7,28 

3,87 

3,87 

nc 

7 

11,27 

12,16 

6,32 

5,10 

4,90 

4,36 

nc 

no  =  distâncias  não-oalculadas 
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Medidas  correlacionais  raramente  são  usadas,  porque  a 
ênfase  na  maioria  das  aplicações  da  análise  de  agrupa¬ 
mentos  é  nas  magnitudes  dos  objetos,  e  não  nos  padrões 
de  valores. 

Medidas  de  distância.  Mesmo  que  as  medidas  correla¬ 
cionais  tenham  um  apelo  intuitivo  e  sejam  usadas  em  mui¬ 
tas  outras  técnicas  multivariadas,  elas  não  são  a  medida 
de  similaridade  mais  comumente  empregada  em  análise 
de  agrupamentos.  Em  vez  disso,  as  medidas  de  similari¬ 
dade  mais  usadas  são  as  de  distância.  Essas  medidas  de 
distância  representam  similaridade  como  proximidade  de 
observações  umas  com  as  outras  ao  longo  de  variáveis  na 
variável  estatística  de  agrupamento.  As  medidas  de  dis¬ 
tância  são,  na  verdade,  uma  medida  de  dissimilaridade, 
com  valores  maiores  denotando  menor  similaridade.  A 
distância  é  convertida  em  uma  medida  de  similaridade 
pelo  uso  de  uma  relação  inversa. 

Tipos  de  medida  de  distância.  Elma  ilustração  sim¬ 
ples  disso  foi  mostrada  em  nosso  exemplo  hipotético  (ver 
Figura  8-2),  no  qual  agrupamentos  de  observações  foram 
definidos  com  base  na  proximidade  de  observações  entre 
elas  mesmas  quando  os  escores  de  cada  observação  sobre 
duas  variáveis  foram  representados  graficamente.  Ainda 
que  proximidade  possa  parecer  um  conceito  simples,  di¬ 
versas  medidas  de  distância  estão  disponíveis,  cada  uma 
com  características  específicas. 

•  Distância  euclidiana  é  a  medida  mais  comumente  reconhe¬ 
cida,  muitas  vezes  chamada  de  distância  em  linha  reta.  Um 
exemplo  de  como  a  distância  euclidiana  é  obtida  é  mos¬ 
trado  geometricamente  na  Figura  8-5.  Suponha  que  dois 
pontos  em  duas  dimensões  tenham  coordenadas  (Xj,  Yj) 
e  (Xj,  Yj),  respectivamente.  A  distância  euclidiana  entre 
os  pontos  é  o  comprimento  da  hipotenusa  de  um  triângulo 
retângulo,  conforme  se  calcula  pela  fórmula  sob  a  figura. 
Esse  conceito  é  facilmente  generalizado  para  mais  de  duas 
variáveis. 

•  Distância  euclidiana  quadrada  (ou  absoluta)  é  a  soma  dos 
quadrados  das  diferenças  sem  calcular  a  raiz  quadrada.  A 
distância  euclidiana  quadrada  tem  a  vantagem  de  que  não  é 


necessário  calcular  a  raiz  quadrada,  o  que  acelera  sensivel¬ 
mente  o  tempo  de  computação,  e  é  a  distância  recomendada 
para  os  métodos  de  agrupamento  centróide  e  de  Ward. 

•  Distância  city-block  (de  Manhattan)  não  é  baseada  na  dis¬ 
tância  euclidiana.  No  lugar  disso,  ela  emprega  a  soma  das 
diferenças  absolutas  das  variáveis  (isto  é,  os  dois  lados  de 
um  triângulo  retângulo  em  vez  da  hipotenusa).  Este  proce¬ 
dimento  é  o  mais  simples  de  calcular,  mas  pode  conduzir 
a  agrupamentos  inválidos  se  as  variáveis  forem  altamente 
correlacionadas  [26]. 

•  Distância  de  Chebychev  é  outra  medida.  Com  ela,  a  distân¬ 
cia  é  a  maior  diferença  ao  longo  de  todas  as  variáveis  de 
agrupamento.  Ela  é  particularmente  suscetível  a  diferenças 
em  escalas  ao  longo  das  variáveis  (ver  discussão  adiante  so¬ 
bre  padronização). 

•  Distância  de  Mahalanobis  (D^)  é  uma  medida  generalizada 
de  distância  que  explica  as  correlações  entre  variáveis  de 
uma  maneira  que  pondera  igualmente  cada  uma  delas.  Ela 
também  depende  de  variáveis  padronizadas  e  é  discutida 
com  mais  detalhes  em  uma  seção  posterior.  Apesar  de  dese¬ 
jável  em  muitas  situações,  não  está  disponível  como  medida 
de  proximidade  em  SAS  ou  SPSS. 

Essas  e  diversas  outras  variantes  (outras  formas  de  di¬ 
ferenças  ou  de  potências  de  diferenças)  estão  disponíveis 
em  muitos  programas  de  agrupamento.  O  pesquisador  é 
encorajado  a  explorar  soluções  alternativas  de  agrupa¬ 
mentos  obtidas  quando  ele  usa  diferentes  medidas  de  dis¬ 
tância  em  um  esforço  para  melhor  representar  os  padrões 
inerentes  de  dados. 

Comparação  com  medidas  correlacionais.  A  dife¬ 
rença  entre  medidas  correlacionais  e  de  distância  talvez 
possa  ser  melhor  percebida  novamente  olhando  a  Figura 
8-4.  As  medidas  de  distância  se  concentram  na  magnitude 
dos  valores  e  representam  como  casos  similares  os  objetos 
que  estão  próximos,  mesmo  se  eles  tiverem  padrões  muito 
diferentes  ao  longo  das  variáveis.  Em  contraste,  medidas 
de  correlação  se  concentram  sobre  os  padrões  nas  variá¬ 
veis  e  não  consideram  a  magnitude  das  diferenças  entre 
objetos.  Examinemos  nossas  sete  observações  para  ver 
como  essas  abordagens  se  diferenciam. 


FIGURA  8-5  Um  exemplo  de  distância  euclidiana  entre  dois  objetos  medidos  sobre  duas  variáveis,  Xe  VI 
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A  Tabela  8-3  contém  os  valores  para  as  sete  observações 
sobre  as  cinco  variáveis  {X^  a  X^),  com  medidas  de  simi¬ 
laridade  baseadas  em  distância  e  correlação.  Soluções  de 
agrupamento  usando  qualquer  medida  de  similaridade 
parecem  indicar  três  agrupamentos,  mas  a  pertinência 
em  cada  agrupamento  é  bastante  diferente. 

•  Com  as  distâncias  menores  representando  maior  simila¬ 
ridade,  percebemos  que  os  casos  1  e  2  formam  um  gru¬ 
po  (distância  de  3,32),  e  os  casos  4,  5,  6  e  7  (distâncias 
variando  de  3,87  a  7,07)  formam  um  outro.  A  distinção 
desses  dois  grupos  um  em  relação  ao  outro  se  eviden¬ 
cia  no  sentido  de  que  a  menor  distância  entre  os  dois 
agrupamentos  é  de  10,20.  Esses  grupos  representam 
observações  com  valores  maiores  versus  menores.  Um 
terceiro  grupo,  que  consiste  apenas  no  caso  3,  difere  dos 
outros  dois  grupos  porque  tem  valores  que  são  tanto 
altos  quanto  baixos. 

•  Usando  a  correlação  como  a  medida  de  similaridade, 
três  agrupamentos  também  surgem.  Primeiro,  os  casos 
1,  5  e  7  são  altamente  correlacionados  (0,891  a  0,963), 
como  os  casos  2,  4  e  6  (0,516  a  0,791).  Além  disso,  as 
correlações  entre  agrupamentos  geralmente  são  próxi¬ 
mas  de  zero  ou  mesmo  negativas.  Finalmente,  o  caso  3 
é  novamente  distinto  dos  outros  dois  agrupamentos  e 
forma  um  agrupamento  unitário. 


Uma  medida  correlacionai  se  concentra  em  padrões  e 
não  na  medida  mais  tradicional  de  distância,  e  requer  uma 
interpretação  diferente  dos  resultados  pelo  pesquisador. 
Em  contraste,  medidas  de  distância,  as  medidas  de  simi¬ 
laridade  preferidas  na  maioria  das  aplicações  de  análise 
de  agrupamentos,  apresentam  valores  mais  similares  no 
conjunto  de  variáveis,  mas  os  padrões  podem  ser  bastante 
diferentes.  Como  resultado,  perfis  de  centróides  de  gru¬ 
pos  sobre  as  variáveis  de  agrupamento  são  mais  úteis  com 
medidas  de  distância  do  que  com  aquelas  de  correlação. 

Qual  é  a  melhor  medida  de  distância?  Ao  tentar 
selecionar  uma  medida  particular  de  distância,  o  pesqui¬ 
sador  deve  lembrar  dos  seguintes  avisos: 

•  Diferentes  medidas  de  distância  ou  uma  mudança  nas  es¬ 
calas  das  variáveis  podem  conduzir  a  diferentes  soluções 
de  agrupamentos.  Logo,  é  aconselhável  usar  diversas  me¬ 
didas  e  comparar  os  resultados  com  padrões  teóricos  ou 
conhecidos. 

•  Quando  as  variáveis  estão  correlacionadas  (positiva  ou  ne¬ 
gativamente),  a  medida  de  distância  de  Mahalanobis  prova¬ 
velmente  é  a  mais  adequada,  pois  ajusta  correlações  e  pon¬ 
dera  todas  as  variáveis  igualmente. 

•  Se  o  pesquisador  deseja  ponderar  as  variáveis  de  maneira 
diferenciada,  há  outros  procedimentos  disponíveis  [19,  21]. 

Medidas  de  associação.  Medidas  de  similaridade  por  as¬ 
sociação  são  usadas  para  comparar  objetos  cujas  caracte¬ 
rísticas  são  medidas  apenas  em  termos  não-métricos  (me¬ 
dida  nominal  ou  ordinal).  Como  exemplo,  respondentes 
podem  dizer  sim  ou  não  a  várias  questões.  Uma  medida  de 


associação  poderia  avaliar  o  grau  de  concordância  entre 
cada  par  de  respondentes.  A  forma  mais  simples  de  medi¬ 
da  de  associação  seria  o  percentual  de  vezes  em  que  ocorre 
concordância  (ambos  os  respondentes  dizem  sim  ou  ambos 
dizem  não  a  uma  pergunta)  no  conjunto  de  questões. 

Extensões  desse  coeficiente  simples  de  concordância 
foram  desenvolvidas  para  acomodar  variáveis  nominais 
multicategóricas  e  até  mesmo  medidas  ordinais.  Muitos 
programas  de  computador,  porém,  têm  suporte  limitado 
para  medidas  de  associação,  e  o  pesquisador  é  forçado  a 
primeiramente  calcular  as  medidas  de  similaridade  e  en¬ 
tão  entrar  com  a  matriz  de  similaridade  no  programa  de 
agrupamento.  Textos  sobre  os  vários  tipos  de  medidas  por 
associação  podem  ser  encontrados  em  diversas  fontes  [8, 
13, 14,  27]. 

Seleção  de  uma  medida  de  similaridade.  Apesar  de  três 
formas  distintas  de  medida  de  similaridade  estarem  dispo¬ 
níveis,  a  forma  mais  usada  e  preferida  é  a  de  distância,  por 
diversas  razões.  Primeiro,  a  medida  de  distância  represen¬ 
ta  melhor  o  conceito  de  proximidade,  que  é  fundamental 
para  a  análise  de  agrupamentos.  Medidas  correlacionais, 
apesar  de  terem  ampla  aplicabilidade  em  outras  técni¬ 
cas,  representam  padrões  e  não  proximidade.  Segundo,  a 
análise  de  agrupamentos  é  tipicamente  associada  com  ca¬ 
racterísticas  medidas  por  variáveis  métricas.  Em  algumas 
aplicações,  características  não-métricas  dominam,  mas 
mais  freqüentemente  as  características  são  representadas 
por  medidas  métricas,  tornando  novamente  a  distância 
a  medida  preferida.  Assim,  em  qualquer  situação,  o  pes¬ 
quisador  dispõe  de  medidas  de  similaridade  que  podem 
representar  a  proximidade  de  objetos  em  um  conjunto  de 
variáveis  métricas  ou  não-métricas. 

Padronização  dos  dados 

Com  a  medida  de  similaridade  selecionada,  o  pesquisador 
deve  abordar  uma  questão  a  mais:  os  dados  devem  ser  pa¬ 
dronizados  antes  que  as  similaridades  sejam  calculadas? 
Para  responder  essa  questão,  ele  deve  considerar  que  a 
maioria  das  análises  de  agrupamento  usando  medidas  de 
distância  é  bastante  sensível  a  diferentes  escalas  ou  mag¬ 
nitudes  entre  as  variáveis.  Em  geral,  variáveis  com  maior 
dispersão  (ou  seja,  maiores  desvios-padrão)  têm  maior 
impacto  sobre  o  valor  de  similaridade  final.  Consideremos 
um  exemplo  para  ilustrar  o  problema  encontrado  com  to¬ 
das  as  medidas  de  distância  que  usam  dados  não-padroni- 
zados  e  as  inconsistências  entre  soluções  de  agrupamentos 
quando  a  escala  das  variáveis  é  mudada. 


Suponha  que  três  objetos.  A,  B  e  C,  são  medidos  quanto 
a  duas  variáveis: 

1.  Probabilidade  de  comprar  a  marca  X  (em  percen¬ 
tuais) 

2.  Tempo  despendido  assistindo  comerciais  para  a 
marca  X  (medido  em  minutos  ou  segundos) 

_ {Continua) 
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(Continuação) 

Os  valores  para  cada  observação  são  exibidos  na 
Tabela  8-4.  A  partir  dessa  informação  calculamos  três 
medidas  de  distância  para  cada  par  de  objetos:  euclidia 
simples,  euclidiana  ao  quadrado  e  city-block.  Agora  ve¬ 
jamos  como  essas  medidas  são  afetadas  pelas  escalas  das 
duas  variáveis  em  três  cenários: 

•  Cenário  1:  Primeiro,  calculamos  os  valores  de  distância 
com  base  em  probabilidade  de  compra  e  tempo  com 
comerciais  em  minutos.  Essas  distâncias,  com  valores 
menores  indicando  maior  proximidade  e  similaridade, 
e  suas  ordenações,  são  mostradas  na  Tabela  8-4.  Como 
podemos  ver,  os  objetos  mais  parecidos  (com  a  menor 
distância)  são  B  e  C,  seguidos  por  A  e  C,  com  A  e  B 
sendo  os  menos  parecidos  (ou  menos  próximos).  Tal 
ordenação  vale  para  as  três  medidas  de  distância,  mas 
a  similaridade  ou  dispersão  relativa  entre  objetos  é  a 
mais  pronunciada  na  medida  de  distância  euclidiana  ao 
quadrado. 


•  Cenário  2:  A  ordem  de  similaridades  varia  sensivelmen¬ 
te  com  a  mudança  de  escalonamento  de  apenas  uma  das 
variáveis.  Se  medirmos  o  tempo  de  comercial  em  segun¬ 
dos  no  lugar  de  minutos  (aumentando  assim  a  dispersão 
dessa  variável),  então  as  ordens  mudam  (ver  Tabela 
8-4).  Os  objetos  B  e  C  ainda  são  os  mais  parecidos,  mas 
agora  o  par  A-B  é  o  segundo  mais  parecido  e  é  quase 
idêntico  à  similaridade  de  B-C.  O  que  aconteceu  agora 
é  que  a  escala  da  variável  tempo  dominou  os  cálculos, 
tornando  a  probabilidade  de  compra  menos  significante 
nos  cálculos. 

Quando  usamos  minutos  para  medir  tempo  (Cená¬ 
rio  1),  o  par  A-B  é  o  menos  parecido  com  uma  margem 
considerável.  O  inverso  é  verdadeiro  no  cenário  2,  po¬ 
rém,  quando  medimos  tempo  de  comercial  em  minutos 
(a  medida  com  menor  dispersão  do  que  quando  feita  em 
segundos),  uma  vez  que  a  probabilidade  de  compra  se 
torna  dominante  nos  cálculos. 


TABELA  8-4  Variações  em  medidas  de  distância  baseadas  em  escaias  aiternativas  de  dados 


Dados  originais 


Objeto 

Probabiiidade  de  compra 

Tempo  assistindo  comerciais 

Minutos  Segundos 

A 

60 

3,0 

180 

B 

65 

3,5 

210 

C 

63 

4,0 

240 

Cenário  1 :  Medidas  de  distância  baseadas  em  probabiiidade  de  compra  e  minutos  de  comerciai  assistido 


Distância  euclidiana  simples 

Distância  euclidiana  ao 
quadrado  ou  absoluta 

Distância  city-block 

Par  de  objetos 

Valor 

Ordem 

Valor 

Ordem 

Valor 

Ordem 

A-B 

5,025 

3 

25,25 

3 

5,5 

3 

A-C 

3,162 

2 

10,00 

2 

4,0 

2 

B-C 

2,062 

1 

4,25 

1 

2,5 

1 

Cenário  2:  Medidas  de  distância  baseadas  em  probabiiidade  de  compra  e  segundos  de  comercial  assistido 

Distância  euclidiana  simples 

Distância  euclidiana  ao 
quadrado  ou  absoluta 

Distância  city-block 

Par  de  objetos 

Valor 

Ordem 

Valor 

Ordem 

Valor 

Ordem 

A-B 

30,41 

2 

925 

2 

35 

3 

A-C 

60,07 

3 

3,609 

3 

63 

2 

B-C 

30,06 

1 

904 

1 

32 

1 

Cenário  3:  Medidas  de  distância  baseadas  em  vaiores  padronizados  de  probabiiidade  de  compra  e  minutos  ou  segundos  de  co¬ 
merciai  assistido 


Par  de  objetos 

Valores  padronizados 

Distância  euclidiana 
simples 

Distância  euclidiana  ao 
quadrado  ou  absoluta 

Distância  city  block 

Probabilidade 
de  compra 

Minutos/segundos  de 
comercial  assistido 

Valor 

Ordem 

Valor 

Ordem 

Valor 

Ordem 

A-B 

-1,06 

-1,0 

2,22 

2 

4,95 

2 

2,99 

2 

A-C 

0,93 

0,0 

2,33 

3 

5,42 

3 

3,19 

3 

B-C 

0,13 

1,0 

1,28 

1 

1,63 

1 

1,79 

1 
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O  pesquisador  deveria  assim  notar  o  impacto  substan¬ 
cial  que  escalonamento  de  variáveis  pode  ter  sobre  a  so¬ 
lução  final.  Variáveis  de  agrupamento  devem  ser  padroni¬ 
zadas  sempre  que  possível  para  evitar  casos  como  aquele 
mostrado  em  nosso  exemplo  [3].  Examinamos  agora  di¬ 
versas  abordagens  de  padronização  disponíveis  aos  pes¬ 
quisadores. 

Padronização  de  variáveis.  A  forma  mais  comum  de 
padronização  é  a  conversão  de  cada  variável  em  escores 
padrão  (também  conhecidos  como  escores  Z)  pela  sub¬ 
tração  da  média  e  divisão  pelo  desvio-padrão  para  cada 
variável.  Essa  opção  pode  ser  encontrada  em  todos  os 
programas  de  computador  e  muitas  vezes  está  até  mes¬ 
mo  diretamente  incluída  no  procedimento  de  análise  de 
agrupamentos.  Essa  é  a  forma  geral  de  uma  função  de 
distância  normalizada,  a  qual  utiliza  uma  medida  de  dis¬ 
tância  euclidiana  tratável  para  uma  transformação  de 
normalização  dos  dados  brutos.  O  processo  converte 
cada  escore  de  dados  iniciais  em  um  valor  padronizado 
com  uma  média  de  0  e  um  desvio-padrão  de  1  e,  em  tro¬ 
ca,  elimina  o  viés  introduzido  pelas  diferenças  nas  esca¬ 
las  dos  vários  atributos  ou  variáveis  usados  na  análise. 


Os  benefícios  de  padronização  podem  ser  percebidos 
no  Cenário  3  (ver  Tabela  8-4),  no  qual  duas  variáveis 
(probabilidade  de  compra  e  tempo  despendido  em  co¬ 
merciais)  foram  padronizadas  antes  de  se  computarem 
as  três  medidas  de  distância.  Primeiro,  é  muito  mais 
fácil  comparar  variáveis  porque  elas  estão  na  mesma 
escala  (uma  média  de  0  e  desvio-padrão  de  1).  Valo¬ 
res  positivos  estão  acima  da  média  e  valores  negati¬ 
vos  estão  abaixo.  A  magnitude  representa  o  número 
de  desvios-padrão  que  o  valor  original  está  distante  da 
média.  Segundo,  não  há  diferença  nos  valores  padro¬ 
nizados  quando  apenas  a  escala  muda.  Por  exemplo, 
quando  padronizamos  o  tempo  de  exposição  a  comer¬ 
ciais,  os  valores  são  os  mesmos  medidos  em  minutos 
ou  segundos. 


Assim,  o  uso  de  variáveis  padronizadas  realmente  eli¬ 
mina  os  efeitos  devido  às  diferenças  de  escala  não  apenas 
ao  longo  das  variáveis,  mas  também  para  a  mesma  variá¬ 
vel.  A  necessidade  de  padronização  é  minimizada  quando 
todas  as  variáveis  são  medidas  na  mesma  escala  de  respos¬ 
ta  (p.ex.,  uma  série  de  questões  de  atitude),  mas  se  torna 
muito  importante  sempre  que  variáveis  usando  diferentes 
escalas  de  medida  são  incluídas  na  análise. 

Uso  de  uma  medida  de  distância  padronizada.  Uma 

medida  de  distância  euclidiana  que  incorpora  direta¬ 
mente  um  procedimento  de  padronização  é  a  distância 
de  Mahalanobis  {D^).  A  abordagem  de  Mahalanobis  não 
apenas  executa  um  processo  de  padronização  sobre  os 
dados  escalonando  em  termos  dos  desvios-padrão,  mas 


também  soma  a  variância-covariância  interna  de  gru¬ 
pos,  que  ajusta  correlações  entre  as  variáveis.  Conjun¬ 
tos  altamente  correlacionados  de  variáveis  em  análise  de 
agrupamentos  podem  implicitamente  superponderar  um 
conjunto  de  variáveis  nos  procedimentos  de  agrupamen¬ 
to  (ver  discussão  sobre  multicolinearidade  no  estágio  3). 
Resumidamente,  o  procedimento  de  distância  generali¬ 
zada  de  Mahalanobis  computa  uma  medida  de  distância 
entre  objetos  comparável  a  P?  em  análise  de  regressão. 
Apesar  de  muitas  situações  serem  apropriadas  para  o  uso 
da  distância  de  Mahalanobis,  nem  todos  os  programas  a 
incluem  como  medida  de  similaridade.  Em  tais  casos,  o 
pesquisador  geralmente  seleciona  a  distância  euclidiana 
ao  quadrado. 

Padronização  por  observação.  Até  agora,  discutimos  a 
padronização  apenas  de  variáveis.  Por  que  poderíamos 
padronizar  respondentes  ou  casos?  Consideremos  um 
exemplo  simples. 


Suponha  que  coletemos  várias  avaliações  em  uma  escala 
de  10  pontos  quanto  à  importância  de  diversos  atributos 
em  decisões  de  compra  de  um  produto.  Poderíamos  apli¬ 
car  a  análise  de  agrupamentos  e  obter  agregados,  mas 
uma  possibilidade  bem  diferenciada  é  que  obteríamos 
agregados  de  pessoas  que  dizem  que  tudo  é  importan¬ 
te,  outras  que  dizem  que  tudo  tem  pouca  importância, 
e  talvez  alguns  agrupamentos  sejam  intermediários.  O 
que  estamos  vendo  são  padrões  de  respostas  específicos 
de  um  indivíduo.  Tais  padrões  podem  refletir  uma  forma 
específica  de  resposta  a  um  conjunto  de  questões,  como 
os  que  dizem  sim  (respondem  favoravelmente  a  todas  as 
questões)  ou  os  que  dizem  não  (respondem  desfavora¬ 
velmente  a  todas  as  questões). 


Esses  padrões  dos  que  dizem  sim  e  dos  que  dizem  não 
representam  aquilo  que  se  chama  de  efeitos  de  estilo  de 
resposta.  Se  quisermos  identificar  grupos  de  acordo  com 
seu  estilo  de  resposta  e  até  mesmo  controlar  tais  padrões, 
então  a  padronização  típica  através  do  cálculo  de  escores 
Z  não  é  adequada.  O  que  se  deseja  na  maioria  dos  casos  é 
a  importância  relativa  de  uma  variável  em  relação  a  outra 
para  cada  indivíduo.  Em  outras  palavras,  o  atributo  1  é 
mais  importante  do  que  os  outros  atributos,  e  agrupamen¬ 
tos  de  respondentes  podem  ser  encontrados  com  padrões 
similares  de  importância?  Nesse  caso,  a  padronização  por 
respondente  uniformizaria  cada  questão  não  para  a  média 
da  amostra,  mas  para  o  escore  médio  daquele  responden¬ 
te.  Essa  padronização  interna  ou  centrada  em  linha  pode 
ser  muito  efetiva  para  remover  efeitos  de  estilo  de  respos¬ 
ta  e  é  especialmente  adequada  para  muitas  formas  de  da¬ 
dos  de  atitude  [25].  Devemos  notar  que  isso  é  semelhante 
a  uma  medida  correlacionai  no  destaque  do  padrão  nas 
variáveis,  mas  a  proximidade  de  casos  ainda  determina  o 
valor  de  similaridade. 
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-  REGRAS  PRÁTICAS  8-2  - 

Planejamento  de  pesqnisa  em  análise  de  agrnpamentos 

•  O  tamanho  exigido  da  amostra  não  se  baseia  em  considerações  estatísticas  para  teste  de  inferência,  mas  sim  nos  seguintes 
aspectos: 

•  Tamanho  suficiente  é  necessário  para  garantir  representatividade  da  população  e  sua  estrutura  inerente,  particularmente 
de  grupos  pequenos  na  população 

•  Tamanhos  mínimos  de  grupos  são  baseados  na  relevância  de  cada  grupo  para  a  questão  de  pesquisa  e  na  confiança 
necessária  para  caracterizar  aquele  grupo 

•  Medidas  de  similaridade  calculadas  no  conjunto  inteiro  de  variáveis  de  agrupamento  permitem  agregar  observações  e 
compará-las  umas  com  as  outras 

•  Medidas  de  distância  são  mais  freqüentemente  usadas  como  medidas  de  similaridade,  com  valores  maiores 
representando  maior  distinção  (distância  entre  casos)  e  não  semelhança 

•  Medidas  de  distância  incluem: 

•  Distância  euclidiana  (em  linha  reta),  a  medida  de  distância  mais  comum 

•  Distância  euclidiana  ao  quadrado,  a  soma  de  distâncias  quadradas  e  a  medida  recomendada  para  os  métodos  de 
agrupamento  centróide  e  de  Ward 

•  Distância  de  Mahalanobis  explica  correlações  de  variáveis  e  pondera  igualmente  cada  variável;  mais  adequada 
quando  as  variáveis  são  altamente  correlacionadas 

•  Menos  freqüentemente  usadas  são  as  medidas  correlacionais,  quando  grandes  valores  indicam  similaridade 

•  Dada  a  sensibilidade  de  alguns  procedimentos  à  medida  de  similaridade  usada,  o  pesquisador  deve  empregar  diversas 
medidas  de  distância  e  comparar  os  resultados  de  cada  uma  com  outros  resultados  ou  padrões  teóricos/conhecidos 

•  Observações  atípicas  podem  distorcer  severamente  a  representatividade  dos  resultados  se  elas  aparecerem  como  estrutural 
(agrupamentos)  inconsistente  com  os  objetivos  da  pesquisa 

•  Observações  atípicas  devem  ser  removidas  se  elas  representarem: 

•  Observações  aberrantes  não  representativas  da  população 

•  Observações  de  segmentos  pequenos  ou  insignificantes  na  população  e  sem  interesse  para  os  propósitos  da  pesquisa 

•  Elas  devem  ser  mantidas  se  forem  uma  representação  subamostral/ruim  de  grupos  relevantes  na  população;  a  amostra 
deve  ser  aumentada  para  garantir  representação  desses  grupos 

•  Observações  atípicas  podem  ser  identificadas  com  base  na  medida  de  similaridade  via: 

•  Descoberta  de  observações  com  grandes  distâncias  das  demais  observações 

•  Diagramas  de  perfil  gráfico  que  destacam  casos  atípicos 

•  O  surgimento  delas  em  soluções  de  agrupamentos  como  membros  únicos  ou  agrupamentos  pequenos 

•  Variáveis  de  agrupamento  devem  ser  padronizadas  sempre  que  possível  para  evitar  problemas  resultantes  do  emprego  de 
diferentes  valores  de  escala  entre  as  mesmas 

•  A  conversão  de  padronização  mais  comum  são  os  escores  Z 

•  Se  grupos  são  identificados  de  acordo  com  o  estilo  de  resposta  de  um  indivíduo,  então  a  padronização  interna  ou 
centrada  em  linha  mostra-se  adequada 


Devemos  padronizar?  A  padronização  fornece  uma 
ação  corretiva  para  uma  questão  fundamental  em  me¬ 
didas  de  similaridade,  particularmente  de  distância,  e 
muitos  recomendam  seu  amplo  uso  [11, 13].  No  entanto, 
o  pesquisador  não  deve  aplicar  padronização  sem  consi¬ 
derar  suas  conseqüências  na  remoção  de  alguma  relação 
natural  refletida  no  escalonamento  das  variáveis,  embo¬ 
ra  outros  tenham  dito  que  este  procedimento  pode  ser 
apropriado  [1].  Alguns  pesquisadores  demonstram  que 
a  padronização  pode  nem  mesmo  apresentar  efeitos  ob¬ 
serváveis  [7, 17].  Assim,  não  há  uma  razão  única  que  nos 
diga  para  usarmos  variáveis  padronizadas  versus  não-pa- 
dronizadas.  A  decisão  de  padronização  deve  ser  baseada 
em  questões  empíricas  e  conceituais  que  reflitam  os  ob¬ 
jetivos  da  pesquisa  e  as  qualidades  empíricas  dos  dados. 


Estágio  3:  Suposições  em 
análise  de  agrupamentos 

A  análise  de  agrupamentos,  como  o  escalonamento  mul- 
tidimensional  (ver  Capítulo  9),  não  é  uma  técnica  de  in¬ 
ferência  estatística  na  qual  os  parâmetros  a  partir  de  uma 
amostra  são  avaliados  como  possivelmente  representati¬ 
vos  de  uma  população.  Em  vez  disso,  a  análise  de  agru¬ 
pamentos  é  uma  metodologia  para  quantificar  as  caracte¬ 
rísticas  estruturais  de  um  conjunto  de  observações.  Como 
tal,  ela  tem  fortes  propriedades  matemáticas,  mas  sem 
fundamentos  estatísticos.  As  exigências  de  normalidade, 
linearidade  e  homocedasticidade,  que  eram  tão  impor¬ 
tantes  em  outras  técnicas,  realmente  têm  pouco  peso  na 
análise  de  agrupamentos.  O  pesquisador  deve,  contudo, 
se  concentrar  em  duas  outras  questões  críticas:  represen- 
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tatividade  da  amostra  e  multicolinearidade  entre  variáveis 
na  variável  estatística  de  agrupamento. 

Representatividade  da  amostra 

Raramente  o  pesquisador  tem  um  censo  da  população 
para  usar  na  análise  de  agrupamentos.  Geralmente,  uma 
amostra  de  casos  é  obtida  e  os  agrupamentos  determina¬ 
dos  na  esperança  de  que  representem  a  estrutura  da  po¬ 
pulação.  O  pesquisador  deve,  portanto,  estar  confiante  de 
que  a  amostra  obtida  é  verdadeiramente  representativa 
da  população.  Como  já  mencionado,  observações  atípicas 
podem  realmente  ser  apenas  uma  subamostra  de  grupos 
divergentes  que,  quando  descartadas,  introduzem  viés  na 
estimação  da  estrutura.  O  pesquisador  deve  perceber  que 
a  análise  de  agrupamentos  é  apenas  tão  boa  quanto  a  re¬ 
presentatividade  da  amostra.  Portanto,  todos  os  esforços 
devem  ser  feitos  para  garantir  que  a  amostra  seja  repre¬ 
sentativa  e  que  os  resultados  sejam  generalizáveis  para  a 
população  de  interesse. 

Impacto  de  multicolinearidade 
A  multicolinearidade  foi  uma  questão  em  outras  técnicas 
multivariadas  por  causa  da  dificuldade  em  discernir  o  ver¬ 
dadeiro  impacto  de  variáveis  multicolineares.  Em  análise 
de  agrupamentos  o  efeito  é  diferente,  porque  multicoline¬ 
aridade  é  na  realidade  uma  forma  de  ponderação  implíci¬ 
ta.  Comecemos  com  um  exemplo  que  ilustra  o  efeito  da 
multicoline  aridade. 


Suponha  que  respondentes  estejam  sendo  agrupados 
quanto  a  10  variáveis,  todas  declarações  de  atitudes  pe¬ 
rante  um  serviço.  Quando  a  multicolinearidade  é  exami¬ 
nada,  percebemos  que  há  dois  conjuntos  de  variáveis,  o 
primeiro  composto  de  oito  declarações  e  o  segundo  con¬ 
sistindo  das  duas  declarações  restantes.  Se  nosso  objeti¬ 
vo  é  realmente  agrupar  os  respondentes  nas  dimensões 
do  serviço  (neste  caso  representadas  pelos  dois  grupos 
de  variáveis),  então  o  uso  das  10  variáveis  originais  será 
bastante  enganoso.  Como  cada  variável  é  ponderada 
igualmente  em  análise  de  agrupamentos,  a  primeira  di¬ 
mensão  terá  quatro  vezes  mais  chances  (oito  itens  com¬ 
parados  com  dois)  de  afetar  a  medida  de  similaridade. 
Como  resultado,  a  similaridade  será  predominantemen¬ 
te  afetada  pela  primeira  dimensão  com  oito  itens  em  vez 
da  segunda  dimensão  com  dois  itens. 


Multicolinearidade  atua  como  um  processo  de  ponde¬ 
ração  não  visível  para  o  observador,  mas  que  afeta  a  análi¬ 
se.  Por  essa  razão,  o  pesquisador  é  encorajado  a  examinar 
as  variáveis  usadas  em  análise  de  agrupamentos  em  busca 
de  multicolinearidade  substancial,  e,  se  encontrada,  redu¬ 
zir  as  variáveis  a  números  iguais  em  cada  conjunto  ou  usar 
uma  das  medidas  de  distância,  como  a  de  Mahalanobis, 
que  compensa  essa  correlação. 


Uma  última  questão  é  sobre  o  uso  de  escores  fatoriais 
em  análise  de  agrupamentos.  O  debate  se  centra  na  pes¬ 
quisa,  mostrando  que  as  variáveis  que  verdadeiramen¬ 
te  discriminam  entre  os  grupos  inerentes  não  são  bem 
representadas  na  maioria  das  soluções  fatoriais.  Assim, 
quando  escores  fatoriais  são  empregados,  é  bem  possível 
que  uma  representação  ruim  da  verdadeira  estrutura  dos 
dados  seja  obtida  [23].  O  pesquisador  deve  lidar  tanto 
com  a  multicolinearidade  quanto  com  a  discriminação 
das  variáveis  para  atingir  a  melhor  representação  de  es¬ 
trutura. 

Estágio  4:  Determinação  de  agrupamentos 
e  avaliação  do  ajuste  geral 

Com  as  variáveis  de  agrupamento  selecionadas  e  a  matriz 
de  similaridade  calculada,  o  processo  de  partição  tem  iní¬ 
cio  (ver  Figura  8-6).  O  pesquisador  deve: 

•  Escolher  o  procedimento  de  partição  usado  para  formar 
agregados 

•  Decidir  o  número  de  agrupamentos  a  serem  formados. 

Ambas  as  decisões  têm  implicações  substanciais  não 
apenas  nos  resultados  que  serão  obtidos,  mas  também  na 
interpretação  que  pode  ser  obtida  a  partir  dos  resultados. 
Primeiro  examinamos  os  procedimentos  disponíveis  de 
partição  e  em  seguida  discutimos  as  opções  à  disposição 
para  decidir  sobre  uma  solução  definindo  o  número  de 
agrupamentos  e  a  pertinência  para  cada  observação. 

Procedimentos  de  partição 

A  primeira  pergunta  importante  a  responder  no  desen¬ 
volvimento  de  uma  solução  de  agrupamento  envolve  a 
escolha  do  procedimento  de  partição  (ou  seja,  o  conjunto 
de  regras  mais  apropriadas  para  colocar  objetos  seme¬ 
lhantes  em  grupos  ou  agregados).  Essa  não  é  uma  questão 
simples,  pois  centenas  de  programas  de  computador  que 
usam  diferentes  algoritmos  estão  disponíveis,  e  outros 
mais  estão  sempre  em  desenvolvimento.  O  critério  essen¬ 
cial  de  todos  os  algoritmos,  porém,  é  que  eles  tentam  ma¬ 
ximizar  as  diferenças  entre  agrupamentos  relativamente 
à  variação  dentro  dos  mesmos,  como  se  mostra  na  Figura 


-  REGRAS  PRÁTICAS  8-3  - 

Suposições  em  análise  de  agrupamentos 

•  Variáveis  de  entrada  devem  ser  examinadas 
quanto  a  substancial  multicolinearidade,  e  se  a 
multicolinearidade  se  confirmar: 

•  Reduzir  as  variáveis  a  números  iguais  em  cada 
conjunto  de  medidas  correlacionadas,  ou 

•  Usar  uma  medida  de  distância  que  compense  a 
correlação,  como  a  distância  de  Mahalanobis 
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8-7.  A  razão  entre  a  variação  entre  agrupamentos  e  varia¬ 
ção  interna  média  é  então  comparável  (mas  não  idêntica) 
à  razão  F  em  análise  de  variância. 

Uma  vasta  gama  de  procedimentos  de  partição  tem 
sido  desenvolvida  nas  disciplinas  em  que  a  análise  de  agru¬ 
pamentos  se  aplica.  Os  algoritmos  mais  comumente  usa¬ 
dos  podem  ser  classificados  como:  (1)  hierárquicos  e  (2) 
não-hierárquicos.  Diversos  outros  procedimentos  (p.ex., 
agrupamentos  fuzzy,  métodos  grafo-teóricos,  redes  neu- 


rais,  modelos  evolucionários  e  métodos  baseados  em  bus¬ 
ca)  estão  igualmente  disponíveis  [13, 15].  Devido  à  popu¬ 
laridade  das  abordagens  hierárquicas  e  não-hierárquicas 
de  partição,  nossa  discussão  será  limitada  às  mesmas. 

Procedimentos  hierárquicos  de  agrupamento 

Procedimentos  hierárquicos  envolvem  uma  série  de  n  -  1 
decisões  de  agrupamento  (sendo  n  o  número  de  observa¬ 
ções)  que  combinam  observações  em  uma  estrutura  de 


Estágio  4 


Métodos  hierárquicos 


Seleção  de  um  algoritmo  de  agrupamento 

É  hierárquico,  não-hierárquico  ou  uma 
combinação  dos  dois  métodos  usados? 


Métodos  não-hierárquicos 


Combinação 


Métodos  de  ligação  disponíveis:  Métodos  de  designação  disponíveis:  Usar  um  método  hierárquico  para 


Ligação  simples 
Ligação  completa 
Ligação  média 
Método  de  Ward 
Método  centróide 


Estágio  5 


Referência  sequencial 
Referência  paralela 
Otimização 

Seleção  de  pontos  sementes 

i 

Quantos  agrupamentos  são  formados? 

Examinar  aumentos  no  coeficiente  de  aglomeração 

■  Examinar  dendrograma  e  o  diagrama  vertical - 

Considerações  conceituais 


especificar  pontos  sementes  de 
agrupamento  para  um  método 
não-hierárquico 


Reespecificação  da  análise  de  agrupamentos 
Alguma  observação  foi  eliminada  como: 
Atípica? 

Membro  de  um  agrupamento  pequeno? 


Não 

^ 

Interpretação  dos  agrupamentos 

Examinar  centróides  de  agrupamento 
Nomear  agrupamentos  com  base  nas  variáveis 
de  agrupamento 


-Sim  - 


Estágio  6 


Validação  e  caracterização  dos  agrupamentos 

Validação  com  variáveis  de  resultado 
selecionadas 

Caracterização  com  variáveis  descritivas 
adicionais 


FIGURA  8-6  Estágios  4-6  do  diagrama  de  decisão  da  análise  de  agrupamentos. 
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- «-  Variação  entre  agrupamentos 

- «-  Variação  dentro  dos  agrupamentos 


FIGURA  8-7  Diagrama  de  agrupamento  mostrando  variação  entre  e  dentro  dos  agrupamentos. 


hierarquia  ou  do  tipo  árvore.  Os  dois  tipos  básicos  de  pro¬ 
cedimentos  hierárquicos  de  agrupamento  são  agiomerati- 
vos  e  divisivos.  Nos  métodos  aglomerativos,  cada  objeto 
ou  observação  começa  como  seu  próprio  agrupamento; 
nos  métodos  divisivos,  todas  as  observações  iniciam  com 
um  único  agrupamento  e  são  sucessivamente  divididas 
(primeiro  em  dois  agrupamentos,  depois  em  três  e  assim 
por  diante),  até  que  cada  observação  seja  um  agrupamen¬ 
to  unitário.  Na  Figura  8-8,  os  métodos  agiomerativos  se 
movem  da  esquerda  para  a  direita  e  os  divisivos  seguem 
da  direita  para  a  esquerda.  Como  os  pacotes  de  computa¬ 
dor  mais  comumente  usados  empregam  métodos  agiome¬ 
rativos,  e  peio  fato  de  métodos  divisivos  atuarem  quase 
como  métodos  agiomerativos  ao  contrário,  concentramo- 
nos  aqui  nas  técnicas  agiomerativas. 

Para  compreendermos  como  funciona  um  procedi¬ 
mento  hierárquico,  examinamos  a  forma  mais  comum  - 


o  método  agiomerativo  -  que  segue  um  processo  simpies 
e  repetitivo: 

1.  Começar  com  todas  as  observações  como  formando  seus 
próprios  agrupamentos  (ou  seja,  cada  observação  forma  um 
agrupamento  unitário),  de  forma  que  o  número  de  agrupa¬ 
mentos  seja  iguai  ao  de  observações. 

2.  Usando  a  medida  de  simiiaridade,  combinar  os  dois  agrupa¬ 
mentos  mais  parecidos  em  um  novo  (agora  contendo  duas 
observações),  reduzindo  assim  a  quantia  de  agrupamentos 
em  uma  unidade. 

3.  Repetir  o  processo  novamente,  usando  medida  de  similarida¬ 
de  para  combinar  os  dois  agrupamentos  mais  parecidos  em 
um  novo. 

4.  Continuar  este  processo,  combinando  em  cada  passo  os  dois 
agrupamentos  mais  semelhantes  em  um  novo.  Repetir  o 
processo  em  um  total  de  n  -  1  vezes  até  que  todas  as  obser¬ 
vações  estejam  contidas  em  um  só  agrupamento. 


Agiomerativo 


3  4  5 

-• - Divisivo 


FIGURA  8-8  Dendrograma  ilustrando  agrupamento  hierárquico. 
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Considere  que  temos  100  observações.  Começaríamos 
inicialmente  com  100  agrupamentos  separados,  cada 
um  contendo  uma  observação.  No  primeiro  passo,  os 
dois  agrupamentos  mais  parecidos  seriam  combinados, 
deixando-nos  com  99  agrupamentos.  No  próximo  passo, 
combinamos  os  dois  agrupamentos  mais  parecidos,  de 
forma  que  ficamos  então  com  98.  Este  processo  continua 
até  o  último  passo,  no  qual  dois  agrupamentos  remanes¬ 
centes  são  combinados  em  um  único. 


Uma  característica  importante  dos  procedimentos 
hierárquicos  é  que  os  resultados  de  um  estágio  anterior 
são  sempre  aninhados  com  os  resultados  de  um  estágio 
posterior,  criando  algo  parecido  com  uma  árvore.  Por 
exemplo,  uma  solução  de  seis  agrupamentos  é  obtida  pela 
junção  de  dois  dos  agrupamentos  encontrados  no  estágio 
de  sete  agregados.  Como  os  agrupamentos  são  formados 
apenas  pela  junção  de  agrupamentos  existentes,  qualquer 
elemento  de  um  agregado  pode  delinear  sua  pertinência 
em  um  caminho  ininterrupto  até  seu  início  como  uma  ob¬ 
servação  isolada.  Esse  processo  é  exibido  na  Figura  8-8;  a 
representação  é  chamada  de  dendrograma  ou  gráfico  em 
árvore.  Um  outro  método  gráfico  popular  é  o  diagrama 
vertical. 

Algoritmos  de  agrupamento.  O  algoritmo  de  aglome¬ 
ração  em  um  procedimento  hierárquico  determina  como 
similaridade  é  definida  entre  agrupamentos  de  múltiplos 
membros  no  processo.  Já  discutimos  os  métodos  (corre¬ 
lação,  distância  ou  associação)  usados  para  medir  simila¬ 
ridade  entre  observações.  Portanto,  como  medimos  simi¬ 
laridade  entre  agrupamentos  quando  um  deles  ou  ambos 
apresentam  múltiplos  membros?  Selecionamos  um  mem¬ 
bro  para  atuar  como  elemento  típico  e  medimos  similari¬ 
dade  entre  esses  membros  de  cada  agrupamento,  criamos 
algum  membro  composto  para  representar  o  agrupamen¬ 
to,  combinamos  similaridades  entre  todos  os  membros 
de  cada  agrupamento?  Poderíamos  empregar  qualquer 
uma  dessas  abordagens,  ou  até  mesmo  estabelecer  outras 
maneiras  de  medir  similaridade  entre  agrupamentos  de 
múltiplos  membros.  Entre  numerosas  metodologias,  os 
cinco  algoritmos  aglomera tivos  mais  populares  são  (1)  li¬ 
gação  individual,  (2)  ligação  completa,  (3)  ligação  média, 
(4)  método  centróide  e  (5)  método  de  Ward.  Em  nossas 
discussões,  usamos  distância  como  medida  de  similarida¬ 
de  entre  observações,  mas  outras  medidas  poderiam  ser 
igualmente  utilizadas. 

Ligação  simples.  O  método  de  ligação  simples  (tam¬ 
bém  conhecido  como  método  do  vizinho  mais  próximo) 
define  a  semelhança  entre  agrupamentos  como  a  menor 
distância  de  qualquer  objeto  de  um  agrupamento  a  qual¬ 
quer  objeto  no  outro.  Tal  regra  foi  aplicada  no  exemplo 
do  início  deste  capítulo  e  permite  usar  a  matriz  original  de 
distância  entre  observações  sem  calcular  novas  medidas. 


Basta  encontrar  todas  as  distâncias  entre  observações  nos 
dois  agrupamentos  e  escolher  a  menor  como  medida  de 
similaridade  entre  agrupamentos. 

Tal  abordagem  é  provavelmente  o  algoritmo  aglo- 
merativo  mais  versátil,  pois  ele  pode  definir  uma  vasta 
gama  de  padrões  de  aglomeração  (p.ex.,  pode  represen¬ 
tar  agrupamentos  que  são  círculos  concêntricos,  como  os 
anéis  de  um  alvo).  Esta  flexibilidade  também  cria  proble¬ 
mas,  porém,  quando  os  agrupamentos  são  mal  delinea¬ 
dos.  Em  tais  casos,  procedimentos  de  ligação  simples  po¬ 
dem  formar  longas  e  sinuosas  cadeias  [15, 20].  Indivíduos 
nos  extremos  opostos  de  uma  cadeia  podem  ser  diferen¬ 
tes,  apesar  de  ainda  estarem  no  mesmo  agrupamento. 
Muitas  vezes,  a  presença  de  tais  cadeias  pode  contrastar 
com  os  objetivos  de  se  obterem  os  agrupamentos  mais 
compactos.  Assim,  o  pesquisador  deve  examinar  cuida¬ 
dosamente  os  padrões  de  observação  dentro  dos  agru¬ 
pamentos  para  averiguar  se  tais  cadeias  estão  ocorren¬ 
do.  Isto  se  torna  cada  vez  mais  difícil  por  meios  gráficos 
quando  o  número  de  variáveis  de  agrupamento  aumenta, 
e  requer  que  o  pesquisador  caracterize  cuidadosamente 
a  homogeneidade  interna  entre  as  observações  em  cada 
agrupamento. 


Um  exemplo  dessa  situação  é  mostrado  na  Figura  8-9. 
Três  agrupamentos  (A,  B  e  C)  devem  ser  reunidos.  O 
algoritmo  de  ligação  simples,  concentrando-se  apenas 
nos  pontos  mais  próximos  de  cada  agregado,  conectaria 
os  agrupamentos  A  e  B  por  causa  de  sua  pequena  dis¬ 
tância  nos  extremos  dos  agrupamentos.  A  reunião  dos 
agregados  A  e  B  cria  um  agrupamento  que  circunda 
C.  Mesmo  assim,  ao  procurar  homogeneidade  interna, 
seria  muito  melhor  juntar  C  com  A  ou  B.  Essa  figura 
mostra  a  principal  desvantagem  do  algoritmo  de  liga¬ 
ção  simples. 


Ligação  completa.  O  método  de  ligação  comple¬ 
ta  (também  conhecido  como  o  método  do  vizinho  mais 
distante  ou  o  método  do  diâmetro)  é  comparável  ao  da 
ligação  simples,  exceto  que  a  similaridade  de  agrupamen¬ 
to  se  baseia  em  distância  máxima  entre  observações  em 
cada  agrupamento.  Similaridade  entre  agrupamentos  é  a 
menor  esfera  (diâmetro  mínimo)  que  pode  incluir  todas 
as  observações  em  ambos  os  agrupamentos.  Esse  método 
é  chamado  de  ligação  completa  porque  todos  os  objetos 
em  um  agrupamento  são  conectados  uns  com  os  outros  a 
alguma  distância  máxima.  Assim,  a  similaridade  interna 
se  iguala  ao  diâmetro  do  grupo. 

Essa  técnica  elimina  o  problema  de  encadeamento 
identificado  na  ligação  simples,  e  descobriu-se  que  ela  gera 
as  soluções  mais  compactas  [3].  Ainda  que  ela  represente 
apenas  um  aspecto  dos  dados  (ou  seja,  a  maior  distância 
entre  membros),  muitos  pesquisadores  a  consideram  a 
mais  apropriada  para  inúmeras  aplicações  [12]. 
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FIGURA  8-9  Exemplo  de  uma  ligação  simples  unindo  agrupamentos  distintos  A  e  B. 


A  Figura  8-10  compara  as  menores  (ligação  simples)  e  as 
maiores  (ligação  completa)  distâncias  que  representam 
similaridade  entre  agrupamentos.  Ambas  as  medidas  re¬ 
fletem  apenas  um  aspecto  dos  dados.  O  uso  da  ligação 
simples  reflete  somente  um  par  de  objetos  mais  próxi¬ 
mos,  e  a  ligação  completa  também  reflete  um  único  par, 
desta  vez  os  dois  mais  extremos. 


Ligação  média.  O  método  de  ligação  média  dife¬ 
re  dos  procedimentos  de  ligação  simples  e  completa  no 
sentido  de  que  a  similaridade  de  quaisquer  dois  agrupa¬ 
mentos  é  a  similaridade  média  de  todos  os  indivíduos  em 
um  agrupamento  com  todos  os  indivíduos  em  outro.  Este 
algoritmo  não  depende  de  valores  extremos  (pares  mais 
próximos  ou  mais  afastados),  como  ocorre  com  ligação 
simples  ou  completa.  Em  vez  disso,  a  similaridade  é  ba¬ 
seada  em  todos  os  elementos  dos  agregados,  e  não  em  um 
único  par  de  membros  extremos,  e  é  desse  modo  menos 


afetada  por  observações  atípicas.  Abordagens  de  ligação 
média,  como  um  tipo  de  meio-termo  entre  métodos  de  li¬ 
gação  simples  e  completa,  tendem  a  gerar  agregados  com 
pequena  variação  interna.  Elas  também  tendem  a  produ¬ 
zir  agregados  com  aproximadamente  a  mesma  variância 
interna. 

Método  centróide.  No  método  centróide,  a  similari¬ 
dade  entre  dois  agrupamentos  é  a  distância  entre  seus  cen- 
tróides.  Centróides  são  os  valores  médios  das  observações 
sobre  as  variáveis  na  variável  estatística  de  agrupamen¬ 
to.  Neste  método,  toda  vez  que  indivíduos  são  reunidos, 
um  novo  centróide  é  computado.  Os  centróides  migram 
quando  ocorrem  fusões  de  agregados.  Em  outras  pala¬ 
vras,  existe  uma  mudança  no  centróide  do  agrupamento 
toda  vez  que  um  novo  indivíduo  ou  grupo  de  indivíduos  é 
acrescentado  a  um  agregado  já  existente. 

Esses  métodos  são  os  mais  populares  nas  ciências  físi¬ 
cas  (p.ex.,  biologia)  mas  podem  produzir  resultados  fre- 


Ligação  simples 


Ligação  completa 


FIGURA  8-10  Comparação  de  medidas  de  distância  para  ligação  simples  e  completa. 
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qüentemente  confusos.  A  confusão  acontece  por  causa  de 
inversões,  ou  seja,  casos  em  que  a  distância  entre  os  cen- 
tróides  de  um  par  pode  ser  menor  do  que  a  distância  entre 
os  centróides  de  outro  par  fundido  em  uma  combinação 
anterior.  A  vantagem  desse  método,  como  o  método  de 
ligação  média,  é  que  ele  é  menos  afetado  por  observações 
atípicas  do  que  outros  métodos  hierárquicos. 

Método  de  Word.  O  método  de  Ward  difere  das  téc¬ 
nicas  anteriores  no  sentido  de  que  a  similaridade  entre 
dois  agrupamentos  não  é  uma  única  medida  de  similari¬ 
dade,  mas  a  soma  dos  quadrados  dentro  dos  agrupamen¬ 
tos  feita  sobre  todas  as  variáveis.  É  muito  parecido  com  a 
medida  de  heterogeneidade  simples  usada  no  exemplo  do 
início  do  capítulo  para  auxiliar  na  determinação  do  núme¬ 
ro  de  agrupamentos.  No  procedimento  de  Ward,  a  seleção 
de  qual  par  de  agrupamentos  a  combinar  é  baseada  em 
qual  combinação  de  agregados  minimiza  a  soma  interna 
de  quadrados  no  conjunto  completo  de  agrupamentos  se¬ 
parados  ou  disjuntos.  Em  cada  passo,  os  dois  agrupamen¬ 
tos  combinados  são  aqueles  que  minimizam  o  aumento  na 
soma  total  de  quadrados  em  todas  as  variáveis  em  todos 
os  agrupamentos. 

Esse  procedimento  tende  a  combinar  agrupamentos 
com  um  pequeno  número  de  observações,  pois  a  soma  de 
quadrados  é  diretamente  relacionada  com  o  número  de 
observações  envolvidas.  O  uso  de  uma  medida  de  soma 
de  quadrados  torna  este  método  facilmente  distorcido  por 
observações  atípicas  [17].  Além  disso,  o  método  de  Ward 
também  tende  a  produzir  agregados  com  aproximada¬ 
mente  o  mesmo  número  de  observações.  Se  o  pesquisador 
espera  ou  deseja  que  os  padrões  de  agrupamento  reflitam 
agregados  com  aproximadamente  o  mesmo  tamanho,  en¬ 
tão  tal  técnica  é  bastante  adequada.  Contudo,  o  empre¬ 
go  desta  abordagem  também  torna  mais  difícil  identificar 
agrupamentos  que  representem  pequenas  proporções  da 
amostra. 

Visão  geral.  Procedimentos  de  agrupamento  hierárqui¬ 
co  são  uma  combinação  de  um  processo  repetitivo  para 
agregar  com  um  algoritmo  de  agrupamento,  para  definir 
a  similaridade  entre  agregados  com  múltiplos  membros. 
O  processo  de  criação  de  agrupamentos  gera  um  diagra¬ 
ma  em  árvore  que  representa  as  combinações/divisões  de 
agrupamentos  para  formar  o  intervalo  completo  de  solu¬ 
ções.  Deve  ser  observado  que  procedimentos  hierárqui¬ 
cos  geram  um  conjunto  completo  de  soluções,  variando 
de  agregados  em  que  todos  são  unitários  até  a  solução  de 
um  só  agrupamento  no  qual  todas  as  observações  estão 
em  um  só  conjunto.  Fazendo  isso,  o  procedimento  hierár¬ 
quico  fornece  um  excelente  referencial  para  se  comparar 
qualquer  conjunto  de  soluções  de  agrupamentos. 

Procedimentos  não- hierárquicos  de  agrupamento 

Diferentemente  dos  métodos  hierárquicos,  os  procedi¬ 
mentos  não-hierárquicos  não  envolvem  o  processo  de 


construção  em  árvore.  Em  vez  disso,  designam  objetos  a 
agrupamentos  assim  que  o  número  de  agregados  a  serem 
formados  tenha  sido  especificado.  Por  exemplo,  uma  solu¬ 
ção  de  seis  agrupamentos  não  é  apenas  uma  combinação 
de  dois  agrupamentos  a  partir  da  solução  de  sete  agrega¬ 
dos,  mas  é  baseada  apenas  na  descoberta  da  melhor  solu¬ 
ção  com  seis  agregados.  O  processo  essencialmente  tem 
dois  passos: 

1.  Especificar  sementes  de  agrupamento:  A  primeira  tarefa  é 
identificar  pontos  de  partida,  conhecidos  como  sementes  de 
agrupamento,  para  cada  agregado.  Uma  semente  de  agru¬ 
pamento  pode  ser  pré-especificada  pelo  pesquisador  ou  ob¬ 
servações  podem  ser  escolhidas,  geralmente  em  um  proces¬ 
so  aleatório. 

2.  Designação:  Com  as  sementes  de  agrupamento  definidas, 
o  próximo  passo  é  designar  cada  observação  a  uma  das  se¬ 
mentes  de  agrupamento  com  base  em  similaridade.  Mui¬ 
tas  abordagens  estão  disponíveis  para  fazer  tal  designação 
(ver  discussão  adiante  nesta  seção),  mas  o  objetivo  básico 
é  designar  cada  observação  à  semente  mais  parecida.  Em 
algumas  abordagens,  observações  podem  ser  redesignadas 
a  agrupamentos  que  são  mais  semelhantes  do  que  suas  de¬ 
signações  originais. 

Discutimos  na  próxima  seção  diferentes  técnicas  para 
escolher  sementes  de  agrupamento  e  para  designar  ob¬ 
jetos. 

Seleção  de  pontos  sementes.  Ainda  que  os  algoritmos 
não-hierárquicos  de  agrupamento  discutidos  na  próxima 
seção  se  diferenciem  na  maneira  como  eles  designam  ob¬ 
servações  aos  pontos  sementes,  todos  eles  enfrentam  o 
mesmo  problema:  como  escolhemos  as  sementes  de  agru¬ 
pamento?  As  diferentes  abordagens  podem  ser  classifica¬ 
das  em  duas  categorias  básicas: 

1.  Especificada  pelo  pesquisador.  Nesta  técnica,  o  pesquisador 
fornece  os  pontos  sementes  baseado  em  dados  externos.  As 
duas  fontes  mais  comuns  de  pontos  sementes  são  pesquisas 
anteriores  ou  dados  de  outra  análise  multivariada.  Muitas 
vezes  o  pesquisador  tem  conhecimento  sobre  os  perfis  de 
agrupamento  pesquisados.  Por  exemplo,  uma  pesquisa  an¬ 
terior  pode  ter  definido  perfis  de  segmento,  e  a  tarefa  da 
análise  de  agrupamentos  é  designar  indivíduos  ao  agrupa¬ 
mento  de  segmento  mais  apropriado.  É  possível  também 
que  outras  técnicas  multivariadas  possam  ser  usadas  para 
gerar  os  pontos  semente.  Um  exemplo  comum  é  o  emprego 
de  um  algoritmo  hierárquico  de  agrupamento  para  estabe¬ 
lecer  o  número  de  agregados  e  então  gerar  pontos  semente 
a  partir  desses  resultados  (uma  descrição  mais  detalhada 
desta  técnica  está  contida  na  próxima  seção).  O  elemento 
em  comum  é  que  o  pesquisador,  ao  mesmo  tempo  que  sabe 
a  quantia  de  agregados  a  serem  formados,  tem  também  in¬ 
formação  sobre  o  caráter  básico  desses  agrupamentos. 

2.  Gerada  pela  amostra.  A  segunda  técnica  é  gerar  as  sementes 
a  partir  de  observações  da  amostra,  de  maneira  sistemática 
ou  simplesmente  através  de  seleção  ao  acaso.  Por  exemplo, 
no  programa  FASTCLUS  em  SAS,  a  primeira  semente  é  a 
primeira  observação  no  conjunto  de  dados  sem  valores  per¬ 
didos.  A  segunda  semente  é  a  próxima  observação  completa 
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(sem  dados  perdidos)  que  é  separada  da  primeira  semente 
por  uma  distância  mínima  especificada.  A  opção  padrão  é 
uma  distância  mínima  nula.  Depois  que  todas  as  sementes 
foram  selecionadas,  o  programa  designa  cada  observação  ao 
agrupamento  com  a  semente  mais  próxima.  O  pesquisador 
pode  especificar  que  as  sementes  sejam  revisadas  (atualiza¬ 
das)  pelo  cálculo  das  médias  de  agrupamento  de  sementes 
cada  vez  que  uma  observação  é  designada.  Em  contraste, 
o  programa  QUICK  CLUSTER  em  SPSS  pode  selecionar 
aleatoriamente  os  pontos  sementes  necessários  a  partir  das 
observações.  Em  qualquer  uma  dessas  técnicas,  o  pesquisa¬ 
dor  confia  no  processo  de  seleção  para  escolher  pontos  se¬ 
mentes  que  refiitam  agrupamentos  naturais  como  pontos  de 
partida  para  os  algoritmos  de  agrupamento.  Uma  limitação 
é  que  a  repetição  dos  resultados  é  difícil  se  as  observações 
são  reordenadas  ou  se  o  processo  de  seleção  aleatória  é  ini¬ 
ciado  unicamente  cada  vez. 

Em  qualquer  uma  das  abordagem  o  pesquisador  deve 
estar  ciente  do  impacto  do  processo  de  escolha  da  semen¬ 
te  sobre  os  resultados  finais.  Todos  os  algoritmos  de  agru¬ 
pamento,  incluindo  aqueles  de  natureza  de  otimização 
(ver  discussão  adiante),  geram  diferentes  soluções,  depen¬ 
dendo  das  sementes  iniciais.  Espera-se  que  as  diferenças 
entre  soluções  de  agrupamento  sejam  mínimas  ao  se  usar 
diferentes  sementes,  mas  elas  enfatizam  a  importância  da 
seleção  de  sementes  e  seu  impacto  na  solução  final. 

Algoritmos  de  agrupamento  não-hierárquico.  Com  as 

sementes  definidas,  o  pesquisador  deve  agora  escolher  um 
dos  três  algoritmos  de  agrupamento  [9].  Todos  eles  são 
freqüentemente  chamados  de  agrupamentos  de  i^-mé- 
dias,  e  eles  são  parecidos  em  seu  método  básico  para  de¬ 
signar  observações  a  agrupamentos,  mas  variam  no  grau 
em  que  cada  observação  pode  ser  novamente  designada 
entre  agrupamentos  após  a  designação  inicial. 

Referência  seqüencial.  O  método  da  referência 
seqüencial  começa  pela  seleção  de  uma  semente  de 
agrupamento  e  inclui  todos  os  objetos  dentro  de  uma 
distância  pré-especificada.  Quando  todos  os  objetos 
dentro  da  distância  são  incluídos,  uma  segunda  semente 
de  agrupamento  é  selecionada  e  todos  os  objetos  dentro 
da  distância  pré-especificada  são  incluídos.  Em  seguida, 
uma  terceira  semente  é  selecionada  e  o  processo  con¬ 
tinua  como  anteriormente.  A  principal  desvantagem 
desta  técnica  é  que  quando  um  objeto  é  designado  a  um 
agrupamento,  ele  não  pode  ser  novamente  designado 
a  outro  agrupamento,  mesmo  que  a  semente  seja  mais 
parecida. 

Referência  paralela.  Em  contraste,  o  método  da 
referência  paralela  considera  todas  as  sementes  de  agru¬ 
pamento  simultaneamente  e  designa  observações  dentro 
da  distância  de  referência  até  a  semente  mais  próxima.  A 
medida  que  o  processo  evolui,  as  distâncias  de  referência 
podem  ser  ajustadas  para  incluir  menos  ou  mais  observa¬ 
ções  nos  agrupamentos.  Além  disso,  em  algumas  variantes 


desse  método,  observações  permanecem  não  agrupadas  se 
estiverem  fora  da  distância  de  referência  pré-especificada 
a  partir  de  qualquer  semente  de  agrupamento. 

Otimização.  O  terceiro  método,  chamado  de  pro¬ 
cedimento  de  otimização,  é  semelhante  aos  outros  dois 
métodos  não-hierárquicos,  exceto  em  que  ele  permite  a 
redesignação  de  observações.  Se,  no  curso  da  designação 
de  observações,  uma  delas  se  torna  mais  próxima  de  um 
outro  agregado  que  não  é  o  agrupamento  no  qual  ela  está 
associada  no  momento,  então  um  procedimento  de  otimi¬ 
zação  transfere  a  observação  para  o  agregado  mais  seme¬ 
lhante  (mais  próximo). 

Métodos  hierárquicos  ou  não- 
hierárquicos  devem  ser  usados? 

Uma  resposta  definitiva  a  essa  questão  não  pode  ser  dada 
por  dois  motivos.  Primeiro,  o  problema  de  pesquisa  em 
mãos  pode  sugerir  um  método  ou  o  outro.  Segundo,  o  que 
aprendemos  com  aplicação  contínua  a  um  contexto  em 
particular  pode  sugerir  um  método  em  vez  de  outro  como 
mais  adequado  para  aquele  contexto.  Podemos  examinar 
as  vantagens  e  desvantagens  de  cada  método  para  deter¬ 
minar  qual  é  mais  adequado  para  um  dado  ambiente  de 
pesquisa. 

Prós  e  contras  de  métodos  hierárquicos.  Técnicas  de 
agrupamento  hierárquico  são  há  muito  as  mais  popula¬ 
res,  sendo  o  método  de  Ward  e  a  ligação  média  prova¬ 
velmente  os  mais  facilmente  disponíveis  [17].  Além  do 
fato  de  que  procedimentos  hierárquicos  foram  os  pri¬ 
meiros  métodos  de  agrupamento  desenvolvidos,  eles 
ainda  oferecem  várias  vantagens  que  resultam  em  seu 
amplo  uso: 

1.  Simplicidade:  Técnicas  hierárquicas,  com  seu  desenvolvi¬ 
mento  de  estruturas  em  árvore  retratando  o  processo  de 
agrupamento,  equipam  o  pesquisador  com  uma  descrição 
simples,  ainda  que  abrangente,  de  todo  o  intervalo  de  so¬ 
luções  de  agrupamento.  Fazendo  isso,  o  pesquisador  pode 
avaliar  qualquer  uma  das  soluções  possíveis  a  partir  de 
uma  análise. 

2.  Medidas  de  similaridade:  O  amplo  uso  dos  métodos  hierár¬ 
quicos  conduz  a  um  extenso  desenvolvimento  de  medidas 
de  similaridade  para  praticamente  quaisquer  tipos  de  variá¬ 
veis  de  agrupamento.  Técnicas  hierárquicas  podem  ser  apli¬ 
cadas  a  quase  todo  tipo  de  questão  de  pesquisa. 

3.  Rapidez:  Os  procedimentos  hierárquicos  têm  a  vantagem  de 
gerarem  o  conjunto  inteiro  de  soluções  de  agrupamento  (de 
todos  os  agrupamentos  separados  a  um  só)  de  uma  maneira 
oportuna.  Tal  habilidade  permite  ao  pesquisador  examinar 
uma  vasta  gama  de  soluções  alternativas,  variando  medidas 
de  similaridade  e  métodos  de  ligação  de  uma  maneira  efi¬ 
ciente. 

Ainda  que  técnicas  hierárquicas  tenham  sido  bastante 
usadas,  elas  apresentam  diversas  desvantagens  que  afe¬ 
tam  todas  as  suas  soluções: 
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1.  Métodos  hierárquicos  podem  ser  enganosos,  pois  combina¬ 
ções  iniciais  indesejáveis  podem  persistir  na  análise  e  con¬ 
duzir  a  resultados  artificiais.  Uma  preocupação  específica 
é  o  impacto  substancial  de  observações  atípicas  nos  méto¬ 
dos  hierárquicos,  particularmente  com  o  método  de  ligação 
completa. 

2.  Para  reduzir  o  impacto  de  observações  atípicas,  o  pesquisa¬ 
dor  pode  querer  analisar  os  dados  em  grupo  diversas  vezes, 
e  a  cada  momento  eliminar  observações  problemáticas  ou 
atípicas.  A  eliminação  de  casos,  contudo,  mesmo  dos  que 
não  forem  tidos  como  atípicos,  muitas  vezes  pode  distorcer 
a  solução.  Assim,  o  pesquisador  deve  ter  extremo  cuidado 
na  eliminação  de  observações  por  qualquer  razão. 

3.  Apesar  de  a  computação  do  processo  de  agrupamentos 
ser  relativamente  rápida,  os  métodos  hierárquicos  não  são 
tratáveis  para  analisar  amostras  muito  grandes.  Quando 
o  tamanho  amostrai  aumenta,  as  exigências  de  armazena¬ 
mento  de  dados  aumentam  dramaticamente.  Por  exem¬ 
plo,  uma  amostra  de  400  casos  demanda  armazenamento 
de  aproximadamente  80.000  similaridades,  o  que  aumenta 
para  quase  125.000  em  uma  amostra  de  500.  Mesmo  com 
os  avanços  tecnológicos  dos  computadores  pessoais  de  hoje, 
tais  exigências  podem  limitar  a  aplicação  em  muitos  casos. 
O  pesquisador  pode  considerar  uma  amostra  aleatória  das 
observações  originais  para  reduzir  o  tamanho  amostrai,  mas 
agora  deve  questionar  a  representatividade  da  amostra  to¬ 
mada  a  partir  da  amostra  original. 

Surgimento  de  métodos  não-hierárquicos.  Os  métodos 
não-hierárquicos  obtiveram  crescente  aceitabilidade  e 
uso,  mas  qualquer  aplicação  depende  da  habilidade  do 
pesquisador  para  selecionar  os  pontos  sementes  de  acor¬ 
do  com  alguma  base  prática,  objetiva  ou  teórica.  Nesses 
casos,  os  métodos  não-hierárquicos  têm  diversas  vanta¬ 
gens  sobre  as  técnicas  hierárquicas. 

1.  Os  resultados  são  menos  suscetíveis  a  observações  atípicas 
nos  dados,  à  medida  de  distância  usada  e  à  inclusão  de  va¬ 
riáveis  irrelevantes  ou  inadequadas. 

2.  Métodos  não-hierárquicos  podem  analisar  conjuntos  ex¬ 
tremamente  grandes  de  dados,  pois  eles  não  demandam  o 
cálculo  de  matrizes  de  similaridade  entre  todas  as  observa¬ 
ções,  mas  somente  a  similaridade  de  cada  observação  com 
os  centróides  de  agrupamento.  Mesmo  os  algoritmos  de  oti¬ 
mização  que  permitem  a  redesignação  de  observações  entre 
agrupamentos  podem  ser  prontamente  aplicados  em  todos 
os  tamanhos  de  conjuntos  de  dados. 

Apesar  de  métodos  não-hierárquicos  apresentarem 
várias  vantagens,  algumas  deficiências  podem  afetar  con¬ 
sideravelmente  o  emprego  dos  mesmos  em  muitos  tipos 
de  aplicação. 

1.  Os  benefícios  de  qualquer  método  não-hierárquico  são  per¬ 
cebidos  apenas  com  o  emprego  de  pontos  sementes  não-ale¬ 
atórios  (ou  seja,  especificados).  Assim,  o  uso  de  técnicas  não- 
hierárquicas  com  pontos  sementes  aleatórios  é  geralmente 
considerado  inferior  em  relação  às  técnicas  hierárquicas. 

2.  Mesmo  uma  solução  inicial  não-aleatória  não  garante  um 
agrupamento  ótimo  de  observações.  Na  verdade,  em  muitos 
casos,  o  pesquisador  conseguirá  uma  solução  final  diferente 


para  cada  conjunto  de  pontos  sementes  especificados.  Como 
o  pesquisador  irá  selecionar  a  resposta  ótima?  Somente  com 
a  análise  e  validação  o  pesquisador  pode  selecionar  o  que 
é  considerado  a  melhor  representação  de  estrutura,  perce¬ 
bendo  que  muitas  alternativas  podem  ser  aceitáveis. 

3.  Métodos  não-hierárquicos  também  não  são  tão  eficientes 
quando  se  examinam  grandes  quantias  de  soluções  poten¬ 
ciais  de  agrupamento.  Cada  solução  é  uma  análise  em  sepa¬ 
rado,  em  contraste  com  as  técnicas  hierárquicas  que  geram 
todas  as  soluções  possíveis  em  uma  só  análise.  Logo,  técni¬ 
cas  não-hierárquicas  não  demonstram  serem  tão  adequadas 
na  exploração  de  um  grande  intervalo  de  soluções  com  base 
em  elementos  que  variam  como  medidas  de  similaridade, 
observações  incluídas  e  potenciais  sementes. 

Uma  combinação  de  ambos  os  métodos.  Com  cada 
abordagem  tendo  distintas  vantagens  e  desvantagens,  há 
quem  proponha  que  se  usem  ambas  (hierárquica  e  não- 
hierárquica)  para  conseguir  os  benefícios  de  cada  uma 
[f7].  Fazendo  isso,  as  vantagens  de  cada  método  são  utili¬ 
zadas  para  compensar  as  desvantagens  do  outro,  o  que  se 
consegue  em  dois  passos: 

1.  Primeiro,  uma  técnica  hierárquica  é  usada  para  gerar  um 
conjunto  completo  de  soluções,  estabelecer  as  soluções  apli¬ 
cáveis  (ver  próxima  seção  para  uma  discussão  sobre  este 
tópico),  caracterizar  os  centros  de  agrupamentos  para  atua¬ 
rem  como  pontos  sementes,  e  identificar  quaisquer  observa¬ 
ções  atípicas  óbvias. 

2.  Depois  que  os  casos  atípicos  foram  eliminados,  as  demais 
observações  podem  então  ser  agrupadas  por  um  método 
não-hierárquico  com  os  centros  de  grupos  dos  resultados 
hierárquicos  como  os  pontos  sementes  iniciais. 

Desse  modo,  as  vantagens  dos  métodos  hierárquicos 
são  complementadas  pela  habilidade  dos  métodos  não- 
hierárquicos  para  refinar  os  resultados,  pela  possibilidade 
de  alteração  de  pertinência  a  grupos. 

A  análise  de  agrupamentos  deve  ser  reespecificada? 

Mesmo  antes  de  identificar  uma  solução  aceitável  de  aná¬ 
lise  de  agrupamento  (ver  próxima  seção),  o  pesquisador 
deve  examinar  a  estrutura  fundamental  representada  nos 
grupos  definidos.  De  particular  interesse  são  os  tamanhos 
de  agrupamentos  amplamente  diferentes  ou  agrupamen¬ 
tos  de  apenas  uma  ou  duas  observações.  Geralmente, 
agrupamentos  de  um  só  membro  ou  muito  pequenos  não 
são  aceitáveis  dados  os  objetivos  da  pesquisa  e,  assim,  de¬ 
vem  ser  eliminados. 

Os  pesquisadores  devem  examinar  os  tamanhos  de 
agrupamentos  que  sejam  muito  distintos  a  partir  de  uma 
perspectiva  conceituai,  comparando  os  resultados  reais 
com  as  expectativas  formadas  nos  objetivos  da  pesquisa. 
Mais  problemáticos  são  os  agrupamentos  unitários,  os 
quais  podem  ser  casos  atípicos  não  detectados  em  análises 
anteriores.  Se  um  agrupamento  unitário  (ou  com  tamanho 
muito  pequeno,  comparado  com  outros  grupos)  surgir,  o 
pesquisador  deve  decidir  se  ele  representa  uma  compo¬ 
nente  estrutural  válida  na  amostra  ou  se  deve  ser  elimi- 
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nado  como  não-representativo.  Se  alguma  observação  for 
eliminada,  especialmente  quando  soluções  hierárquicas 
são  empregadas,  o  pesquisador  deve  novamente  executar 
a  análise  de  agrupamentos  e  recomeçar  o  processo  de  de¬ 
finição  de  grupos. 

Quantos  agrupamentos  devem  ser  formados? 

Talvez  a  questão  mais  desconcertante  para  qualquer  pes¬ 
quisador  que  executa  uma  análise  de  agrupamentos  hie¬ 
rárquica  ou  não-hierárquica  seja  a  determinação  do  nú¬ 
mero  de  agrupamentos  mais  representativos  da  estrutura 
de  dados  da  amostra  [6].  Tal  decisão  é  crítica  para  técnicas 
hierárquicas,  pois  ainda  que  o  processo  gere  um  conjun¬ 
to  completo  de  soluções  de  agrupamento,  o  pesquisador 
deve  escolher  as  soluções  que  representam  a  estrutura  de 
dados  (também  conhecida  como  a  regra  de  parada).  Esta 
decisão  também  é  encarada  pelo  pesquisador  em  análises 


não-hierárquicas  quando  a  melhor  solução  deve  ser  sele¬ 
cionada  entre  duas  ou  mais  soluções. 

Infelizmente,  não  existe  um  procedimento  de  seleção 
padrão  e  objetivo  [5,  11].  Como  não  há  critério  estatísti¬ 
co  interno  usado  para  inferência,  como  os  testes  de  sig- 
nificância  estatística  de  outros  métodos  multivariados,  os 
pesquisadores  desenvolveram  muitos  critérios  para  tratar 
do  problema.  Os  principais  problemas  que  surgem  diante 
dessas  regras  de  parada  incluem  os  seguintes: 

•  Esses  procedimentos  ad  hoc  devem  ser  computados  pelo 
pesquisador  e  muitas  vezes  envolvem  técnicas  bastante 
complexas  [1, 18]. 

•  Muitos  desses  critérios  são  específicos  de  um  programa  par¬ 
ticular  de  computador  e  não  são  facilmente  calculados  se 
não  forem  fornecidos  pelo  programa. 

•  Um  aumento  natural  na  heterogeneidade  surge  a  partir  da 
redução  no  número  de  agrupamentos.  Assim,  o  pesquisador 


-  REGRAS  PRÁTICAS  8-4  - 

Obtenção  de  agrupamentos 

•  Métodos  hierárquicos  de  agrupamento  diferem  na  metodologia  de  representação  de  similaridade  entre  agrupamentos,  cada 
um  com  vantagens  e  desvantagens: 

•  Ligação  simples  é  provavelmente  o  algoritmo  mais  versátil,  mas  estruturas  de  agrupamento  mal  planejadas  dentro  dos 
dados  produzem  cadeias  sinuosas  de  agrupamentos  inaceitáveis 

•  Ligação  completa  elimina  o  problema  de  encadeamento,  mas  considera  apenas  as  observações  mais  extremas  de  um 
agrupamento,  sendo  afetada,  portanto,  por  observações  atípicas 

•  Ligação  média  é  baseada  na  similaridade  média  de  todos  os  indivíduos  em  um  agrupamento  e  tende  a  gerar  agregados 
com  pouca  variação  interna  e  é  menos  afetada  por  observações  atípicas 

•  Ligação  centróide  mede  distância  entre  centróides  de  agrupamento  e,  como  a  ligação  média,  é  menos  afetada  por 
observações  atípicas 

•  Método  de  Ward  se  baseia  na  soma  total  de  quadrados  dentro  de  agrupamentos  e  é  mais  apropriado  quando  o 
pesquisador  espera  agrupamentos  de  algum  modo  parecidos  em  tamanho,  mas  é  facilmente  distorcido  por  observações 
atípicas 

•  Métodos  não-hierárquicos  de  agrupamento  requerem  que  o  número  de  agrupamentos  seja  especificado  antes  de  se 
designar  observações: 

•  O  método  da  referência  seqüencial  designa  observações  ao  agrupamento  mais  próximo,  mas  uma  observação  não  pode 
ser  redesignada  a  outro  agrupamento  seguindo  sua  designação  original 

•  Procedimentos  de  otimização  permitem  a  redesignação  de  observações  com  base  na  proximidade  seqüencial  de 
observações  com  agrupamentos  formados  durante  o  processo 

•  A  escolha  entre  métodos  hierárquicos  e  não-hierárquicos  se  baseia  no  que  se  segue: 

•  Soluções  hierárquicas  são  preferidas  quando: 

•  Muitas  ou  todas  as  soluções  alternativas  devem  ser  examinadas 

•  O  tamanho  da  amostra  é  moderado  (abaixo  de  300-400,  não  excedendo  1.000)  ou  uma  amostra  de  um  conjunto  maior 
de  dados  é  aceitável 

•  Métodos  não-hierárquicos  são  preferidos  quando: 

•  O  número  de  agrupamentos  é  conhecido  e  pontos  sementes  iniciais  podem  ser  especificados  de  acordo  com  alguma 
base  prática,  objetiva  ou  teórica 

•  Observações  atípicas  provocam  preocupação,  pois  métodos  não-hierárquicos  são  geralmente  menos  suscetíveis  a 
observações  atípicas 

•  Uma  combinação  usando  a  abordagem  hierárquica  seguida  de  um  método  não-hierárquico  é  freqüentemente  aconselhável 

•  Um  método  não-hierárquico*  é  utilizado  para  selecionar  o  número  de  agrupamentos  e  para  caracterizar  os  centros  de 
agrupamento  que  servem  como  sementes  iniciais  no  procedimento  não-hierárquico 

•  Um  método  não-hierárquico  então  agrega  todas  as  observações  usando  os  pontos  sementes  para  fornecer  alocações 
mais  precisas 


*  N.  de  R.  T.:  A  frase  correta  seria  “Um  método  hierárquico”. 
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deve  observar  as  tendências  nos  valores  dessas  regras  de  pa¬ 
rada  ao  longo  das  soluções  para  identificar  aumentos  signi¬ 
ficativos.  Caso  contrário,  na  maioria  dos  casos  a  solução  de 
dois  agrupamentos  sempre  seria  escolhida,  pois  o  valor  de 
qualquer  regra  de  parada  é  normalmente  mais  alto  quando 
passa  de  dois  para  um  agrupamento. 

Mesmo  com  as  similaridades  entre  as  regras  de  parada, 
elas  exibem  diferenças  suficientes  para  colocá-las  em  uma 
entre  duas  classes  gerais,  como  descrito  a  seguir. 

Medidas  de  mudança  de  heterogeneidade.  Uma  classe  de 
regras  de  parada  examina  alguma  medida  de  heterogenei¬ 
dade  entre  agrupamentos  em  cada  passo  sucessivo,  com  a 
solução  de  agrupamento  definida  quando  a  medida  de  he¬ 
terogeneidade  excede  um  valor  especificado  ou  quando  os 
valores  sucessivos  entre  etapas  dão  um  salto  repentino.  Um 
exemplo  simples  foi  usado  no  início  do  capítulo,  o  qual  bus¬ 
cou  grandes  aumentos  na  distância  interna  média.  Quando 
um  grande  aumento  acontece,  o  pesquisador  seleciona  a 
solução  anterior  sob  o  argumento  de  que  sua  combinação 
provocou  um  aumento  substancial  de  heterogeneidade.  Foi 
mostrado  que  esse  tipo  de  regra  de  parada  fornece  decisões 
bastante  precisas  em  estudos  empíricos  [18],  mas  não  é  in- 
comum  que  várias  soluções  de  agrupamento  sejam  iden¬ 
tificadas  por  esses  grandes  aumentos  na  heterogeneidade. 
Portanto,  é  tarefa  do  pesquisador  a  escolha  de  uma  solução 
final  a  partir  dessas  soluções  selecionadas.  Várias  regras  de 
parada  seguem  essa  abordagem  geral. 

Variações  percentuais  de  heterogeneridade.  Prova¬ 
velmente  a  regra  mais  simples  e  mais  amplamente  usada 
é  uma  simples  variação  percentual  de  alguma  medida  de 
heterogeneidade.  Um  exemplo  típico  é  o  emprego  do  coe¬ 
ficiente  de  aglomeração  em  SPSS,  que  mede  heterogenei¬ 
dade  como  a  distância  na  qual  agregados  são  formados  (se 
uma  medida  de  similaridade  baseada  em  distância  for  usa¬ 
da)  ou  a  soma  de  quadrados  dentro  do  agrupamento  se  o 
método  de  Ward  for  empregado.  Com  esta  medida,  o  au¬ 
mento  percentual  no  coeficiente  de  aglomeração  pode  ser 
calculado  para  cada  solução.  Em  seguida  o  pesquisador 
seleciona  soluções  de  agrupamento  como  uma  potencial 
solução  final  quando  o  aumento  percentual  é  considera¬ 
velmente  maior  do  que  o  que  ocorre  em  outros  passos. 

Medidas  de  variação  de  variância.  A  raiz  do  desvio 
padrão  quadrático  médio  (RMSSTD)  é  a  raiz  quadrada 
da  variância  do  novo  agrupamento  formado  pela  união  de 
dois  agregados.  A  variância  para  o  novo  agregado  é  cal¬ 
culada  como  a  variância  ao  longo  de  todas  as  variáveis  de 
agrupamento.  Grandes  aumentos  na  RMSSTD  sugerem 
a  união  de  dois  agrupamentos  bastante  distintos,  indican¬ 
do  que  a  solução  anterior  (na  qual  os  dois  agrupamentos 


*  N.  de  R.  T.:  Supondo  que  a  intenção  dos  autores  seja  denotar  k- 
ésima  e  (k-l)-ésima  soluções  com  k  e  k-1  agupamentos,  respectiva¬ 
mente,  a  frase  correta  seria  “...indicam  que  a  k-ésima  solução  é  mais 
adequada  do  que  a  (k-l)-ésima  solução”. 


eram  separados)  era  uma  candidata  para  escolha  como  a 
solução  final. 

Medidas  estatísticas  de  variação  de  heterogenei¬ 
dade.  Uma  série  de  testes  estatísticos  tenta  retratar  o 
grau  de  heterogeneidade  para  cada  solução  nova  (ou  seja, 
unindo-se  dois  agregados).  Uma  das  mais  usadas  é  uma 
estatística  pseudo  F,  que  compara  a  adequação  de  ajuste 
de  k  agrupamentos  para  /c-1  agrupamentos.  Valores  alta¬ 
mente  significantes  indicam  que  a  {k  -l)-ésima  solução  é 
mais  adequada  do  que  a  fc-ésima  solução*.  O  pesquisador 
não  deve  considerar  qualquer  valor  significante,  mas  deve 
olhar  aqueles  valores  que  são  consideravelmente  mais  sig¬ 
nificantes  do  que  para  outras  soluções. 

Outra  medida  comumente  utilizada  é  um  valor  pseu¬ 
do  T^,  que  usa  de  Hotelling  para  comparar  as  médias 
dos  agrupamentos  unidos  ao  longo  de  todas  as  variáveis. 
Novamente,  valores  significantes  dessa  medida,  que  são 
consideravelmente  maiores  do  que  aqueles  para  outras 
soluções,  indicam  que  a  união  de  dois  agrupamentos  cria 
elevada  heterogeneidade  e  justifica  a  solução  com  os  dois 
agregados  separados. 

Medidas  diretas  de  heterogeneidade.  Uma  segunda 
classe  geral  de  regras  de  parada  tenta  medir  diretamen¬ 
te  a  heterogeneidade  de  cada  solução  de  agrupamento.  A 
medida  mais  comum  nesta  classe  é  o  critério  de  agrupa¬ 
mento  cúbico  (CCC)  [18]  contido  em  SAS,  uma  medida 
do  desvio  dos  agregados  a  partir  de  uma  distribuição  es¬ 
perada  de  pontos  formada  por  uma  distribuição  uniforme 
multivariada.  Aqui  o  pesquisador  escolhe  a  solução  com  o 
maior  valor  de  CCC  (ou  seja,  a  solução  na  qual  CCC  atin¬ 
ge  seu  máximo)  [24].  Apesar  de  sua  inclusão  em  SAS  e  de 
sua  vantagem  na  seleção  de  uma  solução  única  de  agrupa¬ 
mento,  ele  se  mostrou  responsável  pela  geração  de  exces¬ 
sivos  agrupamentos  como  solução  final  [18]  e  se  baseia  na 
suposição  de  que  as  variáveis  não  são  correlacionadas.  No 
entanto,  é  uma  medida  amplamente  usada  e  é  geralmente 
tão  eficiente  quanto  qualquer  outra  regra  de  parada  [18]. 

Resnmo.  Dado  o  número  de  regras  de  parada  disponí¬ 
veis  e  a  falta  de  evidência  embasando  qualquer  regra  em 
especial,  sugere-se  que  o  pesquisador  empregue  diversas 
regras  de  parada  e  procure  por  uma  solução  que  seja  con¬ 
senso.  Não  obstante,  mesmo  com  um  consenso  baseado 
em  medidas  empíricas,  o  pesquisador  deve  complemen¬ 
tar  o  julgamento  empírico  com  qualquer  conceituação  de 
relações  teóricas  que  possa  sugerir  um  número  natural 
de  agrupamentos.  Pode-se  começar  esse  processo  pela 
especificação  de  alguns  critérios  baseados  em  considera¬ 
ções  práticas,  como  dizer  “Minhas  descobertas  serão  mais 
fáceis  de  lidar  e  de  comunicar  se  eu  tiver  de  três  a  seis 
grupos”,  e  então  escolher  entre  estes  números  de  agrupa¬ 
mentos  e  selecionar  a  melhor  alternativa  depois  de  avaliar 
todas  elas.  Na  análise  final,  porém,  provavelmente  será 
melhor  computar  várias  soluções  diferentes  (p.ex.,  duas. 
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-  REGRAS  PRÁTICAS  8-5  - 

Obtenção  da  solução  final  de  agrupamentos 

•  Nenhum  procedimento  objetivo  em  especial  está 
disponível  para  determinar  a  quantia  correta  de 
agrupamentos;  o  pesquisador  deve  avaliar  soluções 
alternativas  pensando  nas  seguintes  considerações  para 
selecionar  a  solução  ótima: 

•  Agrupamentos  de  um  só  membro  ou  extremamente 
pequenos  são  geralmente  não  aceitáveis  e  devem  ser 
eliminados 

•  Para  métodos  hierárquicos,  regras  de  parada  ad  hoc, 
com  base  na  taxa  de  variação  em  uma  medida  de 
similaridade  total  quando  o  número  de  agregados 
aumenta  ou  diminui,  são  uma  indicação  do  número 
de  agrupamentos 

•  Todos  os  agrupamentos  devem  ser 
significativamente  diferentes  no  conjunto  de 
variáveis 

•  Soluções,  em  última  instância,  devem  ter  validade 
teórica  avaliada  por  meio  de  validação  externa 


três,  quatro)  e  então  decidir  entre  as  soluções  alternativas 
pelo  uso  de  um  critério  a priori,  julgamento  prático,  senso 
comum  ou  fundamentação  teórica.  As  soluções  de  agru¬ 
pamentos  serão  melhoradas  pela  restrição  da  solução  de 
acordo  com  aspectos  conceituais  do  problema. 

Estágio  5:  Interpretação  dos  agrupamentos 

O  estágio  de  interpretação  envolve  o  exame  de  cada  agru¬ 
pamento  em  termos  da  variável  estatística  de  agrupamen¬ 
to  para  nomear  ou  designar  um  rótulo  que  descreva  pre¬ 
cisamente  a  natureza  dos  agregados.  Para  esclarecer  esse 
processo,  examinemos  o  exemplo  dos  refrigerantes  diet 
versus  normais. 


Consideremos  que  foi  desenvolvida  uma  escala  de  atitu¬ 
des  que  consiste  em  declarações  relativas  ao  consumo  de 
refrigerantes,  como  “refrigerantes  diet  têm  um  sabor  mais 
desagradável”,  “refrigerantes  normais  têm  um  sabor  mais 
forte”,  “bebidas  diet  são  mais  saudáveis”  e  assim  por  dian¬ 
te.  Além  disso,  consideremos  que  dados  demográficos  e  de 
consumo  de  refrigerantes  também  tenham  sido  coletados. 


Quando  iniciamos  o  processo  de  interpretação,  uma 
medida  freqüentemente  usada  é  o  centróide  de  agrupa¬ 
mento.  Se  o  procedimento  de  agrupamento  foi  realizado 
sobre  os  dados  iniciais,  essa  será  uma  descrição  lógica.  Se 
os  dados  fossem  padronizados  ou  se  a  análise  de  agrupa¬ 
mentos  fosse  executada  usando  a  análise  fatorial  (fatores 
componentes),  o  pesquisador  teria  de  voltar  aos  escores 
iniciais  para  as  variáveis  originais  e  computar  os  perfis 
médios  usando  esses  dados. 


Continuando  com  nosso  exemplo  de  refrigerantes,  nesse 
estágio  examinamos  os  perfis  de  escores  médios  sobre  as 
declarações  de  atitude  para  cada  grupo  e  atribuímos  um 
rótulo  descritivo  para  cada  grupo.  Muitas  vezes,  a  aná¬ 
lise  discriminante  é  aplicada  para  gerar  perfis  de  escore, 
mas  devemos  lembrar  que  diferenças  estatisticamente 
significantes  não  indicariam  uma  solução  ótima,  porque 
diferenças  estatísticas  são  esperadas,  dado  o  objetivo  da 
análise  de  agrupamentos.  O  exame  dos  perfis  permite 
uma  rica  descrição  de  cada  agrupamento.  Por  exemplo, 
dois  dos  agrupamentos  podem  ter  atitudes  favoráveis 
sobre  refrigerantes  diet,  e  o  terceiro  agregado,  atitudes 
negativas.  Além  disso,  dos  dois  grupos  favoráveis,  um 
pode  exibir  atitudes  favoráveis  apenas  para  refrigeran¬ 
tes  diet,  ao  passo  que  o  outro  pode  mostrar  atitudes 
favoráveis  para  refrigerantes  diet  e  normais.  A  partir 
desse  procedimento  analítico,  avaliaríamos  as  atitudes 
de  cada  agrupamento  e  desenvolveríamos  interpreta¬ 
ções  relevantes  para  facilitar  o  processo  de  rotulação  de 
cada  um.  Por  exemplo,  um  agrupamento  poderia  ser  ro¬ 
tulado  como  “consciente  quanto  a  saúde  e  calorias”,  ao 
passo  que  um  outro  talvez  fosse  chamado  de  “um  pouco 
de  açúcar  vai  bem”. 


O  perfil  e  a  interpretação  dos  agrupamentos,  porém, 
conseguem  mais  do  que  apenas  a  descrição  e  são  elementos 
essenciais  na  seleção  entre  soluções  quando  as  regras  de 
parada  indicam  mais  de  uma  solução  de  agrupamentos. 

•  Eles  fornecem  um  meio  de  avaliar  a  correspondência  dos 
agregados  obtidos  com  aqueles  propostos  por  alguma  teoria 
anterior  ou  por  experiência  prática.  Se  usados  de  um  modo 
confirmatório,  os  perfis  da  análise  de  agrupamentos  forne¬ 
cem  um  meio  direto  para  avaliar  a  correspondência. 

•  Os  perfis  de  agrupamento  também  fornecem  uma  rota  para 
fazer  avaliações  de  significância  prática.  O  pesquisador 
pode  requerer  que  existam  diferenças  substanciais  em  um 
conjunto  de  variáveis  de  agrupamento  e  que  a  solução  seja 
expandida  até  surgirem  tais  diferenças. 

Na  avaliação  de  correspondência  ou  significância  prá¬ 
tica,  o  pesquisador  compara  os  agrupamentos  obtidos  com 
uma  tipologia  pré-concebida.  Este  julgamento  mais  subje¬ 
tivo  do  pesquisador  combina  com  o  julgamento  empírico 
das  regras  de  parada  para  determinar  a  solução  final  para 
representar  a  estrutura  de  dados  da  amostra. 

Estágio  6:  Validação  e  perfil  dos  agrupamentos 

Dada  a  natureza  um  tanto  subjetiva  da  análise  de  agrupa¬ 
mentos  na  seleção  de  uma  solução  ótima,  o  pesquisador 
deve  ter  muito  cuidado  na  validação  e  na  garantia  de  sig¬ 
nificância  prática  da  solução  final.  Apesar  de  não  haver 
qualquer  método  para  garantir  validade  e  significância 
prática,  diversas  abordagens  foram  propostas  para  forne¬ 
cer  alguma  base  para  a  avaliação  do  pesquisador. 
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Validação  da  solução  de  agrupamentos 

A  validação  inclui  tentativas  do  pesquisador  para  garantir 
que  a  solução  de  agrupamentos  seja  representativa  da  po¬ 
pulação  geral,  e  assim  seja  generalizável  para  outros  obje¬ 
tos  e  estável  com  o  passar  do  tempo. 

Validação  cruzada.  A  abordagem  mais  direta  em  rela¬ 
ção  a  isso  é  a  análise  de  agrupamentos  de  amostras  se¬ 
paradas,  que  compara  as  soluções  e  avalia  a  correspon¬ 
dência  dos  resultados.  Essa  técnica,  contudo,  geralmente 
é  impraticável  por  causa  de  restrições  de  tempo  ou  custo, 
ou  indisponibilidade  de  objetos  (particularmente  consu¬ 
midores)  para  múltiplas  análises  de  agrupamentos.  Nesses 
casos,  um  método  comum  é  particionar  a  amostra  em  dois 
grupos.  Cada  um  é  analisado  separadamente  e  os  resul¬ 
tados  são  então  comparados.  Outras  abordagens  incluem 
(1)  uma  forma  modificada  de  partição  de  amostra,  onde 
centros  de  grupos  obtidos  a  partir  de  uma  solução  são  em¬ 
pregados  para  definir  agrupamentos  de  outras  observa¬ 
ções  e  os  resultados  são  comparados  [16],  e  (2)  uma  forma 
direta  de  validação  cruzada  [22]. 

Estabelecimento  de  validade  de  critério.  O  pesquisa¬ 
dor  também  pode  tentar  estabelecer  alguma  forma  de 
validade  de  critério  ou  preditiva.  Para  isso,  ele  seleciona 
variáveis  não  usadas  para  formar  agrupamentos  mas  que 
se  sabe  que  têm  variação  ao  longo  dos  grupos.  Em  nosso 
exemplo,  podemos  saber,  de  pesquisa  anterior,  que  ati¬ 
tudes  relacionadas  a  refrigerantes  diet  variam  de  acordo 
com  a  idade.  Assim,  podemos  testar  estatisticamente  as 
diferenças  em  idade  entre  os  agrupamentos  favoráveis  a 
refrigerantes  diet  e  os  que  não  o  são.  A(s)  variável(eis) 
usada(s)  para  avaliar  a  validade  preditiva  devem  ter  forte 
apoio  teórico  ou  prático,  uma  vez  que  se  tornam  padrões 
de  referência  para  seleção  de  soluções  de  agrupamentos. 

Perfil  da  solução  por  agrupamento 

O  estágio  de  perfil  envolve  a  descrição  das  caracte¬ 
rísticas  de  cada  agrupamento  para  explicar  como  eles 
podem  diferir  em  dimensões  relevantes.  Este  processo 
geralmente  envolve  o  uso  de  análise  discriminante  (ver 
Capítulo  5).  O  procedimento  tem  início  depois  que  os 
agrupamentos  são  identificados.  O  pesquisador  utiliza 
dados  não  previamente  incluídos  no  procedimento  de 
agrupamento  para  caracterizar  cada  agregado.  Esses 
dados  normalmente  são  características  demográficas, 
perfis  psicográficos,  padrões  de  consumo  e  assim  por 
diante.  Embora  possa  não  haver  um  fundamento  teó¬ 
rico  para  suas  diferenças  ao  longo  dos  agregados,  tal 
como  se  exige  para  avaliação  de  validade  preditiva,  tais 
diferenças  devem  pelo  menos  ter  importância  prática. 
Usando  a  análise  discriminante,  o  pesquisador  compara 
os  perfis  de  escores  médios  dos  agrupamentos.  A  variá¬ 
vel  dependente  categórica  é  a  identificação  prévia  dos 
grupos,  e  as  variáveis  independentes  são  as  característi¬ 
cas  demográficas,  psicográficas  etc. 


A  partir  dessa  análise,  assumindo  signiflcância  estatís¬ 
tica,  o  pesquisador  pode  concluir,  por  exemplo,  que  o 
grupo  “consciente  quanto  a  saúde  e  calorias”  de  nosso 
exemplo  anterior  sobre  refrigerante  diet  consiste  de  pro¬ 
fissionais  com  melhor  educação  e  maior  renda  e  que  são 
consumidores  moderados  de  refrigerantes. 


Em  resumo,  a  análise  de  perfil  se  concentra  na  descri¬ 
ção  não  daquilo  que  diretamente  determina  os  agregados, 
mas  das  características  dos  agrupamentos  depois  da  sua 
identificação.  Além  disso,  a  ênfase  está  nas  características 
que  diferem  significantemente  ao  longo  dos  agrupamentos 
e  nas  que  poderiam  prever  a  pertinência  a  um  agregado 
em  particular.  Freqüentemente,  o  perfil  é  um  passo  prá¬ 
tico  importante  em  procedimentos  de  agrupamento,  pois 
identificar  características  como  as  demográficas  permite 
que  segmentos  sejam  identificados  ou  localizados  com  in¬ 
formação  facilmente  obtida. 


RESUMO  DO  PROCESSO  DE  DECISÃO 

A  análise  de  agrupamentos  fornece  aos  pesquisadores  um 
método  empírico  e  objetivo  para  realizar  uma  das  tarefas 
mais  naturais  para  os  seres  humanos  -  classificação.  Seja 
para  fins  de  simplificação,  exploração  ou  confirmação, 
a  análise  de  agrupamentos  é  uma  poderosa  ferramenta 
analítica  que  conta  com  uma  vasta  gama  de  aplicações. 
Mas  junto  com  essa  técnica  vem  uma  responsabilidade 
para  o  pesquisador,  no  sentido  de  aplicar  os  princípios 
inerentes  de  forma  adequada.  Como  mencionado  na  in¬ 
trodução  deste  capítulo,  a  análise  de  agrupamentos  tem 
muitas  advertências,  que  fazem  com  que  mesmo  o  pes¬ 
quisador  experiente  a  aplique  com  cuidado.  Mas  quando 
usada  apropriadamente,  ela  tem  o  potencial  de  revelar 
estruturas  dentro  dos  dados  que  não  poderiam  ser  des¬ 
cobertas  por  outros  meios.  Assim,  essa  técnica  potente 
supre  uma  necessidade  fundamental  dos  pesquisadores 
em  todas  as  áreas,  mas  pode  ser  aplicada  com  o  conheci¬ 
mento  de  que  é  muito  fácil  usá-la  tanto  de  maneira  equi¬ 
vocada  quanto  de  forma  apropriada. 


UM  EXEMPLO  ILUSTRATIVO 

Para  ilustrar  a  aplicação  de  técnicas  de  análise  de  agrupa¬ 
mento,  retornemos  à  base  de  dados  da  HBAT.  As  percep¬ 
ções  de  cliente  da  HBAT  fornecem  uma  base  para  ilustrar 
um  dos  usos  mais  comuns  da  análise  de  agrupamentos  -  a 
formação  de  segmentos  de  clientes.  Em  nosso  exemplo, 
seguimos  os  estágios  do  processo  de  construção  de  mode¬ 
los,  começando  com  o  estabelecimento  de  objetivos,  em 
seguida  abordando  questões  de  delineamento  de  pesquisa, 
e  finalmente  classificando  os  respondentes  em  agregados  e 
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-  REGRAS  PRÁTICAS  8-6  - 

Interpretação,  caracterização  e 
validação  de  agrupamentos 

•  O  centróide  de  agrupamento,  um  perfil  médio  do 
agrupamento  sobre  cada  variável,  é  particularmente  útil 
no  estágio  de  interpretação: 

•  Interpretação  envolve  o  exame  de  características 
de  diferenciação  do  perfil  de  cada  agrupamento 
e  a  identificação  de  diferenças  substanciais  entre 
agregados 

•  Soluções  que  não  conseguem  mostrar  variação 
significante  indicam  que  outras  soluções  devem  ser 
examinadas 

•  O  centróide  de  agrupamento  também  deve 
ser  avaliado  quanto  à  correspondência  com  as 
expectativas  anteriores  do  pesquisador  com  base  em 
teoria  ou  experiência  prática 

•  Validação  é  essencial  em  análise  de  agrupamentos 
porque  os  agregados  são  descritivos  de  estrutura  e 
demandam  suporte  adicional  quanto  a  sua  relevância: 

•  Validação  cruzada  valida  empiricamente  uma  solução 
pela  criação  de  duas  subamostras  (aleatoriamente 
dividindo  a  amostra)  e  então  compara  as  duas 
soluções  quanto  a  consistência  relativa  ao  número  de 
agrupamentos  e  os  perfis  dos  mesmos 

•  Validação  também  é  conseguida  com  o  exame  de 
diferenças  sobre  variáveis  não  incluídas  na  análise, 
mas  para  as  quais  uma  razão  teórica  e  relevante 
permite  a  expectativa  de  variação  ao  longo  dos 
agrupamentos 


interpretando  e  validando  os  resultados.  As  seções  a  seguir 
detalham  esses  procedimentos  por  meio  de  cada  estágio. 

Estágio  1:  Objetivos  da  análise 
de  agrupamentos 

Iniciamos  pela  análise  das  avaliações  feitas  por  clientes  da 
HBAT  quanto  ao  desempenho  da  HBAT  nos  13  atributos 
(X^aX^g).  Fazendo  isso,  o  pesquisador  deve  identificar  os 
objetivos  a  serem  alcançados  e  as  características  (variá¬ 
veis)  usadas  no  processo  de  agrupamento. 

Objetivos  de  agrupamento 

A  análise  de  agrupamentos  pode  atingir  qualquer  combi¬ 
nação  de  três  objetivos:  desenvolvimento  de  taxonomia, 
simplificação  de  dados  e  identificação  de  relações.  Nesta 
situação,  a  HBAT  está  principalmente  interessada  na  seg¬ 
mentação  de  clientes,  apesar  de  serem  possíveis  usos  adi¬ 
cionais  dos  segmentos  derivados. 


O  principal  objetivo  é  desenvolver  uma  taxonomia  que 
particione  objetos  (clientes)  em  grupos  com  percep¬ 


ções  similares.  Uma  vez  identificados,  a  HBAT  pode 
então  formular  estratégias  com  diferentes  apelos  para 
os  grupos  separados  -  a  base  para  segmentação  de  mer¬ 
cado.  A  análise  de  agrupamentos,  com  seu  objetivo  de 
formar  grupos  homogêneos  que  sejam  tão  distintos  uns 
dos  outros  quanto  possível,  fornece  uma  metodologia 
única  para  desenvolver  taxonomias  com  relevância  ad¬ 
ministrativa  máxima. 

Além  de  formar  uma  taxonomia  que  pode  ser  usa¬ 
da  para  segmentação,  a  análise  de  agrupamentos  pode 
também  fornecer  simplificação  de  dados  e  até  mesmo  a 
identificação  de  relações.  Em  termos  de  simplificação  de 
dados,  segmentação  permite  que  os  clientes  da  HBAT 
sejam  categorizados  em  um  segmento  que  define  o  ca¬ 
ráter  básico  de  seus  membros.  Em  uma  segmentação 
efetiva,  clientes  não  precisam  ser  vistos  somente  como 
indivíduos,  mas  podem  também  ser  vistos  como  mem¬ 
bros  de  grupos  relativamente  homogêneos  que  podem 
ser  retratados  através  de  seus  perfis  em  comum.  Seg¬ 
mentos  também  fornecem  uma  via  para  examinar  rela¬ 
ções  previamente  não  estudadas.  Um  exemplo  típico  é  a 
estimação  do  impacto  de  percepções  de  clientes  quanto 
a  satisfação  para  cada  segmento,  permitindo  ao  pesqui¬ 
sador  a  compreensão  sobre  o  que  impacta  unicamente 
cada  segmento  no  lugar  dos  impactos  estimados  para  a 
amostra  como  um  todo. 


Variáveis  de  agrupamento 

Uma  preocupação  crítica  de  qualquer  análise  de  agrupa¬ 
mentos  é  o  conjunto  de  variáveis  usadas  para  caracterizar 
objetos.  A  importância  dessa  decisão  é  que  as  variáveis 
fornecem  a  base  para  a  definição  de  similaridade. 


Nesta  aplicação,  as  variáveis  potenciais  são  as  13  per¬ 
cepções  de  atributos  de  HBAT.  A  partir  de  usos  pré¬ 
vios  em  outras  técnicas  multivariadas  (p.ex.,  regressão 
múltipla  e  análise  discriminante),  descobrimos  que  es¬ 
sas  variáveis  fornecem  poder  preditivo  e  explanatório 
suficientes  para  justificar  o  uso  das  mesmas  como  a  base 
para  segmentação. 

No  entanto,  a  aplicação  de  análise  fatorial  (ver  Capí¬ 
tulo  3)  identificou  três  variáveis  (Aj^,  X^^  e  X^j}  que  não 
se  relacionam  com  qualquer  uma  das  quatro  dimensões 
principais  de  percepções  de  HBAT.  Assim,  essas  três 
variáveis  não  serão  usadas  na  análise  de  agrupamentos, 
com  as  demais  10  percepções  de  atributos  formando  o 
conjunto  de  variáveis  de  agrupamento. 


Estágio  2:  Projeto  de  pesquisa  na 
análise  de  agrupamentos 

Ao  preparar  uma  análise  de  agrupamentos,  o  pesquisador 
deve  abordar  quatro  questões  no  planejamento  da  pesqui- 
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sa:  detecção  de  observações  atípicas,  determinação  da  me¬ 
dida  de  similaridade  a  ser  usada,  avaliação  da  adequação 
do  tamanho  amostrai,  e  padronização  das  variáveis  e/ou 
objetos.  Cada  um  desses  pontos  tem  um  papel  essencial 
na  definição  da  natureza  e  do  caráter  das  soluções  resul¬ 
tantes. 

Detecção  de  observações  atípicas 

A  primeira  questão  é  identificar  quaisquer  observações 
atípicas  na  amostra  antes  que  a  partição  se  inicie.  Proce¬ 
dimentos  univariados  discutidos  no  Capítulo  2  não  identi¬ 
ficaram  quaisquer  candidatos  potenciais  para  designação 
como  observações  atípicas,  mas  técnicas  multivariadas  fo¬ 
ram  consideradas  necessárias  devido  à  natureza  de  análise 
de  agrupamentos  no  uso  de  todas  as  variáveis  para  definir 
similaridade.  Assim,  a  medida  de  Mahalanobis  foi  cal¬ 
culada  para  cada  observação. 

Uma  medida  multivariada  descrevendo  a  distância  de 
cada  observação  em  relação  à  média  da  amostra  em  todas 
as  variáveis  viabiliza  uma  comparação  de  todas  as  obser¬ 
vações  e  a  designação  de  observações  atípicas  com  base 
em  um  perfil  multivariado  no  conjunto  completo  de  variá¬ 
veis  de  agrupamento. 


A  Tabela  8-5  contém  os  valores  para  cada  observa¬ 
ção.  Como  mostrado,  duas  observações  (24  e  84)  apre¬ 
sentam  valores  substancialmente  mais  elevados  do 
que  as  demais.  Nenhum  valor  específico  de  corte  designa 
uma  observação  como  atípica,  mas  valores  relativos  ex¬ 
tremamente  altos  indicam  observações  que  são  bastante 
distintas  das  demais  no  conjunto  de  variáveis  de  agru¬ 
pamento.  Neste  caso,  essas  duas  observações  (24  e  84) 
não  serão  eliminadas  desta  vez,  mas  elas  podem  se  tor¬ 
nar  candidatas  para  eliminação  em  estágios  posteriores 
quando  pequenos  agrupamentos  são  identificados  e  de¬ 
cisões  precisam  ser  tomadas  para  avaliar  se  observações 
atípicas  surgiram  durante  o  processo  de  agrupamento. 


Definição  de  similaridade 

A  próxima  questão  envolve  a  escolha  de  uma  medida  de 
similaridade.  Medidas  correlacionais  não  são  empregadas, 
pois  a  derivação  de  segmentos  deve  considerar  a  magnitu¬ 
de  das  percepções  (favorável  versus  não  favorável),  bem 
como  o  padrão.  Tal  avaliação  é  melhor  obtida  com  uma 
medida  de  similaridade  baseada  em  distância. 


Dado  que  o  conjunto  de  10  variáveis  é  de  variáveis  mé¬ 
tricas,  a  distância  euclidiana  quadrada  é  escolhida  como 
a  medida  de  semelhança.  Se  a  multicolinearidade  fosse 
considerada  substancial  ou  com  o  efeito  de  ponderar  as 
variáveis  de  forma  desigual,  então  a  distância  de  Maha¬ 
lanobis  (D^)  seria  apropriada. 


Tamanho  amostrai 

A  terceira  questão  é  sobre  a  adequação  da  amostra  de 
100  observações.  Esta  preocupação  não  se  relaciona  aos 
aspectos  de  natureza  estatística,  mas  sim  à  habilidade  da 
amostra  para  identificar  segmentos  administrativamente 
úteis. 


Em  nosso  caso,  a  HBAT  está  interessada  somente  em 
segmentos  que  representam  pelo  menos  10%  da  popu¬ 
lação.  Segmentos  menores  são  considerados  muito  pe¬ 
quenos  para  justificar  o  desenvolvimento  de  programas 
de  marketing  específicos  a  segmentos.  Assim,  em  nosso 
exemplo  com  uma  amostra  de  100  observações,  pode¬ 
mos  esperar  que  segmentos  relevantes  sejam  compostos 
de  10  observações,  mas  aceitamos  agregados  consistindo 
de  quantias  tão  pequenas  quanto  5  a  6  observações,  a  fim 
de  explicar  variação  amostrai.  Tal  número  é  considerado 
suficiente  porque  ele  permite  que  segmentos  extrema¬ 
mente  pequenos,  com  até  4  observações,  sejam  elimina¬ 
dos  sem  a  preocupação  de  que  eles  possam  realmente 
ser  relevantes  para  estudos  posteriores. 


Padronização 

O  ponto  final  envolve  os  tipos  de  padronização  que  po¬ 
dem  ser  usados.  Não  se  considera  útil  o  emprego  de  pa¬ 
dronização  interna,  pois  a  magnitude  das  percepções  é 
um  elemento  importante  dos  objetivos  de  segmentação, 
e  a  questão  de  padronização  por  variável  ainda  perma¬ 
nece. 


Como  todas  as  variáveis  de  agrupamento  são  medidas  na 
mesma  escala  (0  a  10),  elas  não  precisam  ser  padroniza¬ 
das.  As  variáveis  têm,  porém,  variados  níveis  de  disper¬ 
são  (ver  desvios  padrão  na  Tabela  8-6)  que  podem  afetar 
o  processo  de  agrupamento.  Além  disso,  as  médias  va¬ 
riam  muito,  o  que  não  afeta  o  processo  real  em  si,  mas 
complica  comparações  entre  agrupamentos.  Logo,  para 
remover  qualquer  impacto  devido  a  diferentes  níveis  de 
dispersão,  as  variáveis  serão  convertidas  para  escores  Z 
e  os  valores  padronizados  serão  utilizados  na  análise  de 
agrupamentos. 


Estágio  3:  Suposições  na  análise 
de  agrupamentos 

Ao  atender  às  suposições  da  análise  de  agrupamentos,  o 
pesquisador  não  está  interessado  nas  qualidades  estatísti¬ 
cas  dos  dados  (p.ex.,  normalidade,  linearidade  etc.),  mas 
está  concentrado  principalmente  em  questões  sobre  o  de¬ 
lineamento  da  pesquisa.  As  duas  questões  básicas  a  serem 
abordadas  são  a  representatividade  da  amostra  e  a  multi¬ 
colinearidade  entre  as  variáveis  de  agrupamento. 
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Nota:  [f  de  Mahalanobis  baseado  nos  valores  padronizados  das  10  variáveis  de  agrupamento  X^,  Xg,  Xg,  X,o,  X^g,  X^g,  X^g  e  X^g) 
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TABELA  8-6  Padronização  das  variáveis  de  agrupamento 


Variável  de  agrupamento 

Mínimo 

Máximo 

Média 

Desvio  padrão 

Xg  Qualidade  do  produto 

5,0 

10,0 

7,810 

1,396 

Xj  Atividades  de  comércio  eletrônico 

2,2 

5,7 

3,672 

0,701 

Xg  Suporte  técnico 

1,3 

8,5 

5,365 

1,530 

Xg  Solução  de  reclamação 

2,6 

7,8 

5,442 

1,208 

X,g  Anúncio 

1,9 

6,5 

4,010 

1,127 

X,2  Imagem  da  equipe  de  venda 

2,9 

8,2 

5,123 

1,072 

X,3  Preço  competitivo 

3,7 

9,9 

6,974 

1,545 

X,4  Garantia  e  reclamações 

4,1 

8,1 

6,043 

0,820 

X,g  Encomenda  e  cobrança 

2,0 

6,7 

4,278 

0,929 

X,g  Velocidade  de  entrega 

1,6 

5,5 

3,886 

0,734 

Representatividade  amostrai 

Uma  exigência-chave  no  uso  de  análise  de  agrupamentos 
para  atender  a  qualquer  um  dos  objetivos  discutidos  no  es¬ 
tágio  1  é  que  a  amostra  seja  representativa  da  população  de 
interesse.  Seja  desenvolvendo  uma  taxonomia,  procurando 
por  relações  ou  simplesmente  simplificando  dados,  os  re¬ 
sultados  da  análise  de  agrupamentos  não  são  generalizáveis 
se  representatividade  não  for  garantida.  O  pesquisador  não 
deve  ignorar  este  ponto,  pois  a  análise  de  agrupamentos 
não  tem  meio  algum  para  determinar  se  o  planejamento  de 
pesquisa  garante  uma  amostra  representativa. 


A  amostra  de  100  clientes  da  HBAT  foi  obtida  por  meio 
de  um  processo  de  escolha  aleatória  a  partir  de  toda  a 
base  de  clientela.  Todas  as  questões  referentes  à  coleta  de 
dados  foram  tratadas  adequadamente  para  garantir  que  a 
amostra  é  representativa  da  base  de  clientela  da  HBAT. 


Multicolinearidade 

Ainda  a  ser  resolvido  está  o  impacto  da  multicolinearida¬ 
de  sobre  a  ponderação  implícita  dos  resultados.  Se  multi¬ 
colinearidade  está  presente  entre  as  variáveis  (p.ex.,  como 
mostrado  por  uma  análise  fatorial),  a  preocupação  é  no 
sentido  de  que  o  que  parece  ser  um  conjunto  de  variá¬ 
veis  separadas  é  na  realidade  de  medidas  correlacionadas. 
Essa  questão  se  torna  problemática  quando  o  número  de 
variáveis  fica  desproporcional  para  um  grupo  de  variáveis 
(fator)  versus  outro. 


Na  discussão  anterior  sobre  seleção  de  variáveis  de  agru¬ 
pamento,  as  10  percepções  da  HBAT  escolhidas  foram 
aquelas  que  formaram  os  quatro  fatores  obtidos  da  aná¬ 
lise  fatorial  descrita  no  Capítulo  3.  Naquela  análise,  os 
fatores  eram  bastante  semelhantes  em  termos  de  núme¬ 
ro  de  variáveis  por  fator  (dois  fatores  com  três  variáveis 
e  dois  fatores  com  duas).  Logo,  apesar  da  multicolineari¬ 
dade  demonstrada  entre  as  variáveis  de  agrupamento,  o 
equilíbrio  entre  fatores  em  termos  de  número  de  variá¬ 
veis  por  fator  deve  minimizar  qualquer  ponderação  im¬ 


plícita  e  seu  impacto  oculto  sobre  a  análise.  Além  disso, 
não  foi  considerada  necessária  qualquer  ação  corretiva 
(p.ex.,  uso  de  escalas  múltiplas  representando  fatores) 
para  a  multicolinearidade  entre  variáveis. 


Emprego  de  métodos  hierárquicos 
e  não-hierárquicos 

Ao  aplicarmos  análise  de  agrupamentos  à  amostra  de 
100  clientes  HBAT,  seguimos  a  abordagem  de  empregar 
métodos  hierárquicos  combinados  com  não-hierárquicos. 
O  primeiro  passo  constitui  o  estágio  de  partição,  usando 
o  procedimento  hierárquico  para  identificar  um  conjun¬ 
to  preliminar  de  soluções  como  base  para  estabelecer  o 
número  apropriado  de  agrupamentos  e  gerar  os  pontos 
sementes.  Em  seguida,  no  passo  2  usamos  procedimen¬ 
tos  não-hierárquicos  para  refinar  a  solução,  gerando 
agregados  usando  os  pontos  sementes  a  partir  da  análise 
hierárquica  e  então  caracterizando  o  perfil  e  validando 
as  soluções  finais.  Os  procedimentos  hierárquico  e  não- 
hierárquico  de  SPSS  são  usados  nessa  análise,  apesar  de 
resultados  comparáveis  serem  obtidos  com  qualquer  pro¬ 
grama  de  agrupamento. 

Passo  1:  Auáhse  hierárquica  de 
agrupameutos  (Estágio  4) 

Neste  exemplo  usamos  a  vantagem  do  procedimento  hierár¬ 
quico  de  agrupamento  de  rapidamente  examinar  uma  vasta 
gama  de  soluções  para  identihcar  um  conjunto  de  soluções 
preliminares  que  serão  então  analisadas  por  procedimen¬ 
tos  não-hierárquicos  para  determinar  a  solução  final.  Deste 
modo,  nossa  ênfase  na  análise  hierárquica  será  no  estágio  4 
(o  processo  real  de  agrupamento),  deixando  os  estágios  de 
perhl  e  validação  (5  e  6)  prioritariamente  para  o  processo 
não-hierárquico.  No  curso  de  execução  da  análise  hierár¬ 
quica,  o  pesquisador  deve  executar  uma  série  de  tarefas: 

1.  Escolher  o  algoritmo  de  agrupamento. 

2.  Gerar  os  resultados  de  agrupamento  e  verificar  a  existência 
de  agregados  unitários  ou  outros  que  sejam  inadequados. 
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3.  Escolher  as  soluções  preliminares  pela  aplicação  das  regras 
de  parada. 

4.  Caracterizar  o  perfil  das  variáveis  de  agrupamento  para 
identificar  as  soluções  mais  apropriadas. 

5.  Definir  pontos  sementes  para  a  análise  não-hierárquica. 

Ao  fazer  isso,  o  pesquisador  deve  tratar  de  questões 
metodológicas  e  considerar  metas  administrativas  e  de 
agrupamento  para  obter  a  solução  mais  representativa 
para  a  amostra.  Nas  seções  a  seguir  discutimos  ambos  os 
tipos  de  questões  quando  abordamos  as  tarefas  listadas. 

Seleção  de  um  algoritmo  de  agrupamento 

Antes  de  realmente  aplicarmos  o  procedimento  de  análi¬ 
se  de  agrupamentos,  devemos  primeiramente  perguntar: 
qual  algoritmo  de  agrupamento  devemos  usar?  Combi¬ 
nado  com  a  medida  de  similaridade  escolhida  (distância 
euclidiana  quadrada),  o  algoritmo  de  agrupamento  forne¬ 
ce  os  meios  para  representar  a  semelhança  entre  agrupa¬ 
mentos  com  múltiplos  membros. 


O  método  de  ligação  média  é  escolhido  neste  exemplo 
como  uma  concessão  aos  algoritmos  que  se  sustentam 
em  uma  única  observação  (algoritmos  de  ligação  simples 
ou  completa)  enquanto  também  geram  agregados  com 
variação  interna  pequena.  O  método  de  Ward  não  foi 
usado  por  conta  de  sua  tendência  de  gerar  agrupamentos 
de  mesmo  tamanho,  e  determinar  a  variação  de  tamanho 
de  agregado  na  amostra  é  uma  importante  consideração 
nesta  questão  de  pesquisa. 


Resultados  iniciais  de  agrupamento 

Com  a  medida  de  similaridade  e  o  algoritmo  de  agru¬ 
pamento  definidos,  o  pesquisador  agora  pode  aplicar  o 
procedimento  hierárquico.  Ele  deve  rever  os  resultados 


dentro  do  intervalo  de  soluções  a  serem  consideradas 
e  identificar  quaisquer  agregados  que  possam  ser  eli¬ 
minados  devido  a  tamanho  pequeno  ou  outros  motivos 
(observações  atípicas,  não-representativas  etc.).  Após  a 
revisão,  os  dados  identificados  são  eliminados  e  a  aná¬ 
lise  é  rodada  novamente  com  o  conjunto  reduzido  de 
dados. 

Ao  escolher  o  intervalo  de  soluções  a  serem  conside¬ 
radas,  é  útil  levar  em  conta  algumas  soluções  além  do  que 
se  espera  necessário  para  as  soluções  finais.  Por  exemplo, 
se  um  pesquisador  estava  usando  análise  de  agrupamen¬ 
tos  para  gerar  uma  solução  de  cinco  ou  menos  agregados, 
soluções  com  até  10  agrupamentos  podem  ser  avaliadas 
para  melhor  compreender  o  processo  de  combinação  de 
agregados  que  conduz  às  soluções  de  interesse. 


A  Tabela  8-7  contém  as  soluções  variando  de  2  a  10 
agregados  para  a  análise  hierárquica  inicial.  O  intervalo 
de  soluções  a  serem  examinadas  foi  restrito  a  10  ou  me¬ 
nos  porque  o  processo  de  segmentação  não  incluiria  em 
geral  mais  de  seis  ou  sete  segmentos. 

Vendo  esses  resultados,  percebemos  que  diversos 
dos  agrupamentos  envolvidos  (4, 7,  9  e  10)  são  pequenos 
e  estão  abaixo  do  tamanho  exigido  de  cinco,  anterior¬ 
mente  definido.  Logo,  esses  quatro  agrupamentos,  que 
contêm  um  total  de  sete  observações  (7,  24,  44,  84,  87, 
90  e  92),  serão  eliminados.  É  interessante  observar  que 
todas  essas  observações  tinham  valores  de  Mahala- 
nobis  relativamente  mais  elevados  quando  observações 
atípicas  estavam  sendo  avaliadas  (ver  Tabela  8-5),  e  as 
duas  observações  que  foram  anteriormente  identificadas 
como  possíveis  casos  atípicos  com  os  maiores  valores 
(24  e  84)  estão  neste  conjunto  de  observações  a  serem 
eliminadas. 


TABELA  8-7  Tamanhos  de  agregados  para  a  análise  hierárquica  inicial 


10  agrupamentos  iniciais 

Soluções^ 

Identificação 

Membros 

10 

9 

8 

7 

6 

5 

4 

3 

2 

1 

1 ,6,8,30,33,34,39,40,41 ,42,49,50, 
55,63,68,69,70,75,86,95,97,100 

22 

51 

51 

51 

60 

60 

60 

78 

96 

2 

2,3,16,23,27,29,45,47,52, 

53,58,60,61,79,85,88,94 

17 

17 

17 

18 

18 

18 

18 

3 

4,5,1 1 ,12,14,17,21 ,25,26,28,31 ,35, 
37,38,51,54,56,62,65,67,74,77,78, 
80,82,89,91,93,96 

29 

4 

7,87,92 

3 

3 

3 

3 

3 

3 

4 

4 

4 

5 

9,10,15,18,19,46,48,57,66,73 

10 

10 

16 

16 

16 

18 

18 

18 

6 

13,20,22,43,71,99 

6 

6 

7 

24 

1 

1 

1 

8 

32,36,59,64,72,76,81,83,98 

9 

9 

9 

9 

9 

44,90 

2 

2 

2 

2 

2 

10 

84 

1 

1 

1 

1 

1 

1 

“Os  valores  nas  células  são  número  de  observações  em  agrupamentos  para  cada  solução  (p.ex.,  na  solução  de  10  agrupamentos,  o  agregado  1  tem  22  obser¬ 
vações  e  se  une  com  o  agregado  3  na  solução  de  9  agrupamentos  para  uma  alocação  combinada  de  51  observações). 
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Resultados  reespecificados 

A  eliminação  de  sete  observações  requer  que  a  análise  de 
agrupamentos  seja  novamente  executada  sobre  as  93  ob¬ 
servações  remanescentes.  O  processo  de  exame  de  tama¬ 
nhos  de  agregados,  identificando  potenciais  eliminações  e 
então  retratando  o  processo  de  agrupamento,  será  discu¬ 
tido  na  próxima  seção. 

Avaliação  de  tamanhos  de  agrupamentos.  O  processo 
prossegue  como  antes,  com  os  resultados  reespecificados 
também  examinados  quanto  a  tamanhos  inadequados  de 
agrupamentos.  Agregados  abaixo  dos  tamanhos  conside¬ 
rados  administrativamente  significantes  são  candidatos  à 
eliminação.  Espera-se  que  observações  atípicas  já  sejam 
identificadas  antes  da  reespecificação,  mas  o  pesquisador 
pode  considerar  agregados  adicionais  de  um  só  elemento  ou 
aqueles  extremamente  pequenos  também  como  observa¬ 
ções  atípicas  que  podem  ser  omitidas  em  análise  posterior. 

Pesquisadores  devem  cuidar,  porém,  para  não  caírem 
em  “looping”  com  a  contínua  eliminação  de  pequenos 
agregados  para  então  reespecificarem  a  análise  de  agru¬ 
pamentos.  Deve  ser  usado  discernimento  para  aceitar  um 
pequeno  agrupamento  e  mantê-lo  na  análise  em  algum 
ponto;  caso  contrário,  o  processo  pode  começar  a  eliminar 
segmentos  pequenos  mas  representativos.  Os  agregados 
pequenos  mais  problemáticos  a  serem  mantidos  são  aque¬ 
les  que  não  se  unem  a  não  ser  muito  adiante  no  proces¬ 
so.  Pequenos  agregados  surgidos  nos  maiores  intervalos 
de  soluções  consideradas  podem  ser  mantidos,  pois  eles 
ocorrem  somente  em  soluções  que  não  são  fortemente 
consideradas  para  possível  seleção. 


As  soluções  de  10  a  2  agregados  da  análise  hierárquica 
reespecificada  são  mostradas  na  Tabela  8-8.  Reespecifi- 
cando  e  eliminando  sete  observações,  o  número  de  agre¬ 
gados  pequenos  caiu  substancialmente,  com  somente 


três  agrupamentos  (2,  4  e  10)  tendo  quatro  observações 
ou  menos. 

Ainda  que  tais  agregados  sejam  muito  pequenos  para 
representar  segmentos  viáveis,  eles  não  foram  eliminados 
neste  estágio  por  diversas  razões.  Para  os  agregados  2  e 
4,  estes  agrupamentos  combinaram  nas  primeiras  soluções 
de  agrupamento  (nove  e  oito)  de  forma  que  eles  não  afe¬ 
tam  as  soluções  esperadas  de  seis  ou  menos.  Para  o  agre¬ 
gado  10,  este  juntou-se  na  solução  de  seis  agrupamentos, 
de  maneira  que  afetaria  os  resultados  se  uma  solução  de 
sete  agrupamentos  fosse  escolhida.  Se  a  solução  de  sete 
agrupamentos  é  escolhida  com  este  agregado  pequeno,  ele 
será  considerado  um  segmento  pequeno  mas  relevante. 


Descrição  do  processo  de  agrupamento.  Com  as  solu¬ 
ções  consideradas  como  contendo  agregados  de  tamanhos 
apropriados,  prosseguimos  examinando  o  real  processo  de 
agrupamento  por  meio  (1)  do  coeficiente  de  aglomeração 
e  do  esquema  de  agrupamento  e  (2)  do  dendrograma. 

Esquema  de  agrupamento.  Examinemos  primeira¬ 
mente  o  esquema  de  agrupamento  produzido  por  SPSS 
(ver  Tabela  8-9).  Os  cinco  elementos  descrevendo  cada 
estágio  de  agrupamento  são: 

•  Estágio:  O  passo  no  processo  de  agrupamento  onde  os  dois 
agregados  mais  parecidos  são  combinados.  Um  processo 
hierárquico  sempre  envolve  N  -1  estágios,  onde  N  é  o  nú¬ 
mero  de  observações  sendo  agregadas. 

•  Agrupamentos  combinados:  Informação  detalhando  quais 
são  os  dois  agregados  que  estão  sendo  combinados  em  cada 
estágio. 

•  Coeficiente  de  aglomeração:  Uma  medida  do  aumento*  em 
heterogeneidade  que  ocorre  quando  os  dois  agrupamentos 


*  N.  de  R.  T.:  A  frase  correta  seria  “Uma  medida  de  heterogeneida¬ 
de”.  A  análise  de  valores  consecutivos  deste  coeficiente  permitirá  a 
verificação  de  aumentos. 


TABELA  8-8  Tamanhos  de  agregados  para  a  análise  hierárquica  de  agrupamento  reespecificada 


10  agrupamentos  iniciais 

Soluções^ 

Identificação 

Membros 

10 

9 

8 

7 

6  5 

4 

3 

2 

1 

1 ,6,8,30,33,34,39,41 ,42,49,50, 
55,63,68,69,70,75,86,95,97,100 

21 

22 

22 

22 

22  51 

51 

60 

77 

2 

40 

1 

3 

2,16,23,27,29,45,47,52, 

53,60,61,85,88 

13 

13 

17 

17 

17  17 

17 

17 

4 

3,58,79,94 

4 

4 

5 

4,12,21 ,31 ,35,51 ,54,62,65,80 

10 

10 

10 

29 

29 

6 

5,11,14,17,25,26,28,37,38,56,67, 

74,77,78,82,89,91,93,96 

19 

19 

19 

7 

9,10,15,18,19,46,48,57,66,73 

10 

10 

10 

10 

10  10 

16 

16 

16 

8 

13,20,22,43,71,99 

6 

6 

6 

6 

6  6 

9 

32,36,64,72,83,98 

6 

6 

6 

6 

9  9 

9 

10 

59,76,81 

3 

3 

3 

3 

‘Valores  nas  células  são  número  de  observações  em  agrupamentos  para  cada  solução  (p.ex.,  na  solução  de  10  agrupamentos,  o  agregado  1 
tem  21  observações  e  se  une  ao  agregado  2  na  solução  de  9  agrupamentos  para  uma  alocação  combinada  de  22  observações). 


CAPÍTULO  8  Análise  de  Agrupamentos  465 


são  combinados.  Para  a  maioria  dos  métodos  de  ligação,  o 
coeficiente  de  aglomeração  é  a  distância  entre  os  dois  casos 
de  agrupamentos  sendo  combinados. 

•  Estágio  em  que  o  agrupamento  surge  pela  primeira  vez: 
Identifica  o  estágio  anterior  no  qual  cada  agrupamento  sen¬ 
do  combinado  foi  envolvido.  Valores  nulos  indicam  que  o 
agrupamento  ainda  é  de  um  elemento  só,  e  não  combinado 
antes  daquele  estágio. 

•  Próximo  estágio  em  que  novo  agrupamento  surge:  Denota 
o  próximo  estágio  no  qual  o  novo  agregado  é  combinado 
com  outro. 


Examinemos  dois  estágios  (1  e  84)  da  Tabela  8-9  para 
ilustrar  o  que  o  esquema  de  agrupamento  retrata  no  pro¬ 
cesso  aglomerativo: 

•  Estágio  1:  Aqui  vemos  que  os  agrupamentos  23  e  29  são 
os  primeiros  dois  grupos  a  se  unirem,  com  um  coeficien¬ 
te  de  aglomeração  de  0,719.  Sabemos  que  eles  são  agru¬ 
pamentos  unitários  porque  a  coluna  "Estágio  em  que 

o  agrupamento  surge  pela  primeira  vez"  indica  estágio 
0,  o  que  significa  que  eles  não  foram  agregados  antes. 
Finalmente,  o  agrupamento  formado  neste  estágio  é 
combinado  novamente  no  estágio  7. 

•  Estágio  84:  Neste,  os  agrupamentos  1  e  8  são  unidos 
com  um  coeficiente  de  aglomeração  de  12,439.  Podemos 
perceber  que  o  agrupamento  1  foi  inicialmente  formado 
no  estágio  76,  enquanto  que  o  agregado  8  é  um  agru¬ 
pamento  unitário  com  um  valor  de  zero  (ver  discussão 
anterior).  Finalmente,  podemos  ver  que  este  agrupa¬ 


mento  combina  a  seguir  no  estágio  88,  onde  é  chamado 
de  agregado  1. 


A  informação  do  esquema  de  agrupamento  descreve 
completamente  o  processo,  permitindo  ao  pesquisador  se¬ 
guir  qualquer  observação  isolada  ou  agregado  por  todo  o 
processo.  Também  fornece  informação  diagnóstica,  como 
a  habilidade  de  rapidamente  identificar  agrupamentos 
unitários  (ou  seja,  um  zero  na  coluna  “Estágio  em  que  o 
agrupamento  surge  pela  primeira  vez”). 


A  Tabela  8-9  contém  o  esquema  detalhado  de  agrupa¬ 
mento  para  a  análise  hierárquica  reespecificada.  Aqui 
percebemos  os  estágios  iniciais  e  finais,  com  os  interme¬ 
diários  omitidos  para  fins  de  concisão. 

Quando  examinamos  os  estágios  iniciais,  percebe¬ 
mos  que  a  maior  parte  da  atividade  está  centrada  na 
união  de  agrupamentos  unitários,  como  é  de  se  esperar. 
No  entanto,  vemos  em  dois  casos  (estágios  7  e  9)  que 
agrupamentos  formados  em  estágios  anteriores  já  estão 
sendo  unidos  com  outros  agregados.  Nos  estágios  finais 
vemos  o  padrão  de  agrupamento  já  retratado  na  Tabela 
8-8.  Por  exemplo,  o  estágio  84  corresponde  à  combina¬ 
ção  de  agregados  (agrupamentos  1  e  2  combinando)  que 
ocorre  indo  da  solução  de  10  agrupamentos  para  a  de  9 
na  Tabela  8-8.  Vemos  a  presença  do  agregado  unitário 
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TABELA  8-9  Coeficiente  de  aglomeração  e  esquema  de  agrupamento  para  análise  hierárquica  reespecificada 


Agrupamentos  combinados 

Coeficiente  de 
aglomeração 

Estágio  em  que  o  agrupamento 
surge  peia  primeira  vez 

Próximo  estágio  no  qual 
novo  agrupamento  surge 

Estágio  Agrupamento  1 

Agrupamento  2 

Agrupamento  1  Agrupamento  2 

1 

23 

29 

0,719 

0 

0 

7 

2 

72 

76 

1,023 

0 

0 

28 

3 

36 

39 

1,256 

0 

0 

47 

4 

41 

64 

1,414 

0 

0 

9 

5 

16 

19 

1,484 

0 

0 

33 

6 

65 

67 

1,526 

0 

0 

15 

7 

23 

31 

1,574 

1 

0 

23 

8 

3 

17 

1,746 

0 

0 

17 

9 

41 

42 

1,901 

4 

0 

18 

10 

89 

92 

2,179 

0 

0 

34 

Estágios  intermediários  de  11  a  83  omitidos 

84 

1 

8 

12,439 

76 

0 

88 

85 

23 

24 

13,389 

80 

47 

91 

86 

40 

41 

13,759 

78 

81 

88 

87 

89 

91 

14,877 

83 

71 

90 

88 

1 

40 

15,068 

84 

86 

90 

89 

72 

82 

16,451 

79 

82 

92 

90 

1 

89 

18,210 

88 

87 

91 

91 

1 

23 

19,209 

90 

85 

92 

92 

1 

72 

23,098 

91 

89 

0 
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(2  na  Tabela  8-8)  representado  pelo  zero  na  coluna  “Es¬ 
tágio  em  que  o  agrupamento  surge  pela  primeira  vez”. 
Em  todos  os  demais  estágios,  os  dois  agrupamentos 
sendo  combinados  já  são  um  resultado  de  combinações 
prévias,  de  forma  que  nenhum  outro  agregado  unitário 
existe.  Esta  condição  pode  ser  confirmada  revendo-se  a 
Tabela  8-8. 


Dendrograma.  O  dendrograma  fornece  um  retra¬ 
to  gráfico  do  processo  de  agrupamento.  A  estrutura  em 
árvore  do  dendrograma  retrata  cada  estágio  do  processo. 
Tipicamente  o  gráfico  é  escalonado,  de  maneira  que  dis¬ 
tâncias  menores  entre  combinações  indicam  maior  homo¬ 
geneidade. 


A  Figura  8-11  é  o  dendrograma  para  a  análise  hierárqui¬ 
ca  reespecificada  de  93  observações.  Como  esperado,  o 
agrupamento  inicial  está  entre  observações  muito  simi¬ 
lares,  mas  o  processo  se  torna  estendido  quando  o  núme¬ 
ro  de  agrupamentos  diminui.  No  topo  do  dendrograma 
podemos  ver  o  agregado  de  17  observações  (agrupamen¬ 
tos  3  e  4  na  Tabela  8-8)  e  na  base  está  o  agrupamento  de 

16  observações  (agrupamentos  7  e  8  na  Tabela  8-8).  O 
meio  do  dendrograma,  que  em  última  instância  forma  o 
agregado  de  60  observações  na  solução  de  três  agrupa¬ 
mentos,  retrata  a  formação  dos  demais  agregados,  o  que 
envolve  muito  mais  complexidade  e  menos  distinção. 

O  processo  de  agrupamento  pode  ser  examinado  co¬ 
meçando  no  nível  individual  e  agregando  no  sentido  de 
um  número  menor  de  agregados,  ou  indo  ao  contrário, 
começando  no  último  estágio  (onde  os  dois  últimos  agre¬ 
gados  são  combinados)  e  compreendendo  como  cada  um 
daqueles  agregados  foi  formado.  Por  exemplo,  olhando 
o  topo  do  dendrograma  percebemos  o  agrupamento  de 

17  observações,  que  é  bastante  distinto  (o  topo  do  den¬ 
drograma).  Olhando  para  trás  aqui,  podemos  ver  como 
essas  17  observações  foram  combinadas.  O  dendrogra¬ 
ma  também  permite  uma  inspeção  visual  quanto  a  possí¬ 
veis  observações  atípicas,  onde  uma  delas  seria  um  ramo 
que  não  se  uniu  a  não  ser  muito  tarde.  Um  exemplo  é  o 
último  caso  no  dendrograma  (84),  no  qual  esta  informa¬ 
ção  não  é  juntada  até  uma  fase  avançada  no  processo 
aglomerativo. 


Determinação  das  soluções 
preliminares  de  agrupamento 

Até  este  ponto,  detalhamos  os  aspectos  do  processo  de 
agrupamento,  ainda  que  não  tenhamos  tratado  desta 
questão  fundamental:  qual  é  a  solução  final?  Devemos  no¬ 


tar  que  na  maioria  das  situações,  uma  única  solução  final 
não  será  identificada  na  análise  hierárquica.  Em  vez  disso, 
um  conjunto  de  soluções  preliminares  é  identificado.  Tais 
soluções  formam  a  base  para  a  análise  não-hierárquica, 
a  partir  da  qual  uma  solução  final  é  selecionada.  Mesmo 
que  uma  solução  final  não  seja  reconhecida  neste  estágio, 
o  pesquisador  deve  executar  duas  análises-chave  para 
identificar  o  melhor  conjunto  de  soluções  preliminares: 

1.  Aplicar  a  regra  de  parada  para  reconhecer  um  pequeno  nú¬ 
mero  de  soluções  para  consideração  posterior. 

2.  Examinar  os  perfis  de  cada  solução  sobre  as  variáveis  de 
agrupamento  para  estabelecer  a  relevância  de  cada  agrupa¬ 
mento  para  a  questão  de  pesquisa. 

Essas  análises  fornecem  uma  descrição  mais  detalhada 
dos  agregados  em  cada  solução  e  como  eles  se  relacionam 
à  questão  de  pesquisa.  Contudo,  mesmo  com  ambas,  o  jul¬ 
gamento  do  pesquisador  se  torna  o  fator  mais  importante 
na  escolha  da  solução  final  que  pode  melhor  tratar  a  ques¬ 
tão  de  pesquisa. 

Aplicação  das  regras  de  parada.  Quantos  agregados  de¬ 
vemos  ter?  Como  os  dados  envolvem  perfis  de  clientes 
HBAT  e  nosso  interesse  reside  na  identificação  de  tipos 
ou  perfis  desses  clientes  que  podem  formar  a  base  para  di¬ 
ferentes  estratégias,  um  número  administrável  de  segmen¬ 
tos,  sob  uma  perspectiva  estratégica  e  tática,  seria  algo  que 
não  seja  acima  de  seis  ou  sete.  Logo,  aplicamos  a  regra  da 
parada  com  base  na  avaliação  da  variação  de  heterogenei¬ 
dade  entre  soluções  para  identificar  um  conjunto  prelimi¬ 
nar  de  soluções  de  agrupamento.  O  foco  está  nas  soluções 
que  variam  de  10  a  2  agregados,  com  o  objetivo  de  escolher 
uma  ou  mais  soluções  no  intervalo  de  2  a  7  agregados. 

Variações  percentuais  em  heterogeneidade.  A  regra 
da  parada  é  baseada  na  avaliação  de  variações  de  hetero¬ 
geneidade  entre  soluções  de  agrupamentos.  O  raciocínio 
básico  é  que  quando  ocorrem  grandes  aumentos  de  he¬ 
terogeneidade,  o  pesquisador  escolhe  a  solução  anterior, 
pois  a  combinação  une  agrupamentos  muito  diferentes. 

O  coeficiente  de  aglomeração  é  particularmente  tratá- 
vel  para  uso  em  uma  regra  de  parada.  Pequenos  coeficien¬ 
tes  indicam  que  agrupamentos  bem  homogêneos  estão 
sendo  fundidos.  Em  contrapartida,  reunir  dois  agregados 
diferentes  resulta  em  um  grande  coeficiente.  Cada  combi¬ 
nação  de  agrupamentos  resulta  em  heterogeneidade  cres¬ 
cente,  de  modo  que  nos  concentramos  em  grandes  varia¬ 
ções  percentuais  no  coeficiente,  semelhante  ao  teste  scree 
em  análise  fatorial,  para  identificar  estágios  de  combina¬ 
ção  de  agrupamentos  que  sejam  sensivelmente  distintos. 
O  único  porém  é  que  esta  abordagem,  a  despeito  de  ser 
um  algoritmo  bastante  preciso,  tende  a  indicar  pouquíssi¬ 
mos  agrupamentos. 


CASO 

Rótulo 
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Dendrograma  usando  ligação  média  (entre  grupos) 

Distância  reescaionada  de  combinação  de  agregados 

5  10  15  20  25 

Núm  + . . + . + . + . -H 


FIGURA  8-11 


Dendrograma  de  análise  hierárquica  de  agrupamento  reespecificada. 
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O  coeficiente  de  aglomeração  mostra  grandes  aumentos 
quando  se  passa  dos  estágios  88  para  89  (15,068  versus 
16,451),  89  para  90  (16,451  versus  18,210)  e  91  para  92 
(19,209  versus  23,098).  Para  ajudar  a  quantificar  grandes 
aumentos  relativos  na  heterogeneidade  dos  agrupamen¬ 
tos,  calculamos  a  mudança  percentual  no  coeficiente  de 
agrupamento  para  os  estágios  incluindo  10  a  1  agrupa¬ 
mentos  (ver  Tabela  8-10).  O  maior  aumento  percentual 
ocorre  na  passagem  entre  os  estágios  91  e  92,  seguido 
pelos  estágios  89  a  90  e  88  a  89. 

No  entanto,  o  que  significa  a  seleção  de  uma  solu¬ 
ção  de  agrupamento?  Consideremos  o  maior  aumento 
(estágios  91  versus  92)  como  exemplo.  O  coeficiente  de 
aglomeração  para  o  estágio  92  é  de  23,098,  que  repre¬ 
senta  a  heterogeneidade  quando  os  dois  agrupamentos 
finais  são  unidos  em  um  só  agregado.  Como  geralmente 
é  encontrado,  este  é  um  coeficiente  bastante  elevado. 
O  estágio  91  representa  a  passagem  de  três  para  dois 
agrupamentos,  com  um  coeficiente  de  19,209.  Quando 
comparamos  os  coeficientes  de  aglomeração  desses  dois 
estágios,  percebemos  que  o  coeficiente  aumenta  em 
20,25%  do  estágio  91  para  o  92.  Isso  indica  que  a  cria¬ 
ção  da  solução  de  dois  agrupamentos  (passando  de  três 
para  dois  agregados)  resulta  em  sensivelmente  menos 
heterogeneidade  do  que  no  estágio  final  para  criação 
de  um  só  agrupamento.  Desse  modo,  consideramos  a 
configuração  de  dois  agrupamentos  como  uma  solução 
potencial. 

Seguindo  esta  lógica,  identificamos  as  soluções  de 
dois,  quatro  e  cinco  agrupamentos  como  candidatas 
para  o  conjunto  preliminar  de  soluções  a  serem  exa¬ 
minadas  posteriormente  pela  análise  não-hierárquica. 
No  entanto,  deve  ser  notado  que  o  aumento  na  hete¬ 
rogeneidade  no  estágio  final  (aqui,  dois  agrupamentos 
são  unidos  para  formar  um)  sempre  será  grande.  Ou 
seja,  a  solução  de  dois  agrupamentos  será,  em  geral, 
sempre  identificada  através  desse  procedimento,  ainda 


que  possa  representar  valor  limitado  no  atendimento 
a  muitos  objetivos  de  pesquisa.  Pesquisadores  devem 
evitar  a  tentação  de  dizer  que  a  solução  de  dois  agru¬ 
pamentos  é  a  melhor  por  envolver  a  maior  variação  em 
heterogeneidade.  Para  este  fim,  selecionamos  a  solução 
de  três  agrupamentos  como  uma  das  soluções  prelimi¬ 
nares,  pois  ela  é  parecida  com  a  de  dois  agrupamentos, 
mas  fornece  alguma  visão  sobre  a  estrutura  básica  além 
dos  dois  grupos. 

Apesar  de  também  podermos  examinar  as  outras 
soluções,  escolhemos  somente  as  de  cinco  e  seis  agru¬ 
pamentos  por  diversas  razões.  A  solução  de  cinco  agru¬ 
pamentos  representa  a  maior  solução  indicada  pela 
regra  da  parada.  Mas  também  examinamos  a  de  seis 
agrupamentos  para  garantir  que  uma  solução  maior 
não  fornece  uma  solução  melhor  em  termos  de  grupos 
de  clientes. 


A  regra  da  parada  identificou  três  soluções  (com  cinco, 
quatro  e  dois  agrupamentos)  como  candidatas  para  o  con¬ 
junto  preliminar  de  soluções  a  serem  consideradas  na  aná¬ 
lise  não-hierárquica.  A  solução  de  cinco  agrupamentos  foi 
selecionada  e  a  de  três  agregados  foi  a  substituta  para  a  de 
duas,  para  fornecer  o  nível  mínimo  de  visão  exigida  sobre 
o  cliente.  A  solução  de  seis  agrupamentos  também  foi  in¬ 
cluída  para  garantir  que  nenhuma  visão  adicional  é  con¬ 
seguida  a  partir  de  mais  do  que  cinco  grupos  de  clientes. 
Essas  três  soluções  são  agora  examinadas  em  termos  do 
grau  e  tipos  de  diferenças  entre  agregados  para  finalizar 
as  soluções  utilizadas  nos  próximos  estágios  da  análise  de 
agrupamentos. 

Perfil  das  variáveis  de  agrupamento.  Antes  de  proceder 
com  a  análise  não-hierárquica,  fazemos  o  perfil  de  cada 
solução  sobre  as  variáveis  de  agrupamento  para  garantir 
que  cada  solução  seja  distinta  e  que  as  diferenças  entre 
agrupamentos  sejam  significantes  sob  a  ótica  da  questão 
de  pesquisa. 


TABELA  8-10  Regra  de  parada  para  a  análise  hierárquica  de  agrupamentos  reespecificada 


Estágio 

PROCESSO  HIERÁRQUICO 

REGRA  DE  PARADA 

Coeficiente  de  agiomeração 

Número  de  agrupamentos 

Vaior 

Aumento  percentual 
para  o  próximo  estágio 

Antes  de  unir 

Depois  de  unir 

84 

10 

9 

12,439 

7,64 

85 

9 

8 

13,389 

2,76 

86 

8 

7 

13,759 

8,13 

87 

7 

6 

14,877 

1,23 

88 

6 

5 

15,068 

9,18 

89 

5 

4 

16,451 

10,69 

90 

4 

3 

18,210 

5,49 

91 

3 

2 

19,209 

20,25 

92 

2 

1 

23,098 

- 
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A  Figura  8-12  fornece  uma  análise  de  perfil  das  três  so¬ 
luções  de  agrupamento  baseadas  nas  10  variáveis.  Ao  se 
compararem  soluções,  dois  pontos  surgem: 

1.  A  solução  de  três  grupos  é  claramente  distinta  das 
de  cinco  e  seis  agregados,  fornecendo  uma  solução 
alternativa  viável  para  comparação  no  processo 
não-hierárquico.  Cada  um  dos  três  agrupamentos  é 
relativamente  distinto  e  varia  em  magnitude  sobre 
as  variáveis.  O  padrão  de  um  agrupamento  sendo 
elevado  em  todas  as  variáveis,  outro  baixo  nas  mes¬ 
mas  e  um  terceiro  no  meio  termo  é  evitado. 

2.  Não  obstante,  as  diferenças  são  muito  menos  distin¬ 
tas  entre  as  soluções  com  seis  e  cinco  agrupamentos. 


A  mudança  da  solução  de  seis  agregados  para  a  de 
cinco  é  conseguida  ao  se  unir  os  agrupamentos  1  e 
3  na  solução  de  seis  agregados  (porção  superior  da 
Figura  8-12).  O  agrupamento  resultante  (1  na  solu¬ 
ção  de  cinco  agregados)  difere  sobre  apenas  duas  va¬ 
riáveis  (Ag  e  X^^)  que  constituem  o  fator  de  Suporte 
Técnico  formado  no  Capítulo  3.  Ao  longo  de  sete  das 
oito  variáveis  remanescentes,  esses  dois  agrupamen¬ 
tos  são  bastante  semelhantes,  com  apenas  pequenas 
diferenças  sobre  A,.  Assim,  a  solução  de  seis  agrupa¬ 
mentos  difere  da  de  cinco  somente  no  sentido  de  que 
dois  agregados  se  diferenciam  em  termos  de  Suporte 
Técnico.  Tais  diferenças  podem  não  ser  considera- 
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Solução  de  seis  agrupamentos 


Agrupamento 

-_-1 

-  -2 

—  -3 

—  -  4 
---■5 

—  6 

13 


Nota:  Todas  as  variáveis  são  estatisticamente  significantes  no  nível  0,000 


Agrupamento 

---1 

-  -2 
--3 
....4 

—  5 


•^9  •^18  •^16  ^7  -^10  -^12  -^8  -^14  -^6  -^13 

Variáveis  de  agrupamento 

Nota:  Todas  as  variáveis,  exceto  e  são  estatisticamente 
significantes  no  nível  0,000 

FIGURA  8-12  Análise  de  perfil  de  variáveis  padronizadas  para  as  soluções  hierárquicas  de  seis,  cinco  e  três  agrupamentos.  (Continua) 


Variável  de 
agrupamento 

Centróides  para  a  solução  de 
cinco  agrupamentos 

1 

2 

3 

4 

5 

^9 

-0,319 

0,895 

1,099 

0,627 

-1 ,046 

■^18 

-0,256 

0,692 

1,353 

0,541 

-1 ,085 

•^16 

-0,133 

0,670 

0,853 

0,454 

-1 ,244 

^7 

0,015 

-0,817 

0,640 

1,967 

-0,800 

•^10 

0,000 

-0,385 

0,701 

1,322 

-3,44 

Xi2 

0,021 

-0,767 

0,715 

1,750 

-1 ,089 

^8 

-0,068 

0,434 

-0,304 

-0,075 

0,212 

Xi4 

-0,103 

0,314 

-0,248 

0,131 

0,097 

^6 

-0,056 

0,621 

-1,210 

0,900 

0,637 

•^13 

0,297 

-1 ,304 

1,124 

0,254 

-0,997 

Tamanho 

51 

17 

10 

6 

9 

•^9  ■^16  ^7  ^10  ^12  -^14  ^6  ^ 

Variáveis  de  agrupamento 


Solução  de  cinco  agrupamentos 
3-1 - 


2- 


Variável  de 
agrupamento 

Centróides  para  a  solução  de  seis  agrupamentos 

1 

2 

3 

4 

5 

6 

^9 

-0,238 

0,895 

-0,380 

1,099 

0,627 

-1 ,046 

•^18 

-0,210 

0,692 

-0,291 

1,353 

0,541 

-1 ,085 

•^16 

-0,015 

0,670 

-0,221 

0,853 

0,454 

-1 ,244 

^7 

-0,083 

-0,817 

0,089 

0,640 

1,967 

-0,800 

•^10 

0,374 

-0,385 

-0,284 

0,701 

1,322 

-3,44 

Xi2 

0,004 

-0,767 

0,033 

0,715 

1,750 

-1 ,089 

^8 

-0,916 

0,434 

0,575 

-0,304 

-0,075 

0,212 

Xi4 

-1 ,028 

0,314 

0,600 

-0,248 

0,131 

0,097 

^6 

-0,056 

0,621 

-0,057 

-1 ,210 

0,900 

0,637 

•^13 

0,429 

-1 ,304 

0,198 

1,124 

0,254 

-0,997 

Tamanho 

22 

17 

29 

10 

6 

9 
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Solução  de  três  agrupamentos 


Agrupamento 

---1 

-  -2 
--3 


-^9  -^18  -^16  -^7  -^10  -^12  -^8  -^14  ^6  •^13 

Variáveis  de  agrupamento 

Nota:  Todas  as  variáveis,  exceto  e  são 
estatisticamente  significantes  no  nível  0,000 

FIGURA  8-12  Continuação. 

Nota'.  Variáveis  de  agrupamento  foram  ordenadas  nos  gráficos  e  tabelas  para  corresponderem  aos  fatores  encontrados  na  solução  de  quatro 
agrupamentos*  (ver  Capítulo  3). 


Variável  de 
agrupamento 

Centróides  para  a  solução 
de  três  agrupamentos 

1 

2 

3 

-0,428 

0,895 

0,922 

•^18 

-0,380 

0,692 

1,049 

•^16 

-0,299 

0,670 

0,703 

^7 

-0,119 

-0,817 

1,137 

•^10 

-0,052 

-0,385 

0,934 

Xi2 

-0,146 

-0,767 

1,103 

^8 

-0,026 

0,434 

-0,218 

Xi4 

-0,073 

0,314 

-0,106 

^6 

0,048 

0,621 

-0,419 

•^13 

0,103 

-1,304 

0,798 

Tamanho 

60 

17 

16 
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das  significantes  o  suficiente  para  apoiar  a  inclusão 
de  ambas  as  soluções  de  cinco  e  de  seis  agregados  no 
conjunto  preliminar  de  soluções  finais. 


Seleção  das  soluções  preliminares.  Pode  parecer  ótimo 
para  as  regras  de  parada  e  para  as  análises  de  perfil  a  iden¬ 
tificação  de  somente  uma  solução  de  agrupamentos  para 
análise  posterior  no  processo  não-hierárquico,  mas  pes¬ 
quisadores  são  defrontados  mais  freqüentemente  com  um 
pequeno  conjunto  de  soluções  que  vale  a  pena  para  con¬ 
sideração  posterior.  A  meta  do  pesquisador  neste  estágio 
é  definir  o  menor  conjunto  de  soluções  que  representam 
diferentes  perspectivas  sobre  a  estrutura  inerente  e  seg¬ 
mentação  das  observações. 


Apesar  de  a  regra  de  parada  ser  o  ponto  de  partida 
para  a  identificação  de  três  soluções  de  agrupamentos 
como  candidatas  à  inclusão  na  análise  não-hierárqui- 
ca,  um  exame  mais  próximo  por  meio  do  perfil  das  va¬ 
riáveis  revelou  somente  limitadas  diferenças  entre  as 
soluções  de  seis  e  cinco  agrupamentos.  Em  nossa  opi¬ 
nião,  as  diferenças  não  eram  grandes  o  bastante  e  nem 
variadas  no  conjunto  de  variáveis.  Para  fins  de  parci¬ 
mônia,  escolhemos  a  solução  de  cinco  agrupamentos 
com  a  de  três  como  o  conjunto  preliminar  de  soluções 
a  ser  analisado  com  mais  detalhes  pelos  procedimen¬ 
tos  não-hierárquicos. 


*  N.  de  R.  T.:  A  frase  correta  seria  "...  para  corresponderem  aos  fato¬ 
res  encontrados  na  solução  de  quatro  fatores  (ver  Capítulo  3).” 


Resumo  do  processo  hierárquico  de  agrupamento 

O  objetivo  da  análise  hierárquica  de  agrupamentos  foi 
identificar  uma  solução  ou  um  pequeno  número  de  solu¬ 
ções  que  pudessem  ser  analisadas  pelos  procedimentos 
hierárquicos**  para  identificar  uma  solução  final.  Neste 
método,  capitalizamos  os  pontos  fortes  do  processo  hie¬ 
rárquico  (sua  habilidade  de  avaliar  uma  grande  quantia 
de  soluções  e  facilidade  de  comparação  entre  as  mes¬ 
mas)  enquanto  deixamos  a  escolha  final  da(s)  melhor(es) 
solução(ões)  para  os  procedimentos  não-hierárquicos. 


Em  nosso  exemplo  de  segmentação  envolvendo  os  100 
clientes  HBAT,  usamos  10  percepções  da  HBAT  como 
as  variáveis  de  agrupamento  no  processo  hierárquico. 
Inspeção  inicial  dos  agregados  indicou  uma  eliminação 
de  sete  observações  representando  aquelas  que  são  atí¬ 
picas  ou  segmentos  muito  pequenos  para  se  considerar 
nesta  análise. 

A  análise  reespecificada  identificou  três  soluções 
(com  seis,  cinco  e  três  agrupamentos)  como  candida¬ 
tas  para  uso  no  processo  hierárquico***.  Em  seguida, 
o  perfil  das  variáveis  de  agrupamento  indicou  uma  falta 
de  distinção  suficiente  entre  as  soluções  com  seis  e  cinco 
agrupamentos,  de  forma  que  somente  as  soluções  com 
três  e  cinco  agrupamentos  foram  mantidas  no  conjunto 
preliminar  de  soluções  a  serem  usadas  na  análise  não- 
hierárquica  que  se  segue. 


**  N.  de  R.  T.:  A  frase  correta  seria  “...  pelos  procedimentos  não-hie- 
rárquicos”. 

***  N.  de  R.  T.:  O  correto  é  “não-hierárquico”. 
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Passo  2:  Análise  não-hierárquica  de 
agrupamentos  (Estágios  4, 5  e  6) 

O  método  hierárquico  de  agrupamento  facilitou  uma 
avaliação  abrangente  de  uma  vasta  gama  de  soluções. 
Essas  soluções  são  afetadas,  porém,  por  uma  caracterís¬ 
tica  em  comum:  uma  vez  que  agrupamentos  são  unidos, 
eles  jamais  são  separados  no  processo.  Selecionamos  um 
algoritmo  hierárquico  que  minimiza  o  impacto  dessa  ca¬ 
racterística,  mas  métodos  não-hierárquicos  ainda  detêm  a 
vantagem  de  serem  capazes  de  otimizar  as  soluções  pela 
redesignação  de  observações  até  que  seja  conseguida  uma 
heterogeneidade  mínima  dentro  dos  conglomerados. 

Este  segundo  passo  no  processo  de  agrupamento  uti¬ 
liza  métodos  hierárquicos  em  combinação  com  os  proce¬ 
dimentos  não-hierárquicos.  Especificamente,  o  número 
de  agrupamentos  e  os  pontos  sementes  para  cada  agrupa¬ 
mento  são  determinados  a  partir  de  resultados  hierárqui¬ 
cos.  Em  seguida  empregamos  os  procedimentos  não-hie- 
rárquicos  para  o  desenvolvimento  de  uma  solução  ótima 
para  cada  número  de  agregados.  Tais  soluções  são  então 
comparadas  em  termos  de  validade  de  critério,  bem  como 
de  aplicabilidade  à  questão  de  pesquisa  para  se  escolher 
uma  solução  como  a  final. 

Estágio  4:  Determinação  de  agrupamentos 
e  avaliação  do  ajuste  geral 

O  principal  elemento  do  segundo  passo  é  o  emprego  de 
técnicas  não-hierárquicas  para  melhorar  os  resultados  a 
partir  dos  procedimentos  hierárquicos.  Ao  executar  uma 
análise  não-hierárquica,  um  pesquisador  deve  tomar  duas 
decisões: 

1.  Como  serão  gerados  os  pontos  sementes  para  os  agrupa¬ 
mentos? 

2.  Qual  algoritmo  de  agrupamento  será  utilizado? 

A  discussão  a  seguir  trata  desses  dois  pontos  em  rela¬ 
ção  ao  uso  de  resultados  hierárquicos  no  procedimento 
não-hierárquico. 

Especificação  de  pontos  sementes  de  agrnpamento.  A 

primeira  tarefa  em  análise  de  agrupamentos  não-hierár- 
quica  é  a  seleção  do  método  para  especificação  de  pontos 
sementes,  o  ponto  inicial  para  cada  agrupamento.  A  partir 
disso,  o  algoritmo  designa  observações  e  forma  agregados. 
Dois  métodos  para  escolha  de  sementes  são  geração  por 
amostragem  (ou  seja,  seleção  ao  acaso)  e  especificação 
pelo  pesquisador.  Os  métodos  de  geração  por  amostra¬ 
gem,  apesar  de  operacionalmente  simples,  sofrem  de  uma 
falta  de  teoria  inerente  na  formação  de  agrupamentos. 
Além  disso,  eles  são  difíceis  de  replicação  ao  longo  das 
amostras.  Em  contrapartida,  a  abordagem  via  especifica¬ 
ção  do  pesquisador  exige  alguma  base  conceituai  ou  em¬ 
pírica  para  as  sementes.  Apesar  de  ela  demandar  análise 
adicional  ou  pesquisa  anterior  para  especificação  dos  pon¬ 


tos  sementes,  a  abordagem  via  pesquisador  é  geralmente 
a  opção  preferida  por  conta  da  estrutura  que  ela  impõe 
sobre  o  processo  não-hierárquico. 

A  abordagem  mais  comum  para  derivação  de  centrói- 
des  especificados  pelo  pesquisador  é  usar  a  solução  hie¬ 
rárquica,  seja  pela  seleção  de  uma  observação  de  cada 
agrupamento  para  representar  o  mesmo,  seja,  como  é 
mais  comum,  pelo  uso  dos  centróides  como  pontos  se¬ 
mente.  Deve  ser  observado  que  tipicamente  a  obtenção 
de  centróides  demanda  análise  adicional  para  a  seleção 
de  soluções  a  serem  usadas  na  análise  não-hierárquica  e 
para  derivar  os  centróides  a  partir  do  perfil  de  cada  solu¬ 
ção.  Esses  perfis  não  são  tipicamente  gerados  na  análise 
hierárquica;  fazer  isso  iria  exigir  tremendo  esforço,  pois  a 
geração  de  N  -1  soluções  e  a  obtenção  de  um  perfil  para 
cada  uma  delas  seria  ineficiente. 


O  processo  de  agrupamento  hierárquico  é  usado  para  ge¬ 
rar  os  pontos  sementes.  Como  discutido  na  seção  anterior, 
as  soluções  de  três  e  cinco  agrupamentos  foram  determi¬ 
nadas  como  soluções  que  seriam  posteriormente  analisa¬ 
das  por  meio  dos  procedimentos  não-hierárquicos. 

Todas  as  10  variáveis  serão  usadas  na  análise  não- 
hierárquica:  assim,  os  pontos  sementes  demandam  valo¬ 
res  iniciais  sobre  cada  variável  para  cada  agrupamento. 
Os  centróides  mostrados  nas  tabelas  da  Figura  8-12  atu¬ 
arão  como  pontos  sementes  para  ambas  as  soluções.  Por 
exemplo,  na  solução  de  cinco  agrupamentos,  os  valores 
na  tabela  representam  os  centróides  para  cada  um  dos 
cinco  agrupamentos  ao  longo  das  10  variáveis.  Analoga¬ 
mente,  centróides  para  a  solução  de  três  agrupamentos 
são  também  dados  na  tabela  inferior. 


Seleção  de  um  algoritmo  de  agrupamento.  Com  as  se¬ 
mentes  especificadas,  o  pesquisador  deve  então  escolher 
o  algoritmo  a  ser  usado  para  formar  agrupamentos.  Um 
benefício  básico  de  métodos  não-hierárquicos  é  a  habili¬ 
dade  de  formar  uma  solução  completamente  separada  de 
qualquer  outra.  Tal  procedimento  está  em  contraste  com 
métodos  hierárquicos,  nos  quais  qualquer  solução  é  dire¬ 
tamente  baseada  na  combinação  de  dois  agrupamentos  da 
solução  anterior.  Desse  modo,  métodos  não-hierárquicos 
são  geralmente  preferidos  quando  possível,  pois  eles  ti¬ 
picamente  melhoram  uma  solução  existente  desenvolvida 
durante  um  processo  hierárquico. 


Para  nossos  propósitos,  usamos  o  algoritmo  de  otimiza¬ 
ção  em  SPSS,  o  qual  permite  a  designação  de  observa¬ 
ções  entre  agrupamentos  de  forma  iterativa,  até  que  um 
nível  mínimo  de  heterogeneidade  seja  alcançado.  Em 
nosso  exemplo,  observações  são  inicialmente  agrupadas 
para  a  semente  mais  próxima.  Quando  todas  as  observa- 
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ções  são  designadas,  cada  uma  delas  é  avaliada  para  ver 
se  ainda  está  no  agrupamento  mais  próximo.  Caso  con¬ 
trário,  ela  é  redesignada  a  um  agregado  mais  próximo.  O 
processo  continua  até  que  a  heterogeneidade  nos  agru¬ 
pamentos  não  possa  diminuir  com  novas  movimentações 
de  observações  entre  os  agregados. 


Formação  de  agrupamentos.  Com  as  sementes  de  agru¬ 
pamento  e  o  algoritmo  especificados,  o  processo  pode 
iniciar.  Com  um  algoritmo  de  otimização,  o  processo  con¬ 
tinua  a  redesignar  observações  até  que  uma  nova  designa¬ 
ção  não  melhore  a  homogeneidade  interna. 


Usando  os  centróides  dos  resultados  hierárquicos  de 
agrupamento,  o  procedimento  não-hierárquico  gerou  as 
soluções  de  três  e  cinco  agregados  mostradas  na  Figura 
8-13.  Duas  diferenças  entre  as  soluções  hierárquicas  e 
não-hierárquicas  são  notáveis: 

•  Tamanhos  dos  agrupamentos.  As  soluções  não-hierár¬ 
quicas,  talvez  por  conta  da  habilidade  de  redesignar  ob¬ 
servações  entre  agrupamentos,  têm  uma  dispersão  mais 
uniforme  de  observações  entre  os  agrupamentos.  Como 
exemplo,  a  solução  de  três  agrupamentos  da  análise 
hierárquica  tem  agrupamentos  de  60, 17  e  16  observa¬ 
ções.  Em  contrapartida,  a  análise  não-hierárquica  re¬ 
sultou  em  agrupamentos  de  39,  28  e  26  observações.  A 
despeito  de  agrupamentos  de  tamanhos  relativamente 
parecidos  não  ser  um  critério  para  sucesso,  eles  são  uma 
indicação  de  que  o  processo  hierárquico  pode  ter  res¬ 
tringido  os  resultados  pelo  impedimento  de  observações 
trocarem  de  agrupamentos,  uma  vez  unidas. 

•  Significância  de  diferença  de  variáveis.  Outra  diferença 
fundamental  entre  as  duas  soluções  é  a  habilidade  do 
processo  não-hierárquico  de  delinear  agrupamentos 
que  são  mais  distintos  do  que  as  soluções  hierárquicas. 
Nas  soluções  de  cinco  e  três  agrupamentos,  as  variáveis 
Xg  e  não  eram  significativamente  distintas  ao  longo 
dos  agregados.  Observe  que  essas  duas  variáveis  eram 
as  diferenças  de  distinção  entre  os  agrupamentos  unidos 
para  formar  a  solução  de  cinco  agregados.  Parece  que 

a  falta  de  capacidade  do  processo  hierárquico  para  re¬ 
designar  observações  entre  agrupamentos  resultou  em 
agrupamentos  que  explicam  menos  variação  do  que  as 
contrapartes  não-hierárquicas. 


Resumo.  O  processo  não-hierárquico  de  agrupamento 
gerou  soluções  de  três  e  cinco  agregados  baseadas  nos 
pontos  semente  gerados  pela  análise  de  agrupamento  hie¬ 
rárquica.  Ainda  que  o  número  de  agrupamentos  seja  simi¬ 
lar,  as  soluções  variam  entre  os  dois  métodos.  As  soluções 
não-hierárquicas  foram  mais  semelhantes  em  tamanho  e 
demonstraram  diferenças  mais  significantes  entre  agrupa¬ 
mentos  sobre  o  conjunto  de  variáveis.  Análise  subseqüen- 
te  em  termos  de  perfil  dessas  duas  soluções  e  avaliação  da 
validade  de  critério  das  mesmas  fornecerá  os  elementos 
necessários  para  selecionar  uma  solução  final. 


Estágio  5:  Interpretação  dos  agrupamentos 

Com  o  processo  não-hierárquico  completo,  o  pesquisador 
deve  agora  avaliar  as  duas  soluções  competidoras  e  esco¬ 
lher  uma  como  a  solução  final  de  agrupamento  a  ser  usada 
para  fins  de  segmentação.  No  entanto,  antes  de  estabele¬ 
cer  o  perfil  de  cada  solução  ou  de  avaliar  a  validade  de 
critério  das  mesmas,  o  pesquisador  deve  definir  o  caráter 
de  cada  agrupamento  em  termos  da  variável  estatística 
(variáveis  de  agrupamento).  Fazendo  isso,  o  pesquisador 
fornece  uma  fundamentação  para  compreender  a  habili¬ 
dade  de  cada  solução  em  atender  aos  objetivos  da  questão 
de  pesquisa,  bem  como  avalia  sua  correspondência  com 
quaisquer  agrupamentos  sugeridos  por  teoria  ou  por  pes¬ 
quisa  anterior.  No  estágio  4,  examinamos  os  agrupamentos 
quanto  a  distinção,  mas  aqui  consideramos  a  significância 
prática  dos  agrupamentos  no  atendimento  dos  objetivos 
de  segmentação  de  mercado.  Qual  é  a  melhor  segmenta¬ 
ção  de  mercado  -  com  cinco  segmentos  ou  com  três? 

Para  os  propósitos  deste  exemplo,  ênfase  será  coloca¬ 
da  na  descrição  de  cada  agrupamento  em  termos  da  variá¬ 
vel  estatística. 


Os  resultados  para  as  soluções  de  cinco  e  de  três  agru¬ 
pamentos  são  mostrados  na  Figura  8-13.  Ao  avaliar  os 
perfis  sobre  as  variáveis  de  agrupamento,  devemos  lem¬ 
brar  de  alguns  dos  resultados  da  análise  fatorial  execu¬ 
tada  sobre  essas  10  variáveis  (ver  Capítulo  3).  Os  quatro 
fatores,  definidos  como  dimensões  de  variáveis  que  são 
altamente  correlacionadas,  são:  Serviço  de  Pós-Venda 
ao  Consumidor  {Xg,  X^g,  e  ;  Marketing  (Vjj,  Xj  e 
Ajo);  Suporte  Técnico  (Ag  e  Aj4)  e  Valor  do  Produto  (Ag 
e  Ajj).  Assim,  agrupamentos  devem  ter  um  padrão  se¬ 
melhante  nas  variáveis  em  cada  fator,  mas  espera-se  que 
padrões  de  diferenças  apareçam  entre  fatores.* 

Vendo  as  duas  soluções,  diversos  pontos  surgem: 

•  Variação  substancial  na  variável  estatística  inteira. 

Nas  soluções  de  três  e  cinco  agrupamentos,  os  perfis 
mostram  sensíveis  diferenças  em  cada  variável  de  agru¬ 
pamento.  Esses  perfis  contrastam  com  os  resultados 
hierárquicos,  onde  diferenças  eram  muito  pequenas 
sobre  diversas  variáveis.  Diferenças  maiores  sobre  cada 
variável  fazem  de  cada  uma  delas  uma  contribuidora 
potencial  para  diferenças  entre  agrupamentos. 

•  Perfis  distintos.  Além  de  diferenças  sobre  cada  variável, 
também  percebemos  que  os  perfis  de  cada  agrupamen¬ 
to  são  mais  distintos,  particularmente  na  solução  de 
três  agrupamentos,  onde  os  três  são  diferentes  uns  dos 
outros  no  intervalo  inteiro  da  variável  estatística.  Nova¬ 
mente,  essa  distinção  acrescenta  significância  prática  no 
sentido  de  que  cada  segmento  tem  um  perfil  distinto  que 
pode  ser  tratado  em  uma  estratégia  de  segmentação. 

A  questão  é:  qual  solução  de  agrupamento  é  melhor? 
Cada  uma  tem  suas  vantagens  e  desvantagens.  A  de  cinco 
agrupamentos  oferece  maior  diferenciação  entre  agru- 

{Continua) 

•  N.  de  R.  T.:  A  frase  correta  seria  “...  apareçam  entre  os  agrupa¬ 
mentos.” 
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Solução  de  cinco  agrupamentos 


Variável  de 
agrupamento 

Centróides  para  a  solução 
de  cinco  agrupamentos 

1 

2 

3 

4 

5 

-0,416 

0,880 

0,811 

0,151 

-0,704 

•^18 

-0,295 

0,720 

1,079 

0,064 

-0,741 

•^16 

-0,262 

0,670 

0,754 

0,203 

-0,654 

-0,293 

-0,624 

0,529 

1,444 

-0,400 

•^10 

0,230 

-0,506 

0,441 

0,849 

-0,260 

Xi2 

-0,257 

-0,651 

0,518 

1,432 

-0,402 

-0,872 

0,490 

-0,131 

-0,081 

0,641 

Xi4 

-1 ,039 

0,399 

-0,113 

-0,012 

0,705 

0,068 

0,566 

-1,255 

0,584 

0,184 

■^13 

0,309 

-1,106 

0,775 

0,216 

-0,069 

Tamanho 

23 

20 

14 

16 

24 

A/ofa;  Todas  as  variáveis  de  agrupamento  são  significativamente 
distintas  no  nível  de  significância  de  0,000 


Solução  de  três  agrupamentos 


Variável  de 
agrupamento 

Solução  de  três  agrupamentos 

1 

2 

3 

*^9 

-0,558 

-0,022 

0,799 

•^18 

-0,492 

-0,037 

0,804 

•^16 

-0,418 

-0,051 

0,707 

-0,031 

-0,560 

0,765 

■^10 

0,216 

-0,466 

0,670 

Xi2 

-0,041 

-0,662 

0,879 

*^8 

-0,757 

0,651 

-0,073 

Xi4 

-0,893 

0,642 

-0,029 

•^6 

-0,225 

0,382 

-0,073 

■^13 

0,315 

-0,566 

0,385 

Tamanho 

28 

39 

26 

Nota-,  Todas  as  variáveis  de  agrupamento  são  significativamente 
distintas  no  nível  de  significância  de  0,000 


FIGURA  8-13  Soluções  não-hierárquicas®:  com  cinco  e  três  agrupamentos  com  análise  de  perfis  de  variáveis  de  agrupamento  padronizadas. 

Wofa;  Variáveis  de  agrupamento  foram  ordenadas  nos  gráficos  e  nas  tabelas  para  corresponderem  aos  agregados  encontrados  na  solução  de  quatro 
agrupamentos*  (ver  Capítulo  3). 

“Pontos  sementes  iniciais  foram  fornecidos  pelos  centróides  a  partir  da  análise  hierárquica  de  agrupamentos. 


(Continuação) 

pamentos;  cada  um  deles  representa  um  conjunto  menor 
e  mais  homogêneo  de  clientes.  No  entanto,  esses  perfis 
verdadeiramente  representam  diferenças  significativas? 
Ou  a  solução  mais  parcimoniosa  de  três  agrupamentos, 
com  maiores  diferenças  entre  menos  agrupamentos,  é  a 
mais  útil? 


Tais  comparações  são  apenas  descritivas  e  oferecem 
uma  visão  sobre  o  caráter  de  cada  agrupamento.  Apesar 

*  N.  de  R.  T.:  A  frase  correta  seria  "...  na  solução  de  quatro  fatores...”. 


de  as  comparações  serem  úteis  na  caracterização  de  cada 
agrupamento,  a  próxima  seção  tenta  distinguir  as  duas  so¬ 
luções  em  termos  de  validade  de  critério  ou  de  seus  perfis 
associados  a  fim  de  designar  uma  das  soluções  como  a  fi¬ 
nal  a  ser  usada  para  fins  de  segmentação. 

Estágio  6:  Validação  e  perfil  dos  agrupamentos 

Nesse  estágio  final,  os  processos  de  validação  e  de  per¬ 
fil  são  críticos  devido  ao  aspecto  exploratório  e  muitas 
vezes  sem  base  teórica  da  análise  de  agrupamentos.  É 
essencial  que  o  pesquisador  realize  todos  os  testes  pos- 
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síveis  para  confirmar  a  validade  da  solução  de  agrupa¬ 
mentos  enquanto  também  garante  que  a  solução  tenha 
significância  prática.  Os  pesquisadores  que  minimizam 
ou  pulam  esse  passo  correm  o  risco  de  aceitar  uma  so¬ 
lução  que  é  específica  apenas  para  aquela  amostra  e  que 
tem  generalidade  limitada  ou  até  mesmo  pouco  uso  além 
de  sua  mera  descrição  dos  dados  sobre  as  variáveis  de 
agrupamento. 

Validação  das  soluções  de  agrupamento.  O  processo  de 
validação  é  atingido  em  dois  passos.  Primeiro,  os  agrupa¬ 
mentos  são  avaliados  quanto  a  validade  preditiva  sobre 
quatro  medidas  adicionais  de  resultado  (satisfação,  nível 
de  compra  etc.)  que  são  indicativas  do  potencial  para  es¬ 
tratégias  diferenciadas  entre  os  agrupamentos.  Segundo, 
a  solução  de  agrupamentos  com  a  maior  validade  de  crité¬ 
rio  é  avaliada  aplicando-se  métodos  alternativos  de  agru¬ 
pamento  e  comparando  as  soluções. 

Avaliação  da  validade  de  critério.  Para  avaliar  a 
validade  preditiva,  focalizamos  as  variáveis  que  têm  uma 
relação  teórica  com  as  variáveis  de  agrupamento  mas  não 
foram  incluídas  na  solução  de  aglomeração.  Dada  essa  re¬ 
lação,  deveríamos  ver  diferenças  significantes  nessas  va¬ 
riáveis  ao  longo  dos  agrupamentos.  Se  existirem  diferen¬ 
ças  significantes  sobre  essas  variáveis,  poderemos  chegar  à 
conclusão  de  que  os  agrupamentos  descrevem  agregados 
que  têm  validade  preditiva. 


Para  este  propósito,  consideramos  quatro  medidas  de 
resultado: 

X^g  Satisfação 

dfjQ  Probabilidade  de  recomendar 

díjj  Probabilidade  de  comprar 

X22  Nível  de  compra 

Estas  variáveis  têm  uma  relação  conceituai  com  a  va¬ 
riável  estatística  de  agrupamento,  e  uma  (díj,)  mostrou 
ter  uma  relação  precisa  com  as  variáveis  de  agrupamen¬ 
to  através  de  regressão  múltipla.  Cada  medida  de  resul¬ 
tado  é  então  examinada  quanto  a  diferenças  nos  agrupa¬ 
mentos  nas  soluções  de  cinco  e  três  agrupamentos  (ver 
Tabela  8-11). 

Para  a  solução  de  cinco  agrupamentos,  as  razões  F 
univariadas  mostram  que  as  médias  dos  grupos  para  três 
das  quatro  variáveis  são  significantemente  diferentes. 
Mas  X21  (Probabilidade  de  compra)  não  exibe  diferen¬ 
ças  significantes  ao  longo  dos  cinco  agrupamentos.  No 
entanto,  a  solução  de  três  agrupamentos  tem  diferenças 
marcantes  em  todas  as  quatro  medidas  de  resultado.  As¬ 
sim,  apenas  em  termos  desses  testes  estatísticos,  a  solu¬ 
ção  de  três  agrupamentos  é  superior  à  de  cinco. 

A  solução  de  três  agrupamentos  também  apóia 
as  relações  esperadas  com  as  medidas  de  resultado? 
Como  notado  anteriormente,  é  esperado  que  cada 

_ {Contimía) 


TABELA  8-11 

Avaliação  de  validade  de  critério  para  as  soluções  não-hierárquicas  de  três  e  cinco  agrupamentos 

SOLUÇÃO  DE  CINCO  AGRUPAMENTOS 

Satisfação 

Xjj  Probabiiidade  de  recomendar 

Xj,  Probabilidade  de  comprar 

X22  Nível  de  compra 

Agrupamento 

Centróides  de  agrupamento 

1 

6,665 

6,826 

7,683 

56,70 

2 

7,370 

7,410 

7,900 

65,60 

3 

7,007 

6,993 

7,643 

58,50 

4 

7,800 

7,725 

8,042 

62,42 

5 

6,429 

6,633 

7,550 

53,75 

Significância  estatística  de  variáveis  de  critério 

Valor  F 

4,432 

3,630 

0,787 

7,939 

Significância 

0,003 

0,009 

0,537 

0,000 

SOLUÇÃO  DE  TRÊS  AGRUPAMENTOS 

Satisfação 

Xjj  Probabiiidade  de  recomendar 

Xj,  Probabilidade  de  comprar 

X22  Nível  de  compra 

Agrupamento 

Centróides  de  agrupamento 

1 

6,411 

6,693 

7,446 

54,36 

2 

6,818 

6,941 

7,695 

58,95 

3 

7,742 

7,573 

8,108 

63,58 

Valor  F 
Significância 


Significância  estatística  de  variáveis  de  critério 

11,566  5,998  3,781 

0,000  0,004  0,027 


9,166 

0,000 
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uma  das  medidas  de  resultado  varie  em  relação  às 
variáveis  de  agrupamento.  Do  exemplo  de  regressão 
múltipla  no  Capítulo  4,  sabemos  que  as  variáveis  de 
agrupamento  estão  positivamente  relacionadas  a  X^g 
(Satisfação).  Dada  essa  relação,  espera-se  que  agrupa¬ 
mentos  com  percepções  melhores  da  HBAT  tenham 
níveis  maiores  de  satisfação. 

Se  retornarmos  à  Figura  8-13,  poderemos  rever  os 
perfis  de  cada  um  dos  agrupamentos  na  solução  de  três 
agregados  ao  longo  das  variáveis.  Nenhum  desses  três 
agrupamentos  tem  os  maiores  escores  de  percepção  na 
variável  estatística  inteira,  mas  poderíamos  caracterizar 
o  agregado  3  como  o  de  percepções  mais  favoráveis  da 
HBAT  no  geral,  porque  são  maiores  em  6  das  10  variá¬ 
veis.  Assim,  esperaríamos  que  o  agrupamento  3  também 
tivesse  a  maior  satisfação  com  a  HBAT. 

O  exame  de  satisfação  (Aj,)  para  a  solução  de  três 
agrupamentos  na  Tabela  8-11  embasa  essa  relação,  e  o 
agrupamento  3  também  tem  os  maiores  valores  sobre  as 
outras  três  medidas  de  resultado  Ajj  e  X22),  como 
se  esperava  dada  a  relação  das  mesmas  com  satisfação. 
Logo,  a  solução  de  três  agrupamentos  tem  o  mais  alto 
nível  de  validade  de  critério  e  embasa  a  relação  encon¬ 
trada  com  outras  técnicas  multivariadas. 


A  avaliação  da  validade  de  critério  é  um  passo  essen¬ 
cial  na  validação  de  qualquer  solução  de  agrupamento. 
Em  nosso  caso,  a  solução  de  três  agrupamentos  demons¬ 
trou  superioridade  sobre  a  de  cinco,  de  forma  que  será 
selecionada  para  análise  posterior.  Se  ela  for  suportada 
nos  testes  adicionais  de  validação  e  nas  análises  de  perfil, 
ela  será  designada  como  a  solução  de  agrupamento  mais 
adequada  como  base  de  segmentação. 

Aplicação  de  uma  segunda  análise  não-hierárqui- 

ca.  Como  uma  segunda  verificação  de  validade  quanto 
à  estabilidade  da  solução  de  agrupamento,  uma  segunda 
análise  não-hierárquica  é  executada,  desta  vez  permitindo 
que  o  procedimento  selecione  ao  acaso  os  pontos  semen¬ 
tes  iniciais  para  ambas  as  soluções.  O  objetivo  é  determi¬ 
nar  o  grau  de  consistência  entre  as  duas  soluções,  ainda 
que  elas  sejam  baseadas  em  conjuntos  totalmente  dife¬ 
rentes  de  pontos  sementes.  Um  nível  aceitável  de  consis¬ 
tência  permitiria  a  suposição  de  uma  estrutura  natural  de 
mercado  entre  as  observações. 


Os  resultados  na  Tabela  8-12  confirmam  uma  consistên¬ 
cia  nos  resultados  para  ambas  as  soluções  de  três  agru¬ 
pamentos,  uma  obtida  usando-se  sementes  especificadas 
(da  análise  hierárquica)  e  a  outra  usando  sementes  gera¬ 
das  por  amostragem  (observações  aleatoriamente  sele¬ 
cionadas).  Os  perfis  de  agrupamento  mostram  uma  cor¬ 
respondência  geral  ao  longo  da  maior  parte  da  variável 


estatística  de  agrupamento,  e  uma  tabulação  cruzada  das 
soluções  de  agrupamento  mostra  que  aproximadamen¬ 
te  dois  terços  de  cada  agrupamento  estão  em  agregados 
comparáveis  em  cada  solução. 

Assim,  dada  a  estabilidade  dos  resultados  entre  as 
sementes  especificadas  e  seleção  ao  acaso,  a  administra¬ 
ção  se  sentiria  confiante  de  que  existem  diferenças  ver¬ 
dadeiras  entre  clientes  em  termos  de  suas  percepções  da 
HBAT  e  que  a  estrutura  descrita  na  análise  de  agrupa¬ 
mentos  é  empiricamente  embasada. 


Perfil  da  solução  final  de  agrupamento.  A  tarefa  final 
é  caracterizar  os  agrupamentos  em  um  conjunto  de  va¬ 
riáveis  adicionais  não  incluídas  na  variável  estatística  de 
agrupamento  ou  usadas  para  avaliar  validade  preditiva. 
A  importância  da  identificação  de  perfis  únicos  sobre  es¬ 
ses  conjuntos  de  variáveis  adicionais  reside  na  avaliação 
da  significância  prática  dos  mesmos  e  de  sua  base  teórica. 
Ao  avaliar  significância  prática,  o  pesquisador  pode  exigir 
que  os  agrupamentos  exibam  diferenças  em  um  conjunto 
de  variáveis  adicionais. 


Nesse  exemplo,  várias  características  dos  clientes  da 
HBAT  estão  disponíveis.  Essas  incluem  X^  (tipo  de 
cliente),  X^  (tipo  de  indústria),  X^  (tamanho  da  firma), 
A4  (região)  e  Aj  (sistema  de  distribuição).  A  Tabela  8-13 
fornece  um  perfil  descritivo  da  solução  de  três  agrupa¬ 
mentos  sobre  essas  características.  Como  podemos  ver, 
três  dessas  variáveis  (Aj,  Aj  e  A4)  mostram  diferenças 
significantes  nos  três  agrupamentos.  A  partir  dessas  va¬ 
riáveis,  perfis  distintos  podem  ser  desenvolvidos  para 
cada  agrupamento.  Esses  perfis  embasam  a  distinção  dos 
agrupamentos  sobre  variáveis  não  usadas  na  análise  em 
qualquer  ponto  anterior. 


Uma  análise  de  segmentação  bem-sucedida  não  ape¬ 
nas  exige  a  identificação  dos  grupos  homogêneos  (agrupa¬ 
mentos),  mas  também  que  eles  sejam  identificáveis  (des¬ 
critos  de  maneira  única  sobre  outras  variáveis).  Quando  a 
análise  de  agrupamentos  é  empregada  para  verificar  uma 
tipologia  ou  outros  agrupamentos  propostos  de  objetos, 
variáveis  associadas,  sejam  dados  de  entrada  ou  de  resul¬ 
tados,  podem  ser  caracterizadas  para  garantir  a  corres¬ 
pondência  dos  grupos  dentro  de  um  modelo  teórico  mais 
amplo. 

Uma  visão  gerencial  do  processo  de  agrupamentos 

A  análise  de  agrupamentos  foi  usada  em  uma  de  suas  apli¬ 
cações  mais  básicas  -  realização  de  uma  segmentação  de 
mercado.  Como  descrito  acima,  foram  identificadas  di¬ 
versas  classificações  possíveis  para  segmentação  que  po¬ 
deriam  ser  usadas  no  desenvolvimento  de  estratégias  de 
marketing. 
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TABELA  8-12  Comparação  de  soluções  não-hierárquicas  de  três  agrupamentos  usando  sementes  de  uma  análise  de  agrupamentos 
hierárquica  versus  sementes  ao  acaso 


Solução  não-hierárquica  de  três  agrupamentos  baseada  em  sementes  ao  acaso 

SOLUÇÃO  DE  TRÊS  AGRUPAMENTOS  BASEADA  EM  SEMENTES  AO  ACASO 

Centróides  iniciais  de  agrupamento 

Centróides  finais  de  agrupamento 

Variáveis  de  agrupamento 

1 

2 

3 

1 

2 

3 

Xg  Qualidade  do  produto 

0,63741 

0,63741 

-0,93821 

0,58011 

-0,21708 

-0,25165 

X-,  Atividades  de  comércio  eletrônico 

-0,67379 

-0,67379 

0,89648 

-0,34342 

-0,37844 

0,69466 

Xg  Suporte  técnico 

1 ,98307 

-1 ,34927 

-1,74131 

0,64080 

-0,20244 

-0,49084 

Xg  Solução  de  reclamação 

0,54452 

-1 ,85534 

0,95829 

0,37192 

-0,84803 

0,54737 

X,„  Anúncio 

-1 ,07370 

-0,80749 

2,20952 

-0,25226 

-0,16493 

0,65205 

X,2  Imagem  da  equipe  de  venda 

-1 ,23377 

-2,07308 

0,81785 

-0,38381 

-0,42663 

0,74711 

X,3  Preço  competitivo 

-1 ,34235 

-0,88929 

1,11711 

-0,74690 

0,17752 

0,61272 

X,4  Garantia  e  reclamações 

1,41143 

-1 ,27236 

-1 ,63833 

0,62023 

-0,32588 

-0,44787 

X,g  Encomenda  e  cobrança 

1 ,20796 

-1 ,26825 

0,34667 

0,34975 

-0,78934 

0,52858 

X,g  Velocidade  de  entrega 

0,83601 

-1,88716 

0,97217 

0,36529 

-0,88710 

0,64351 

Número  de  casos 

35 

29 

29 

Tabulação  cruzada  de  soluções  não-hierárquicas  de  três  grupos 

Sementes  de  análise  de  agrupamentos  hierárquica 

Agrupamento 

1 

2 

3 

Total 

Sementes  ao  acaso 

1 

1 

28 

6 

35 

2 

18 

11 

29 

3 

9 

20 

29 

Total 

28 

39 

26 

93 

Perfis  de  variável  de  agrupamento 

Solução  de  agrupamento  baseada  Solução  de  agrupamento  baseada 

em  sementes  ao  acaso  em  sementes  de  análise  hierárquica 
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TABELA  8-13  Perfil  da  solução  não-hierárquica  de  três  grupos  sobre  características  associadas  de  firma 


X^Tipo  de  cliente" 

1 

Agrupamento 

2 

3 

Totai 

Menos  de  1  ano 

Número 

15 

9 

4 

28 

%  dentro  do  agrupamento 

53,6% 

23,1% 

15.4% 

30.1% 

De  1  a  5  anos 

Número 

10 

10 

13 

33 

%  dentro  do  agrupamento 

35,7% 

25,6% 

50,0% 

35,5% 

Mais  de  5  anos 

Número 

3 

20 

9 

32 

%  dentro  do  agrupamento 

10,7% 

51 ,3% 

34,6% 

34,4% 

Total 

Número 

28 

39 

26 

93 

%  dentro  do  agrupamento 

100,0% 

100,0% 

100,0% 

100,0% 

‘Valor  do  qui-quadrado  de  1 8,03  é  significante  no  nível  0,001 . 

Agrupamento 

X^Tipo  de  indústria'’ 

1 

2 

3 

Totai 

Indústria  de  revistas 

Número 

12 

21 

17 

50 

%  dentro  do  agrupamento 

42,9% 

53,8% 

65,4% 

53,8% 

Indústria  de  jornais 

Número 

16 

18 

9 

43 

%  dentro  do  agrupamento 

57,1% 

46,2% 

34,6% 

46,2% 

Total 

Número 

28 

39 

26 

93 

%  dentro  do  agrupamento 

100,0% 

100,0% 

100,0% 

100,0% 

‘Valor  do  qui-quadrado  de  2,752  não  é  significante. 

Agrupamento 

X3  Tamanho  da  firma" 

1 

2 

3 

Totai 

Pequena  (0-499) 

Número 

8 

30 

7 

45 

%  dentro  do  agrupamento 

28,6% 

76,9% 

26,9% 

48,4% 

Grande  (SOO-i-) 

Número 

20 

9 

19 

48 

%  dentro  do  agrupamento 

71 ,4% 

23,1% 

73,1% 

51 ,6% 

Total 

Número 

28 

39 

26 

93 

%  dentro  do  agrupamento 

100,0% 

100,0% 

100,0% 

100,0% 

"Valor  do  qui-quadrado  de  21 ,91 5  é  significante  no  nível  0,001 . 

Agrupamento 

X,  Região" 

1 

2 

3 

Totai 

EUAAmérica  do  Norte 

Número 

7 

28 

4 

39 

%  dentro  do  agrupamento 

25,0% 

71 ,8% 

15,4% 

41 ,9% 

Fora  da  América  do  Norte 

Número 

21 

11 

22 

54 

%  dentro  do  agrupamento 

75,0% 

28,2% 

84,6% 

58,1% 

Total 

Número 

28 

39 

26 

93 

%  dentro  do  agrupamento 

100,0% 

100,0% 

100,0% 

100,0% 

‘Valor  do  qui-quadrado  de  25,106  é  significante  no  nível  0,001. 

Agrupamento 

X5  Sistema  de  distribuição" 

1 

2 

3 

Totai 

Indireto  através  de  corretor 

Número 

18 

22 

13 

53 

%  dentro  do  agrupamento 

64,3% 

56,4% 

50,0% 

57,0% 

Direto  ao  cliente 

Número 

10 

17 

13 

40 

%  dentro  do  agrupamento 

35,7% 

43,6% 

50,0% 

43,0% 

Total 

Número 

28 

39 

26 

93 

%  dentro  do  agrupamento 

100,0% 

100,0% 

100,0% 

100,0% 

"Valor  do  qui-quadrado  de  2,752  nâo  é  significante 
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O  conjunto  de  análises  de  agrupamentos  (hierárquicas  e 
não-hierárquicas)  foi  bem  sucedido  em  não  apenas  criar 
grupos  homogêneos  de  clientes  baseados  em  suas  per¬ 
cepções  da  HBAT,  mas  também  foi  constatado  que  es¬ 
ses  agrupamentos  atendem  aos  testes  de  validade  predi- 
tiva  e  distinção  sobre  conjuntos  adicionais  de  variáveis, 
todos  necessários  para  atingir  significância  prática.  Os 
segmentos  representam  perspectivas  bem  diferentes  dos 
clientes  sobre  a  HBAT,  variando  em  ambos  os  tipos  de 
variáveis  que  são  vistas  mais  positivamente,  bem  como 
na  magnitude  das  percepções. 

Neste  exemplo,  a  solução  de  três  agrupamentos  foi 
escolhida  por  causa  de  sua  distinção  e  da  forte  relação 
com  os  resultados  relevantes.  No  entanto,  argumentos 
semelhantes  podem  ser  feitos  para  outras  soluções  (p.ex., 
uma  solução  com  dois  ou  cinco  agrupamentos),  pois  elas 
também  são  segmentos  viáveis  de  mercado,  com  tama¬ 
nho  substancial  e  diferenças  significativas  em  termos  de 
percepções.  Em  cada  caso,  os  agrupamentos  (segmentos 
de  mercado)  representam  conjuntos  de  clientes  com  per¬ 
cepções  homogêneas  que  podem  ser  univocamente  iden¬ 
tificados,  sendo  assim  principais  candidatos  a  programas 
de  marketing  diferenciados. 


Essa  amplitude  de  possíveis  abordagens  de  segmen¬ 
tação  pode  ser  vista  como  um  espectro  de  perspectivas 
alternativas  sobre  os  clientes  fornecido  ao  pesquisador. 
A  solução  de  dois  agrupamentos  pode  fornecer  um  deli¬ 
neamento  básico  de  clientes  que  variam  em  percepções  e 
comportamentos  de  compra,  ou  a  solução  de  cinco  agre¬ 
gados  pode  ser  vista  com  uma  estratégia  de  segmentação 
mais  complexa,  que  fornece  um  composto  altamente  dife¬ 
renciado  de  percepções  de  clientes,  bem  como  opções  de 
segmentos-alvo. 

Resumo 

A  análise  de  agrupamentos  pode  ser  uma  técnica  de  re¬ 
dução  de  dados  muito  útil.  Mas  sua  aplicação  é  mais  uma 
arte  do  que  uma  ciência,  e  pode  facilmente  ser  usada  erro¬ 
neamente  ou  com  abuso  pelos  pesquisadores.  Diferentes 
medidas  de  similaridade  e  diferentes  algoritmos  podem 
afetar  os  resultados,  e  de  fato  o  fazem.  Se  o  pesquisador 
procede  com  cautela,  contudo,  a  análise  de  agrupamentos 
pode  ser  uma  valiosa  ferramenta  para  identificar  padrões 
latentes,  pela  sugestão  de  agrupamentos  úteis  de  objetos 
que  não  são  discerníveis  por  meio  de  outras  técnicas  mul- 
tivariadas.  Este  capítulo  ajuda  você  a  fazer  o  seguinte: 

Definir  análise  de  agrnpamentos,  sens  papéis  e  suas  limita¬ 
ções.  Análise  de  agrupamentos  é  um  conjunto  de  técni¬ 
cas  multivariadas  cuja  principal  meta  é  reunir  objetos  com 
base  nas  características  que  eles  possuem.  A  análise  de 
agrupamentos  classifica  objetos  (p.ex.,  respondentes,  pro¬ 
dutos  ou  outras  coisas)  de  modo  que  cada  objeto  é  similar 


a  outros  no  agrupamento  em  relação  a  um  conjunto  de 
características  selecionadas.  Os  agrupamentos  resultantes 
de  objetos  devem  exibir  elevada  homogeneidade  interna 
(dentro  do  agrupamento)  e  elevada  heterogeneidade  ex¬ 
terna  (entre  agrupamentos).  Se  o  processo  é  bem  sucedi¬ 
do,  os  objetos  dentro  dos  agrupamentos  estarão  próximos 
uns  dos  outros  quando  representados  geometricamente,  e 
diferentes  agrupamentos  estarão  distantes  entre  si.  Entre 
os  papéis  mais  comuns  executados  pela  análise  de  agrupa¬ 
mentos  estão:  (1)  redução  de  dados,  na  qual  um  pesquisa¬ 
dor  coleta  dados  por  meio  de  um  questionário  e  se  depara 
com  uma  grande  quantia  de  observações  que  carecem  de 
sentido  a  menos  que  sejam  classificadas  em  grupos  admi¬ 
nistráveis,  e  (2)  geração  de  hipóteses,  na  qual  a  análise 
de  agrupamentos  é  utilizada  para  desenvolver  hipóteses 
sobre  a  natureza  dos  dados  ou  para  examinar  hipóteses 
anteriormente  estabelecidas.  As  críticas  mais  comuns  e, 
portanto,  as  limitações  da  análise  de  agrupamentos  são: 

(1)  seu  caráter  descritivo,  não-teórico  e  não-inferencial; 

(2)  sua  capacidade  de  sempre  criar  agrupamentos,  inde¬ 
pendentemente  da  existência  de  qualquer  estrutura  real 
nos  dados;  e  (3)  a  falta  de  generalidade  das  soluções  devi¬ 
do  ao  fato  de  serem  totalmente  dependentes  das  variáveis 
usadas  como  base  da  medida  de  similaridade. 

Identificar  as  questões  de  pesquisa  abordadas  na  análise 
de  agrupamentos.  Ao  formar  grupos  homogêneos,  a 
análise  de  agrupamentos  pode  abordar  qualquer  combi¬ 
nação  de  três  questões  básicas  de  pesquisa: 

1.  Descrição  taxonômica.  O  uso  mais  tradicional  de  análise  de 
agrupamentos  tem  sido  para  hns  exploratórios  e  para  a  for¬ 
mação  de  uma  taxonomia  -  uma  classificação  empírica  de 
objetos.  Como  descrita  anteriormente,  a  análise  de  agrupa¬ 
mentos  tem  sido  utilizada  em  uma  vasta  gama  de  aplicações 
por  sua  habilidade  de  partição.  Análise  de  agrupamentos 
pode  também  gerar  hipóteses  relacionadas  à  estrutura  dos 
objetos.  Finalmente,  apesar  de  vista  principalmente  como 
uma  técnica  exploratória,  a  análise  de  agrupamentos  pode 
ser  utilizada  para  fins  confirmatórios.  Em  tais  casos,  uma  ti¬ 
pologia  (classificação  teórica)  proposta  pode  ser  comparada 
com  aquela  derivada  da  análise  de  agrupamentos. 

2.  Simplificação  de  dados.  Definindo  estrutura  entre  as  obser¬ 
vações,  a  análise  de  agrupamentos  também  desenvolve  uma 
perspectiva  simplificada  pela  agregação  de  observações  para 
análise  posterior.  Enquanto  a  análise  fatorial  tenta  fornecer 
dimensões  ou  estrutura  para  variáveis,  a  análise  de  agrupa¬ 
mentos  executa  a  mesma  tarefa  para  observações.  Assim, 
em  vez  de  todas  as  observações  serem  vistas  como  únicas, 
elas  podem  ser  vistas  como  membros  de  agrupamentos  e 
descritas  por  meio  de  suas  características  gerais. 

3.  Identificação  de  relação.  Com  os  agrupamentos  definidos 
e  a  estrutura  inerente  dos  dados  representada  nos  agrupa¬ 
mentos,  o  pesquisador  tem  uma  maneira  de  revelar  relações 
entre  as  observações  que  tipicamente  não  é  possível  com 
as  observações  individuais.  Se  técnicas  como  a  análise  dis¬ 
criminante  são  empregadas  para  identificar  empiricamente 
relações,  ou  se  os  grupos  são  examinados  por  métodos  mais 
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qualitativos,  a  estrutura  simplificada  da  análise  de  agrupa¬ 
mentos  freqüentemente  identifica  relações  ou  similaridades 
e  diferenças  que  não  foram  previamente  reveladas. 

Compreender  como  é  medida  a  similaridade  entre  obje¬ 
tos.  Similaridade  entre  objetos  pode  ser  medida  de  diver¬ 
sas  maneiras.  Três  métodos  dominam  as  aplicações  da  aná¬ 
lise  de  agrupamentos:  medidas  correlacionais,  de  distância 
e  por  associação.  Cada  um  desses  métodos  representa  uma 
perspectiva  particular  sobre  similaridade,  dependendo 
de  seus  objetivos  e  do  tipo  de  dados.  As  medidas  corre¬ 
lacionais  e  baseadas  em  distância  requerem  dados  métri¬ 
cos,  enquanto  as  medidas  por  associação  são  para  dados 
não-métricos.  Medidas  correlacionais  são  raramente  usa¬ 
das,  pois  a  ênfase  na  maioria  das  aplicações  da  análise  de 
agrupamentos  é  sobre  as  magnitudes  dos  objetos,  e  não  os 
padrões  de  valores.  Medidas  de  distância  são  as  medidas 
mais  comuns  de  similaridade  em  análise  de  agrupamentos. 
As  medidas  de  distância  representam  similaridade  como  a 
proximidade  de  observações  entre  si  ao  longo  de  variáveis 
na  variável  estatística  de  agrupamento. 

Distinguir  entre  as  várias  medidas  de  distância.  Di¬ 
versas  medidas  de  distância  estão  disponíveis,  cada  uma 
com  características  específicas.  Distância  euclidiana  é  a 
mais  comumente  reconhecida,  muitas  vezes  chamada  de 
distância  em  linha  reta.  A  distância  euclidiana  entre  dois 
pontos  é  o  comprimento  da  hipotenusa  de  um  triângulo 
retângulo.  Este  conceito  é  facilmente  generalizado  para 
mais  de  duas  variáveis.  Distância  euclidiana  quadrada  (ou 
absoluta)  é  a  soma  de  diferenças  quadradas  sem  se  calcu¬ 
lar  a  raiz  quadrada.  A  distância  euclidiana  quadrada  tem 
a  vantagem  de  não  extrair  a  raiz  quadrada,  o  que  acelera 
consideravelmente  a  computação  e  é  a  medida  de  distân¬ 
cia  recomendada  para  os  métodos  centróide  e  de  Ward  de 
agrupamento.  A  distância  city-block  (Manhattan)  não  se 
baseia  na  euclidiana.  No  lugar  disso,  ela  usa  a  soma  das  di¬ 
ferenças  absolutas  das  variáveis  (ou  seja,  os  dois  catetos  de 
um  triângulo  retângulo  em  vez  da  hipotenusa).  Tal  proce¬ 
dimento  é  o  mais  simples  para  calcular,  mas  pode  conduzir 
a  agregados  inválidos  se  as  variáveis  de  agrupamento  fo¬ 
rem  altamente  correlacionadas.  A  distância  de  Chebychev 
é  outra  medida.  Com  ela,  distância  é  a  maior  diferença  ao 
longo  de  todas  as  variáveis.  É  particularmente  suscetível 
a  diferenças  em  escalas  ao  longo  das  variáveis.  A  distân¬ 
cia  de  Mahalanobis  (D^)  é  uma  medida  generalizada  que 
explica  as  correlações  entre  variáveis  de  uma  maneira  que 
pondera  cada  variável  igualmente.  Também  se  sustenta 
em  variáveis  padronizadas. 

Diferenciar  entre  algoritmos  de  agrnpamento.  O  algo¬ 
ritmo  de  agrupamento  em  um  processo  hierárquico  de¬ 
termina  como  é  definida  similaridade  entre  agregados  de 
múltiplos  membros  no  processo.  Os  cinco  algoritmos  hie¬ 
rárquicos  mais  populares  são  (1)  ligação  simples,  (2)  liga¬ 
ção  completa,  (3)  ligação  média,  (4)  método  centróide  e 


(5)  método  de  Ward.  Os  três  algoritmos  não-hierárquicos 
são  (1)  o  método  de  referência  seqüencial  que  seleciona 
uma  semente  e  inclui  todos  os  objetos  dentro  de  uma  dis¬ 
tância  especificada,  (2)  o  método  de  referência  paralela 
que  considera  todas  as  sementes  simultaneamente  e  de¬ 
signa  observações  dentro  da  distância  de  referência  para 
a  semente  mais  próxima,  e  (3)  o  procedimento  de  otimi¬ 
zação,  que  é  semelhante  aos  outros  dois  métodos  não-hie- 
rárquicos,  exceto  que  ele  permite  uma  nova  designação 
de  observações.  Técnicas  hierárquicas  têm  sido  há  mui¬ 
to  tempo  o  método  mais  popular  de  agrupamento,  com 
o  método  de  Ward  e  a  ligação  média  provavelmente  os 
mais  disponíveis.  Métodos  não-hierárquicos  têm  conquis¬ 
tado  crescente  aceitabilidade  e  uso,  mas  qualquer  aplica¬ 
ção  depende  da  habilidade  do  pesquisador  em  escolher 
os  pontos  sementes  de  acordo  com  alguma  base  teórica, 
objetiva  ou  prática. 

Compreender  as  diferenças  entre  técnicas  hierárqnicas  e 
não-hierárqnicas.  Uma  vasta  gama  de  procedimentos  de 
partição  tem  sido  proposta  para  a  análise  de  agrupamen¬ 
tos.  Os  dois  procedimentos  mais  usados  são  hierárquicos 
e  não-hierárquicos.  Métodos  hierárquicos  envolvem  uma 
série  de  n  -1  decisões  (onde  néo  número  de  observações) 
que  combinam  observações  em  uma  estrutura  hierárquica 
ou  do  tipo  árvore.  Os  dois  tipos  de  procedimentos  hierár¬ 
quicos  incluem  o  aglomerativo  e  o  divisivo.  Nos  métodos 
aglomerativos,  cada  objeto  ou  observação  começa  como 
seu  próprio  agrupamento,  enquanto  nos  métodos  divisi- 
vos  todas  as  observações  iniciam  em  um  único  agregado 
e  são  sucessivamente  divididas  (primeiro  em  dois  agrupa¬ 
mentos,  em  seguida  em  três  e  assim  por  diante)  até  que 
cada  uma  forma  um  agregado  unitário. 

Em  contraste  com  métodos  hierárquicos,  os  proce¬ 
dimentos  não-hierárquicos  não  envolvem  o  processo  de 
construção  em  árvore.  No  lugar  disso,  eles  designam  ob¬ 
jetos  em  agregados  assim  que  o  número  de  agrupamentos 
a  serem  formados  seja  especificado.  Por  exemplo,  uma 
solução  de  seis  agrupamentos  não  é  somente  uma  combi¬ 
nação  de  dois  agregados  a  partir  da  solução  de  sete,  mas 
é  baseada  somente  na  descoberta  da  melhor  solução  de 
seis  agrupamentos.  O  processo  tem  dois  passos:  (1)  iden¬ 
tificação  de  pontos  iniciais,  conhecidos  como  sementes  de 
agrupamento,  para  cada  agregado,  e  (2)  designação  de 
cada  observação  a  uma  das  sementes  com  base  em  simi¬ 
laridade. 

Descrever  como  selecionar  o  número  de  agrnpamentos  a 
serem  formados.  Talvez  a  questão  que  causa  mais  per¬ 
plexidade  para  qualquer  pesquisador  que  executa  uma 
análise  hierárquica  ou  não-hierárquica  seja  a  determina¬ 
ção  do  número  de  agrupamentos  mais  representativos  dos 
dados  da  amostra.  Tal  decisão  é  crítica  para  técnicas  hie¬ 
rárquicas,  pois,  ainda  que  o  processo  gere  o  conjunto  com¬ 
pleto  de  soluções,  o  pesquisador  deve  escolher  as  soluções 
para  representar  a  estrutura  de  dados  (também  conhecida 
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como  a  regra  de  parada).  Esta  decisão  também  é  encarada 
por  pesquisadores  em  análises  não-hierárquicas  quando  a 
solução  ótima  deve  ser  escolhida  a  partir  de  duas  ou  mais 
soluções  de  agrupamento.  Infelizmente,  não  existe  qual¬ 
quer  procedimento  padrão  e  objetivo  de  escolha.  Sem  um 
critério  estatístico  interno  de  inferência,  como  os  testes  de 
significância  estatística  de  outros  métodos  multivariados, 
pesquisadores  têm  desenvolvido  muitos  critérios  para  tra¬ 
tar  o  problema.  As  duas  principais  regras  de  parada  são 
(1)  medidas  de  variação  de  heterogeneidade  entre  agru¬ 
pamentos  em  cada  passo  sucessivo,  com  a  solução  defini¬ 
da  quando  a  medida  de  heterogeneidade  excede  um  valor 
especificado  ou  quando  os  valores  sucessivos  entre  passos 
saltam  repentinamente,  e  (2)  medidas  diretas  de  hetero¬ 
geneidade  de  cada  solução.  Dado  o  número  disponível  de 
regras  de  parada  e  a  falta  de  evidência  apoiando  qualquer 
regra  em  especial,  o  pesquisador  deve  usar  diversas  delas 
e  procurar  por  uma  solução  que  seja  consenso.  Mesmo 
com  um  consenso  baseado  em  medidas  empíricas,  o  pes¬ 
quisador  deve  complementar  o  julgamento  empírico  com 
alguma  conceituação  de  relações  teóricas  que  possam  su¬ 
gerir  um  número  natural  de  agrupamentos. 

Seguir  as  diretrizes  para  validação  de  agrupamento.  Va¬ 
lidação  envolve  tentativas  do  pesquisador  para  garan¬ 
tir  que  a  solução  é  representativa  da  população  geral  e, 
assim,  é  generalizável  para  outros  objetos  e  é  estável  ao 
longo  do  tempo.  A  abordagem  mais  direta  de  validação  é 
a  análise  de  amostras  separadas,  comparando  as  soluções 
de  agrupamento  e  avaliando  a  correspondência  dos  re¬ 
sultados.  O  pesquisador  pode  também  tentar  estabelecer 
alguma  forma  de  validade  preditiva  ou  de  critério.  Para 
isso,  variáveis  não  usadas  para  formar  os  agrupamentos, 
mas  conhecidas  como  variando  ao  longo  dos  agrupamen¬ 
tos,  são  escolhidas  e  comparadas. 

Construir  perfis  para  os  agrupamentos  derivados  e  ava¬ 
liar  significância  administrativa.  O  estágio  de  perfil  en¬ 
volve  a  descrição  das  características  de  cada  agrupamento 
para  explicar  como  eles  podem  diferir  sobre  dimensões 
relevantes.  O  procedimento  começa  depois  que  os  agre¬ 
gados  são  identificados,  e  tipicamente  envolve  o  emprego 
de  análise  discriminante  ou  ANOVA.  Dados  não  previa¬ 
mente  incluídos  no  procedimento  de  agrupamento  são 
usados  para  caracterizar  cada  agregado.  Esses  dados  ge¬ 
ralmente  são  características  demográficas,  perfis  psicográ- 
ficos,  padrões  de  consumo  e  assim  por  diante.  Apesar  de 
poder  não  existir  qualquer  argumento  para  diferenças  em 
variáveis  ao  longo  dos  agrupamentos,  como  se  exige  para 
avaliação  de  validade  preditiva,  elas  devem  ter  pelo  me¬ 
nos  importância  prática.  Elsando  análise  discriminante  ou 
ANOVA,  o  pesquisador  compara  perfis  de  escore  médio 
para  os  agregados.  A  variável  dependente  categórica  (ou 
o  fator  em  ANOVA)  se  refere  aos  agrupamentos  previa¬ 
mente  identificados,  e  as  variáveis  independentes  são  as 
características  demográficas,  psicográficas  etc.  A  análise 


de  perfil  se  concentra  na  descrição  não  do  que  diretamen¬ 
te  determina  os  agregados,  mas  nas  características  dos 
agrupamentos  depois  que  os  mesmos  foram  identificados. 
A  ênfase  está  na  identificação  de  características  que  dife¬ 
renciem  significativamente  ao  longo  dos  agrupamentos  e 
naquelas  que  podem  prever  pertinência  em  um  agregado 
em  particular. 

A  seleção  da  solução  final,  na  maioria  dos  casos,  é  ba¬ 
seada  em  considerações  tanto  objetivas  quanto  subjetivas. 
O  pesquisador  prudente  considera  essas  questões  e  sem¬ 
pre  avalia  o  impacto  de  todas  as  decisões.  A  análise  de 
agrupamentos,  juntamente  com  o  escalonamento  multidi- 
mensional,  devido  a  uma  carência  de  base  estatística  para 
inferência  à  população,  são  os  métodos  que  mais  precisam 
de  replicação  sob  condições  variáveis. 

Questões 

1.  Quais  são  os  estágios  básicos  na  aplicação  da  análise  de 
agrupamentos? 

2.  Qual  é  o  propósito  da  análise  de  agrupamentos  e  quando 
ela  deve  ser  usada  no  lugar  da  análise  fatorial? 

3.  Q  que  o  pesquisador  deve  considerar  quando  seleciona 
uma  medida  de  similaridade  para  usar  em  análise  de  agru¬ 
pamentos? 

4.  Como  o  pesquisador  sabe  quando  empregar  técnicas  hie¬ 
rárquicas  ou  não-hierárquicas  de  agrupamentos?  Sob  quais 
condições  cada  abordagem  deve  ser  usada? 

5.  Como  um  pesquisador  decide  o  número  de  agrupamentos 
necessários  em  sua  solução? 

6.  Qual  é  a  diferença  entre  o  estágio  de  interpretação  e  o  de 
perfil  e  validação? 

7.  Como  os  pesquisadores  podem  usar  as  representações  gráfi¬ 
cas  do  procedimento  de  aglomeração? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustra  problemas  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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CAPITULO 


Escalonamento  Multídímensíonal  e 
Análise  de  Correspondência 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Definir  escalonamento  multidimensional  e  descrever  como  é  executado. 

■  Compreender  as  diferenças  entre  dados  de  similaridade  e  dados  de  preferência. 

■  Escolher  entre  uma  abordagem  decomposicional  ou  composicional. 

■  Determinar  a  comparabilidade  e  número  de  objetos. 

■  Entender  como  criar  um  mapa  perceptual. 

■  Explicar  análise  de  correspondência  como  um  método  de  mapeamento  perceptual. 


Apresentação  do  capítuio 

0  escalonamento  multidimensional  (MDS)  se  refere  a  uma  série  de  técnicas  que  ajudam  o  pesquisador 
a  identificar  dimensões-chave  inerentes  a  avaliações  feitas  por  respondentes  quanto  a  objetos  e  então 
posicionar  tais  objetos  neste  espaço  dimensional.  Por  exemplo,  o  escalonamento  multidimensional  fre- 
qüentemente  é  usado  em  marketing  para  identificar  dimensões-chave  inerentes  a  avaliações  que  os 
consumidores  fazem  quanto  a  produtos,  serviços  ou  empresas.  Outras  aplicações  comuns  incluem  a 
comparação  de  qualidades  físicas  (p.ex.,  sabores  de  alimentos  ou  aromas),  percepções  sobre  candi¬ 
datos  ou  questões  políticas,  e  até  mesmo  a  avaliação  de  diferenças  culturais  entre  grupos  distintos.  As 
técnicas  de  escalonamento  multidimensional  podem  inferir  as  dimensões  subjacentes  usando  apenas 
uma  série  de  julgamentos  de  similaridades  ou  preferência  fornecidos  por  respondentes  quanto  a  obje¬ 
tos.  Com  os  dados  em  mãos,  o  escalonamento  multidimensional  pode  ajudar  a  determinar  o  número  e 
a  importância  relativa  das  dimensões  usadas  pelos  respondentes  quando  avaliam  objetos,  e  como  os 
objetos  estão  relacionados  em  termos  de  percepção  sobre  essas  dimensões,  geralmente  retratadas 
graficamente. 

A  análise  de  correspondência  (CA)  é  uma  técnica  relacionada  com  metas  parecidas.  A  CA  infere 
as  dimensões  inerentes  que  são  avaliadas,  bem  como  o  posicionamento  de  objetos,  ainda  que  siga 
uma  abordagem  bastante  diferente.  Primeiro,  em  vez  de  usar  avaliações  gerais  de  similaridade  ou 
preferência  relativas  a  objetos,  cada  um  deles  é  avaliado  (em  termos  não-métricos)  sobre  uma  série 
de  atributos.  Em  seguida,  com  esta  informação  a  CA  desenvolve  as  dimensões  de  comparação  entre 
objetos  e  coloca  cada  objeto  neste  espaço  dimensional  para  permitir  comparações  entre  objetos  e 
atributos  simultaneamente. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para 
compreender  os  conceitos  e  a  terminologia  empregados. 
Ao  longo  do  capítulo,  os  termos-chave  aparecem  em  ne¬ 
grito.  Outros  pontos  de  destaque  no  capítulo  e  referências 


cruzadas  estão  em  itálico.  Exemplos  ilustrativos  estão  em 
quadros. 

Agrupamento  subjetivo  Ver  dados  de  confusão. 

Anáiise  agregada  Abordagem  à  MDS  na  qual  um  mapa  per¬ 
ceptual  é  gerado  para  as  avaliações  de  um  grupo  de  respon- 
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dentes  quanto  a  objetos.  Esse  mapa  perceptual  composto 
pode  ser  criado  por  um  programa  de  computador  ou  pelo 
pesquisador  para  achar  alguns  poucos  sujeitos  “médios”  ou 
representativos. 

Análise  de  correspondência  (CA)  Abordagem  composicional 
para  mapeamento  perceptual  que  é  baseada  em  categorias 
de  uma  tabela  de  oontingênoia.  A  maioria  das  aplicações  en¬ 
volve  um  conjunto  de  objetos  e  atributos,  em  que  os  resul¬ 
tados  retratam  objetos  e  atributos  em  um  mapa  perceptual 
comum.  Para  derivar  um  mapa  multidimensional,  você  deve 
ter  um  mínimo  de  três  atributos  e  três  objetos. 

Análise  de  correspondência  múitipla  Forma  de  análise  de  cor¬ 
respondência  que  envolve  três  ou  mais  variáveis  categóricas 
relacionadas  em  um  espaço  perceptual  comum. 

Análise  desagregada  Abordagem  para  MDS  na  qual  o  pesqui¬ 
sador  gera  mapas  perceptuais  em  uma  base  de  respondente 
por  respondente.  Os  resultados  podem  ser  difíceis  de  genera¬ 
lizar  para  os  respondentes.  Portanto,  o  pesquisador  pode  ten¬ 
tar  criar  menos  mapas  por  algum  processo  de  análise  agrega¬ 
da,  na  qual  os  resultados  de  respondentes  são  combinados. 

Avaliação  subjetiva  Método  para  determinar  quantas  dimen¬ 
sões  são  representadas  no  modelo  MDS.  O  pesquisador  faz 
uma  inspeção  subjetiva  dos  mapas  espaciais  e  questiona  se 
a  configuração  parece  razoável.  O  objetivo  é  obter  o  melhor 
ajuste  com  o  menor  número  de  dimensões. 

Dados  de  confusão  Procedimento  para  obter  percepções  de 
respondentes  sobre  dados  de  similaridades.  Os  responden¬ 
tes  indicam  as  similaridades  entre  pares  de  estímulos.  O  par 
(ou  “confusão”)  de  um  estímulo  com  um  outro  é  assumido 
para  indicar  similaridades.  Também  conhecido  como  agrupa¬ 
mento  subjetivo. 

Dados  de  preferência  Dados  usados  para  determinar  a  pre¬ 
ferência  entre  objetos.  Podem  ser  contrastados  com  dados 
de  similaridade,  que  denota  a  similaridade  entre  objetos,  mas 
não  tem  distinção  do  tipo  “bom-ruim”  como  visto  nos  dados 
de  preferência. 

Dados  de  similaridades  Dados  usados  para  determinar  quais 
objetos  são  os  mais  semelhantes  entre  si  e  quais  são  os  mais 
distintos.  Implícita  nas  medidas  de  similaridades  está  a  ha¬ 
bilidade  de  comparar  todos  os  pares  de  objetos.  Três  pro¬ 
cedimentos  para  obter  dados  de  similaridades  são  compa¬ 
rações  aos  pares  de  objetos,  dados  de  confusão  e  medidas 
derivadas. 

Dimensão  objetiva  Características  físicas  ou  tangíveis  de  um 
objeto  que  têm  uma  base  objetiva  de  comparação.  Por  exem¬ 
plo,  um  produto  tem  tamanho,  forma,  cor,  peso  e  assim  por 
diante. 

Dimensão  percebida  Uma  atribuição  subjetiva,  por  parte  do 
respondente,  de  aspectos  a  um  objeto,  a  qual  representa 
suas  características  intangíveis.  Exemplos  incluem  “qualida¬ 
de",  “caro”  e  “boa  aparência”.  Essas  dimensões  percebidas 
são  únicas  do  respondente  individual  e  podem  exibir  pouca 
correspondência  com  dimensões  objetivas  reais. 

Dimensão  subjetiva  Ver  dimensão  percebida. 

Dimensionalidade  inicial  Um  ponto  de  partida  para  selecio¬ 
nar  a  melhor  configuração  espacial  para  dados.  Antes  de  ini¬ 


ciar  um  procedimento  MDS,  o  pesquisador  deve  especificar 
quantas  dimensões  ou  características  estão  representadas 
nos  dados. 

Dimensões  Características  de  um  objeto.  Pode-se  imaginar 
que  um  objeto  específico  possui  dimensões  percebidas/ 
subjetivas  (p.  ex.,  caro,  frágil)  e  objetivas  (p.  ex.,  cor,  preço, 
características). 

Disparidades  Diferenças  nas  distâncias  geradas  no  computa¬ 
dor  que  representam  similaridades  e  as  distâncias  fornecidas 
pelo  respondente. 

Escala  de  similaridade  Escala  arbitrária,  por  exemplo,  de  -5  a 
4-5,  que  permite  a  representação  de  uma  relação  ordenada 
entre  objetos  que  vai  do  mais  semelhante  (mais  próximo)  ao 
menos  similar  (mais  distante).  Esse  tipo  de  escala  é  adequa¬ 
do  apenas  para  representar  uma  única  dimensão. 

Expansão  Transformação  de  uma  solução  MDS  para  fazer  as 
dimensões  ou  elementos  individuais  refletirem  o  peso  relativo 
de  preferência. 

índice  de  ajuste  índice  de  correlação  quadrada  {Ff)  que  pode 
ser  interprefado  como  indicativo  da  proporção  de  variância 
das  disparidades  (dados  otimamente  escalonados)  que  pode 
ser  explicada  pelo  procedimento  MDS.  Ele  mede  o  quão  bem 
os  dados  iniciais  se  ajustam  ao  modelo  MDS.  Esse  índice  é 
uma  alternativa  para  a  medida  de  desajuste  para  determinar  o 
número  de  dimensões.  Semelhante  a  medidas  de  covariância 
em  outras  técnicas  multivariadas,  medidas  de  0,60  ou  mais 
são  consideradas  aceitáveis. 

Inércia  Uma  medida  relativa  de  qui-quadrado  usada  em  aná¬ 
lise  de  correspondência.  A  inércia  total  de  uma  tabela  de 
tabulação  cruzada  é  calculada  como  o  qui-quadrado  total 
dividido  pela  freqüência  total  (soma  de  linhas  ou  colunas). 
Inércia  pode  então  ser  calculada  para  cada  categoria  de  li¬ 
nha  ou  coluna  para  representar  sua  contribuição  ao  total  da 
inércia. 

Mapa  espacial  Ver  mapa  perceptual. 

Mapa  perceptual  Representação  visual  de  percepções  que  um 
respondente  tem  sobre  objetos  em  duas  ou  mais  dimensões. 
Geralmente  esse  mapa  tem  níveis  opostos  de  dimensões 
nos  extremos  dos  eixos  X  e  Y,  como  de  “doce”  a  “azedo” 
nos  extremos  do  eixo  X  e  de  “caro”  a  “barato”  nos  extremos 
do  eixo  Y.  Cada  objeto  então  tem  uma  posição  espacial  no 
mapa  perceptual  que  reflete  a  similaridade  ou  preferência 
relativa  a  outros  objetos  no  que  se  refere  ãs  dimensões  do 
mapa  perceptual. 

Massa  Uma  medida  relativa  de  freqüência  usada  em  análise  de 
correspondência  para  descrever  o  tamanho  de  qualquer  cé¬ 
lula  ou  categoria  em  uma  tabulação  cruzada.  É  definida  como 
0  valor  (total  da  célula  ou  categoria)  dividido  pela  freqüência 
total,  gerando  o  percentual  da  freqüência  total  representado 
pelo  valor.  Como  tal,  a  massa  total  ao  longo  de  linhas,  colunas 
ou  todas  as  entradas  de  célula  é  1 ,0. 

Matriz  de  importância-desempenho  Abordagem  bidimensio¬ 
nal  para  auxiliar  o  pesquisador  na  nomeação  de  dimensões. 
O  eixo  vertical  é  a  percepção  de  importância  do  respondente 
(p.ex.,  medida  em  uma  escala  de  “extremamente  importante” 
a  “nada  importante”).  O  eixo  horizontal  é  desempenho  (p.ex.. 
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como  se  mede  em  uma  escala  de  "excelente”  a  “péssimo”) 
para  cada  marca  ou  produto/serviço  sobre  vários  atributos. 
Cada  objeto  é  representado  por  seus  vaiores  em  importância 
e  desempenho. 

Medida  de  desajuste  Proporção  da  variância  das  disparidades 
(dados  otimamente  escalonados)  não  explicada  pelo  modelo 
MDS.  Esse  tipo  de  medida  varia  de  acordo  com  o  tipo  de  pro¬ 
grama  e  de  dados  em  análise.  A  medida  de  desajuste  ajuda 
a  determinar  o  número  adequado  de  dimensões  a  serem  in¬ 
cluídas  no  modelo. 

Medidas  derivadas  Procedimento  para  obter  percepções  de 
dados  de  similaridades  por  parte  dos  respondentes.  Simila¬ 
ridades  derivadas  geralmente  são  baseadas  em  uma  série 
de  escores  dados  aos  estímulos  pelos  respondentes,  que 
são  então  combinados  de  alguma  maneira.  A  escala  dife¬ 
rencial  semântica  freqüentemente  é  usada  para  deduzir  tais 
escores. 

Método  composicionai  Abordagem  para  mapeamento  per- 
oeptual  que  deriva  avaliações  gerais  de  similaridade  ou 
preferência  a  partir  de  avaliações  de  atributos  separados 
por  respondente.  Com  métodos  composicionais,  avaliações 
de  atributos  separados  são  oombinadas  (compostas)  para 
uma  avaliação  geral.  Os  exemplos  mais  comuns  de  métodos 
composicionais  são  as  téonicas  de  análise  fatorial  e  análise 
discriminante. 

Método  decomposicional  Método  de  mapeamento  perceptu- 
al  associado  a  técnicas  MDS  no  qual  o  respondente  fornece 
apenas  uma  avaliação  geral  de  similaridade  ou  preferência 
entre  objetos.  Esse  conjunto  de  avaliações  gerais  é  então  de¬ 
composto  em  um  conjunto  de  dimensões  que  melhor  repre¬ 
sentam  as  diferenças  de  objetos. 

Objeto  Qualquer  estímulo  que  pode  ser  comparado  e  avaliado 
pelo  respondente,  incluindo  entidades  tangíveis  (produto  ou 
objeto  físico),  ações  (serviço),  percepções  sensoriais  (cheiro, 
sabor,  impressões  visuais),  ou  mesmo  pensamentos  (idéias, 
slogans). 

Ponto  ideal  Ponto  em  um  mapa  perceptual  que  representa  a 
combinação  mais  preferida  de  atributos  percebidos  (de  acor¬ 
do  com  os  respondentes).  Uma  suposição  importante  é  que 
a  posição  do  ponto  ideal  (relativa  aos  outros  objetos  no  mapa 
perceptual)  definiria  a  preferência  relativa,  de  modo  que  ob¬ 
jetos  mais  distantes  do  ponto  ideal  deveriam  ser  menos  pre¬ 
feridos. 

Preferência  Implica  que  objetos  são  julgados  pelo  respondente 
em  termos  de  relações  de  predomínio;  ou  seja,  os  estímulos 
são  ordenados  em  preferência  com  relação  a  alguma  proprie¬ 
dade.  Ordenação  direta,  comparações  aos  pares  e  escalas 
de  preferência  freqüentemente  são  usadas  para  determinar 
preferências  de  respondentes. 

Projeções  Pontos  definidos  por  retas  perpendiculares  de  um 
objeto  a  um  vetor.  As  projeções  são  usadas  para  determinar  a 
ordem  de  preferência  com  representações  vetoriais. 

Revelação  Representação  das  preferências  de  um  indivíduo 
dentro  de  um  espaço  comum  (agregado)  de  estímulos  obtido 
para  todos  os  respondentes  como  um  todo.  As  preferências 
do  indivíduo  são  “reveladas”  e  apresentadas  como  a  melhor 
representação  possível  dentro  da  análise  agregada. 


Similaridade  Ver  dados  de  similaridades. 

Solução  degenerada  Solução  MDS  que  é  inválida  por  causa 
de  (1)  inconsistências  nos  dados  ou  (2)  muito  poucos  objetos 
em  comparação  ao  número  de  dimensões  especificado  pelo 
pesquisador.  Mesmo  que  o  programa  de  computador  possa 
indicar  uma  solução  vãlida,  o  pesquisador  deve  desconsi¬ 
derar  a  solução  degenerada  e  examinar  os  dados  em  busca 
da  causa.  Esse  tipo  de  solução  normalmente  é  representado 
como  um  padrão  circular  de  resultados  ilógicos. 

Tabela  de  contingência  Tabulação  cruzada  de  duas  variá¬ 
veis  não-métricas  ou  categóricas  na  qual  as  entradas  são 
as  freqüências  de  respostas  que  caem  em  cada  “célula”  da 
matriz.  Por  exemplo,  se  três  marcas  foram  avaliadas  sobre 
quatro  atributos,  a  tabela  de  contingência  de  marca  por  atri¬ 
buto  seria  uma  tabela  eom  três  linhas  e  quatro  colunas.  As 
entradas  seriam  o  número  de  vezes  que  uma  marca  (p.ex., 
Coca-Cola)  foi  avaliada  como  tendo  um  atributo  (p.ex.,  sa¬ 
bor  doce). 

Tabela  de  tabulação  cruzada  Ver  tabela  de  contingência. 

Valor  qui-quadrado  Método  para  analisar  dados  em  uma  tabe¬ 
la  de  contingência  que  compara  as  freqüências  reais  das  cé¬ 
lulas  da  tabela  com  as  freqüências  esperadas  das  mesmas.  A 
freqüência  esperada  de  uma  célula  é  baseada  nas  probabili¬ 
dades  marginais  de  sua  linha  e  coluna  (probabilidade  de  uma 
linha  e  coluna  entre  todas  as  linhas  e  colunas). 

Vetor  Método  para  representar  um  ponto  ideal  ou  atributo  em 
um  mapa  perceptual.  Envolve  o  uso  de  projeções  para  deter¬ 
minar  a  ordem  de  um  objeto  no  vetor. 


O  QUE  É  ESCALONAMENTO 
MULTIDIMENSIONAL? 

Escalonamento  multidimensional  (MDS),  também  conhe¬ 
cido  como  mapeamento  perceptual,  é  um  procedimento 
que  permite  a  um  pesquisador  determinar  a  imagem  re¬ 
lativa  percebida  de  um  conjunto  de  objetos  (empresas, 
produtos,  idéias  ou  outros  itens  associados  a  percepções 
comumente  consideradas).  O  objetivo  do  MDS  é  transfor¬ 
mar  julgamentos  de  consumidores  quanto  à  similaridade 
ou  preferência  (p.ex.,  preferência  por  lojas  ou  marcas)  em 
distâncias  representadas  em  espaço  multidimensional. 

Comparação  de  objetos 

Escalonamento  multidimensional  é  baseado  na  compa¬ 
ração  de  objetos  (p.ex.,  produto,  serviço,  pessoa,  aro¬ 
ma).  O  MDS  difere  de  outros  métodos  multivariados  no 
sentido  de  usar  apenas  uma  medida  geral  de  similaridade 
ou  preferência.  Para  executar  uma  análise  de  escalona¬ 
mento  multidimensional,  o  pesquisador  realiza  três  pas¬ 
sos  básicos: 

1.  Reunir  medidas  de  similaridade  ou  de  preferência  no  con¬ 
junto  inteiro  de  objetos  a  serem  analisados. 

2.  Usar  técnicas  MDS  para  estimar  a  posição  relativa  de  cada 
objeto  em  espaço  multidimensional. 
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3.  Identificar  e  interpretar  os  eixos  do  espaço  dimensional  em 
termos  de  atributos  perceptuais  e/ou  objetivos. 

Considere  que  os  objetos  A  e  B  sejam  julgados  por 
respondentes  como  os  mais  parecidos  se  comparados  com 
todos  os  outros  possíveis  pares  de  objetos  (AC,  BC,  AD  e 
assim  por  diante).  Técnicas  MDS  posicionam  os  objetos  A 
e  B  de  modo  que  a  distância  entre  eles  no  espaço  multidi¬ 
mensional  seja  menor  do  que  a  distância  entre  quaisquer 
outros  pares  de  objetos.  O  mapa  perceptual  resultante, 
também  conhecido  como  mapa  espacial,  mostra  a  posição 
relativa  de  todos  os  objetos,  como  mostra  a  Figura  9-1. 

Dimensões:  a  base  para  comparação 

Qual  é  a  base  para  a  posição  relativa  de  cada  objeto?  Por 
que  A  e  B  são  mais  parecidos  do  que  quaisquer  outros  pa¬ 
res  de  objetos  (p.ex.,  A  e  D)?  O  que  representam  os  eixos 
do  espaço  multidimensional?  Antes  de  tentarmos  respon¬ 
der  qualquer  uma  dessas  questões,  primeiramente  deve¬ 
mos  reconhecer  que  qualquer  objeto  pode  ser  imaginado 
como  tendo  dimensões  que  representam  as  percepções  de 
um  indivíduo  quanto  a  atributos  ou  combinações  dos  mes¬ 
mos.  Essas  dimensões  podem  representar  um  único  atri¬ 
buto/percepção  ou  idéia,  ou  podem  ser  uma  composição 
de  qualquer  número  de  atributos  (p.ex.,  reputação). 

Dimensões  objetivas  versus  subjetivas 

Quando  se  caracteriza  um  objeto,  é  importante  também 
lembrar  que  indivíduos  podem  usar  diferentes  tipos  de 
medidas  ao  se  realizar  tais  julgamentos.  Por  exemplo, 
uma  medida  é  uma  dimensão  objetiva  que  tem  atributos 
quantificáveis  (físicos  ou  observáveis).  Qutro  tipo  de  me¬ 
dida  é  uma  dimensão  percebida  (também  conhecida  como 
dimensão  snbjetiva),  na  qual  indivíduos  avaliam  os  obje¬ 
tos  com  base  em  percepções.  Neste  caso,  a  dimensão  per¬ 
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cebida  é  uma  interpretação  feita  pelo  indivíduo  que  pode 
ou  não  ser  baseada  em  dimensões  objetivas. 


Por  exemplo,  uma  administração  pode  perceber  seu  pro¬ 
duto  (um  cortador  de  grama)  como  tendo  duas  opções 
de  cor  (vermelho  e  verde),  um  motor  de  dois  cavalos- 
vapor  e  uma  lâmina  de  24  polegadas,  que  são  as  dimen¬ 
sões  objetivas.  Os  clientes,  contudo,  podem  (ou  não)  ver 
esses  atributos.  Os  clientes  podem  focar  uma  dimensão 
percebida,  como  o  cortador  de  grama  ser  caro  ou  frágil. 


Dois  objetos  podem  ter  as  mesmas  características  físi¬ 
cas  (dimensões  objetivas)  mas  serem  percebidos  de  ma¬ 
neira  distinta  porque  os  objetos  são  vistos  com  diferen¬ 
ças  de  qualidade  (uma  dimensão  percebida)  por  muitos 
consumidores.  Assim,  as  duas  diferenças  a  seguir  entre 
dimensões  objetivas  e  de  percepção  são  importantes: 

•  Diferenças  individuais:  As  dimensões  percebidas  por  clien¬ 
tes  podem  não  coincidir  com  (ou  mesmo  não  incluir)  as 
dimensões  objetivas  assumidas  pelo  pesquisador.  Espe¬ 
ramos  que  cada  indivíduo  possa  ter  diferentes  dimensões 
percebidas,  mas  o  pesquisador  também  deve  aceitar  que  as 
dimensões  objetivas  podem  igualmente  variar  muito.  Os  in¬ 
divíduos  podem  considerar  diferentes  conjuntos  de  caracte¬ 
rísticas  objetivas,  bem  como  pode  variar  a  importância  que 
associam  a  cada  dimensão. 

•  Interdependência:  As  avaliações  das  dimensões  (mesmo 
quando  as  dimensões  percebidas  são  as  mesmas  que  as  ob¬ 
jetivas)  podem  não  ser  independentes  e  não  concordarem. 
Tanto  as  dimensões  percebidas  quanto  as  objetivas  podem 
interagir  umas  com  as  outras  para  criar  avaliações  inespe¬ 
radas.  Por  exemplo,  um  refrigerante  é  julgado  como  mais 
doce  do  que  outro  porque  o  primeiro  tem  um  aroma  mais 
parecido  com  fruta,  apesar  de  ambos  terem  a  mesma  quan¬ 
tia  de  açúcar. 


© 


© 

-  Dimensão  I 
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FIGURA  9-1  Ilustração  de  um  mapa  multidimensional  de  percepções  de  seis  fornecedores  industriais  (A  a  F)  e  do  ponto  ideal  (IP). 
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Relação  entre  dimensões  objetivas  e  subjetivas 

O  desafio  para  o  pesquisador  é  compreender  como  as  di¬ 
mensões  percebidas  e  objetivas  se  relacionam  com  os  ei¬ 
xos  do  espaço  multidimensional  usados  no  mapa  percep- 
tual,  se  possível.  É  semelhante  à  interpretação  da  variável 
estatística  em  muitas  outras  técnicas  multivariadas  (p.ex., 
o  “rótulo”  de  fatores  em  análise  fatorial),  mas  difere  no 
sentido  de  que  o  pesquisador  jamais  usa  diretamente 
quaisquer  avaliações  de  atributos  (p.ex.,  de  qualidade, 
apelo  etc.)  quando  obtém  as  avaliações  de  similaridade 
entre  objetos.  Em  vez  disso,  o  pesquisador  coleta  somen¬ 
te  similaridade  ou  preferência. 

O  uso  de  somente  medidas  gerais  (similaridade  ou  pre¬ 
ferência)  requer  que  o  pesquisador  primeiramente  com¬ 
preenda  a  correspondência  entre  dimensões  perceptuais 
e  objetivas  com  os  eixos  do  mapa  perceptual.  Em  seguida, 
uma  análise  adicional  pode  identificar  quais  atributos  pre- 
vêem  a  posição  de  cada  objeto  tanto  no  espaço  perceptual 
quanto  no  objetivo. 

Uma  advertência  deve  ser  feita,  porém,  quanto  à  inter¬ 
pretação  de  dimensões.  Como  esse  processo  é  mais  uma 
arte  do  que  uma  ciência,  o  pesquisador  deve  resistir  à  ten¬ 
tação  de  permitir  que  a  percepção  pessoal  afete  a  dimen- 
sionalidade  qualitativa  das  dimensões  percebidas.  Dado  o 
nível  de  interferência  do  pesquisador,  deve-se  tomar  cui¬ 
dado  para  ser  o  mais  objetivo  possível  nessa  área  crítica, 
ainda  que  rudimentar. 


UMA  VISÃO  SIMPLIFICADA  SOBRE 
COMO  FUNCIONA  O  MDS 

Para  facilitar  uma  melhor  compreensão  dos  procedimen¬ 
tos  básicos  em  escalonamento  multidimensional,  primei¬ 
ro  apresentamos  um  exemplo  simples  para  ilustrar  os 
conceitos  básicos  inerentes  ao  MDS  e  o  procedimento 
pelo  qual  ele  transforma  julgamentos  de  similaridades 
nas  posições  espaciais  correspondentes.  Seguimos  os  três 
passos  básicos  descritos  anteriormente. 

Obtenção  de  julgamentos  de  similaridade 

O  primeiro  passo  é  obter  julgamentos  de  similaridade  de 
um  ou  mais  respondentes.  Aqui  solicitamos  aos  respon- 


dentes  uma  medida  única  de  similaridade  para  cada  par 
de  objetos. 


Pesquisadores  de  mercado  estão  interessados  em  com¬ 
preender  percepções  de  consumidores  quanto  a  seis  do¬ 
ces  que  estão  atualmente  no  mercado.  Em  vez  de  tentar 
reunir  informações  sobre  avaliações  de  consumidores 
quanto  a  doces  em  vários  atributos,  os  pesquisadores 
reunirão  apenas  percepções  de  similaridades  ou  dissi- 
milaridades  gerais.  Os  dados  normalmente  são  coleta¬ 
dos  com  respondentes  que  fornecem  respostas  globais 
simples  a  declarações  como  as  seguintes: 

•  Avalie  as  similaridades  dos  produtos  A  e  B  em  uma 
escala  de  10  pontos. 

•  O  produto  A  é  mais  similar  a  B  do  que  a  C. 

•  Gosto  mais  do  produto  A  do  que  do  produto  B. 


Criação  de  um  mapa  perceptual 

A  partir  dessas  respostas  simples,  pode  ser  esboçado  um 
mapa  perceptual  que  melhor  represente  o  padrão  geral 
de  similaridades  entre  os  doces.  Ilustramos  o  processo  de 
criação  de  um  mapa  perceptual  com  os  dados  de  um  único 
respondente,  apesar  de  que  esse  processo  também  pode¬ 
ria  ser  aplicado  a  múltiplos  respondentes  ou  às  respostas 
agregadas  de  um  grupo  de  consumidores. 


Os  dados  são  reunidos  primeiramente  criando-se  um 
conjunto  dos  únicos  15  pares  dos  seis  doces  (6  x  5/2  = 
15).  Depois  de  experimentarem  os  doces,  os  respon¬ 
dentes  devem  ordenar  os  15  pares  de  doces,  onde  um 
nível  1  é  designado  ao  par  de  doces  mais  semelhantes 
e  um  nível  15  indica  o  par  menos  parecido.  Os  resul¬ 
tados  (ordenações)  para  todos  os  pares  de  doce  para 
um  respondente  estão  na  Tabela  9-1.  Este  respondente 
considerou  que  os  doces  D  e  E  são  os  mais  parecidos, 
A  e  B  são  os  próximos  doces  mais  semelhantes  e  assim 
por  diante,  até  o  momento  em  que  E  e  F  são  os  menos 
similares. 


TABELA  9-1  Dados  de  similaridade  (ordenações)  para  pares  de  doces 


Doce 

A 

B 

C 

D 

E 

F 

A 

- 

2 

13 

4 

3 

8 

B 

- 

12 

6 

5 

7 

C 

- 

9 

10 

11 

D 

- 

1 

14 

E 

- 

15 

F 

- 

Nota-,  Valores  menores  indicam  maior  similaridade,  sendo  1  o  par  mais  semelhante  e  1 5  o  menos  parecido. 
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Se  quisermos  ilustrar  a  similaridade  entre  doces  grafi¬ 
camente,  uma  primeira  tentativa  será  esboçar  uma  única 
escala  de  similaridades  e  ajustar  todos  os  doces  a  ela.  Nes¬ 
ta  representação  unidimensional  de  similaridades,  distân¬ 
cia  representa  a  similaridade.  Assim,  os  objetos  mais  pró¬ 
ximos  na  escala  são  mais  parecidos,  e  os  mais  distantes  são 
menos  semelhantes.  O  objetivo  é  posicionar  os  doces  na 
escala  de  forma  que  as  ordenações  sejam  mais  bem  repre¬ 
sentadas  (ordem  1  é  a  mais  próxima,  ordem  2  é  a  segunda 
mais  próxima  e  assim  por  diante). 


Tentemos  ver  como  colocaríamos  alguns  dos  objetos. 
Posicionar  dois  ou  três  doces  é  trivial.  O  primeiro  teste 
real  acontece  com  quatro  objetos.  Escolhemos  os  doces 
A,  B,  C  e  D.  A  Tabela  9-1  mostra  que  a  ordenação  dos 
pares  é  como  se  segue:  AB  <  AD  <  BD  <  CD  <  BC  < 
AC  (cada  par  de  letras  indica  a  distância  [similarida¬ 
de]  entre  os  elementos  do  par).  A  partir  desses  valores, 
devemos  colocar  os  quatro  doces  em  uma  única  escala, 
de  forma  que  os  mais  semelhantes  (AB)  sejam  os  mais 
próximos  e  os  menos  similares  (AC)  sejam  os  mais  dis¬ 
tantes  entre  si.  A  Figura  9-2a  contém  um  mapa  percep- 
tual  unidimensional  que  acomoda  as  ordens  de  pares. 
Se  a  pessoa  que  julga  a  similaridade  entre  os  doces  es¬ 
tivesse  pensando  em  uma  regra  simples  de  similaridade 


que  envolvesse  apenas  um  atributo  (dimensão),  como 
quantia  de  chocolate,  então  todos  os  pares  poderiam 
ser  colocados  em  uma  única  escala  que  reproduzisse  os 
valores  de  similaridades. 


Apesar  de  um  mapa  unidimensional  poder  acomodar 
quatro  objetos,  a  tarefa  se  torna  cada  vez  mais  difícil  à 
medida  que  o  número  de  objetos  aumenta.  O  leitor  in¬ 
teressado  é  encorajado  a  tentar  essa  tarefa  com  seis  ob¬ 
jetos.  Quando  uma  única  dimensão  é  empregada  com  os 
seis  objetos,  a  ordenação  real  varia  substancialmente  em 
relação  à  ordenação  original  do  respondente. 

Como  o  escalonamento  unidimensional  não  ajusta 
bem  os  dados,  uma  solução  bidimensional  deve  ser  ten¬ 
tada.  Isso  permite  que  uma  outra  escala  (dimensão)  seja 
usada  para  configurar  os  doces. 


O  procedimento  é  bastante  tedioso  para  se  tentar  ma¬ 
nualmente.  A  solução  bidimensional  produzida  por  um 
programa  MDS  é  mostrada  na  Figura  9-2b.  Essa  confi¬ 
guração  combina  exatamente  com  as  ordens  da  Tabela 
9-1,  apoiando  a  noção  de  que  o  respondente  muito  pro¬ 
vavelmente  usou  duas  dimensões  para  avaliar  os  doces. 
A  conjectura  de  que  pelo  menos  dois  atributos  (dimen- 

(Continua) 


(a)  Mapa  perceptual  unidimensional  de  quatro  observações 
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(b)  Mapa  perceptual  bidimensional  de  seis  observações 
Dimensão  II 


•  F 


•  B 

•  A 


Dimensão  I 


•  E 

D 


FIGURA  9-2  Mapas  perceptuais  unidimensional  e  bidimensional. 
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{Continuação) 

sões)  foram  considerados  é  baseada  na  incapacidade 
de  representar  as  percepções  do  respondente  em  uma 
dimensão.  No  entanto,  ainda  não  estamos  cientes  de 
quais  atributos  o  respondente  usou  em  sua  avaliação. 


Interpretação  dos  eixos 

Apesar  de  não  dispormos  de  informação  a  respeito  de 
quais  dimensões  estamos  usando,  podemos  olhar  para  as 
posições  relativas  dos  doces  e  inferir  quais  atributos  elas 
representam. 


Por  exemplo,  suponha  que  os  doces  A,  B  e  F  são  uma 
forma  de  combinação  (digamos,  chocolate  e  amendoim, 
chocolate  e  manteiga  de  amendoim)  e  C,  D  e  E  são  ape¬ 
nas  chocolate.  Poderíamos  inferir  então  que  a  dimensão 
horizontal*  representa  o  tipo  de  doce  (chocolate  puro 
versus  combinação).  Quando  olhamos  a  posição  das 
barras  de  doce  na  dimensão  vertical**,  outros  atributos 
também  podem  emergir  como  os  descritores  daquela  di¬ 
mensão. 


O  MDS  permite  aos  pesquisadores  a  compreensão  so¬ 
bre  a  similaridade  entre  objetos  (p.ex.,  doces)  por  meio  da 
solicitação  de  somente  percepções  de  similaridade  geral. 
O  procedimento  também  pode  ajudar  na  determinação 
de  quais  atributos  realmente  entram  nas  percepções  de  si¬ 
milaridade.  Apesar  de  não  incorporarmos  diretamente  as 
avaliações  de  atributo  no  procedimento  MDS,  podemos 
usá-las  em  análises  posteriores  para  auxiliar  na  interpre¬ 
tação  das  dimensões  e  dos  impactos  que  cada  atributo  tem 
sobre  as  posições  relativas  dos  doces. 


COMPARAÇÃO  ENTRE  MDS  E  OUTRAS 
TÉCNICAS  DE  INTERDEPENDÊNCIA 

O  escalonamento  multidimensional  pode  ser  comparado 
com  as  outras  técnicas  de  interdependência  como  análise 
fatorial  e  análise  de  agrupamentos  com  base  em  sua  abor¬ 
dagem  para  definir  estrutura: 

•  Análise  fatorial:  Define  estrutura  reunindo  variáveis  em  va¬ 
riáveis  estatísticas  que  representam  dimensões  inerentes  no 
conjunto  original  de  variáveis.  Variáveis  que  se  correlacio¬ 
nam  fortemente  são  agrupadas. 

•  Análise  de  agrupamentos:  Define  estrutura  reunindo  objetos 
de  acordo  com  seus  perfis  em  um  conjunto  de  variáveis  (a 
variável  estatística  de  agrupamento)  no  qual  objetos  muito 
próximos  entre  si  são  colocados  juntos. 

O  MDS  difere  das  análises  fatorial  e  de  agrupamentos 
em  dois  aspectos-chave:  (1)  uma  solução  pode  ser  obtida 
para  cada  indivíduo,  e  (2)  não  é  usada  uma  variável  esta¬ 
tística. 


*  N.  de  R.  T.:  O  correto  seria  “dimensão  vertical”. 

**  N.  de  R.  T.:  O  correto  seria  “dimensão  horizontal”. 


Indivíduo  como  a  unidade  de  análise 

Em  MDS,  cada  respondente  fornece  avaliações  de  todos 
os  objetos  considerados,  de  forma  que  pode  ser  obtida 
uma  solução  para  cada  indivíduo,  o  que  não  é  possível 
em  análise  de  agrupamentos  ou  análise  fatorial.  Assim, 
o  foco  não  está  nos  objetos  em  si,  mas  no  modo  como  o 
indivíduo  percebe  os  mesmos.  A  estrutura  a  ser  definida 
é  referente  às  dimensões  perceptuais  de  comparação  para 
o(s)  mdivíduo(s).  Assim  que  as  dimensões  perceptuais  são 
definidas,  as  comparações  relativas  entre  objetos  também 
podem  ser  feitas. 

Ealta  de  uma  variável  estatística 

O  escalonamento  multidimensional,  diferentemente  das 
outras  técnicas  multivariadas,  não  emprega  uma  variável 
estatística.  No  lugar  disso,  as  variáveis  que  formariam  a 
variável  estatística  (isto  é,  as  dimensões  perceptuais  de 
comparação)  são  inferidas  a  partir  de  medidas  globais  de 
similaridade  entre  os  objetos.  Em  uma  analogia  simples, 
isso  é  como  fornecer  a  variável  dependente  (similaridade 
entre  objetos)  e  descobrir  quais  devem  ser  as  variáveis  in¬ 
dependentes  (dimensões  perceptuais).  O  MDS  tem  a  van¬ 
tagem  de  reduzir  a  influência  do  pesquisador,  uma  vez  que 
não  requer  a  especificação  das  variáveis  a  serem  usadas  na 
comparação  de  objetos,  como  se  faz  em  análise  de  agru¬ 
pamentos.  Mas  também  tem  a  desvantagem  de  que  o  pes¬ 
quisador  não  está  realmente  certo  sobre  quais  variáveis  o 
respondente  está  usando  para  fazer  as  comparações. 


UMA  ESTRUTURA  DE  DECISÃO  PARA 
MAPEAMENTO  PERCEPTUAL 

O  mapeamento  perceptual  engloba  uma  vasta  gama  de 
possíveis  métodos,  incluindo  MDS,  e  todas  essas  técnicas 
podem  ser  vistas  por  meio  do  processo  de  construção  de 
modelo  introduzido  no  Capítulo  E  Esses  passos  corres¬ 
pondem  a  uma  estrutura  de  decisão,  descrita  nas  Figuras 
9-3  (estágios  1-3)  e  9-5  (estágios  4-6,  ver  página  498),  den¬ 
tro  da  qual  todas  as  técnicas  de  mapeamento  perceptual 
podem  ser  aplicadas  e  os  resultados,  avaliados. 


ESTÃGIO  1:  OBJETIVOS  DO  MDS 

O  mapeamento  perceptual,  e  o  MDS  em  particular,  é  mui¬ 
to  adequado  para  atingir  dois  objetivos: 

1.  Como  técnica  exploratória,  para  identificar  dimensões  não- 
reconhecidas  que  afetam  o  comportamento 

2.  Como  um  meio  para  obter  avaliações  comparativas  de  ob¬ 
jetos  quando  as  bases  específicas  de  comparação  são  desco¬ 
nhecidas  ou  indefinidas 

Em  MDS  não  é  necessário  especificar  os  atributos  de 
comparação  para  o  respondente.  Tudo  o  que  se  exige  é  es- 
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pecificar  os  objetos  e  garantir  que  eles  compartilham  uma 
base  comum  de  comparação.  Essa  flexibilidade  torna  o 
MDS  particularmente  adequado  para  estudos  de  imagem 
e  posicionamento  nos  quais  as  dimensões  de  avaliação  po¬ 
dem  ser  muito  globais  ou  muito  emocionais  e  afetivas  para 


serem  medidas  por  escalas  convencionais.  Métodos  MDS 
combinam  o  posicionamento  de  objetos  e  indivíduos  em 
um  único  mapa  geral,  tornando  as  posições  relativas  de 
objetos  e  consumidores  para  uma  análise  de  segmentação 
muito  mais  direta. 


Estágio  1 


Problema  de  pesquisa 
Escolher  objetivos: 

Identificar  dimensões  avaliativas  não-reconhecidas 
Avaliação  comparativa  de  objetos 


Estágio  2 


Especificação  de  pesquisa 

Identificar  todos  os  objetos  relevantes 
Escolher  entre  dados  de  similaridade  ou  de  preferência 
^elecionar  uma  análise  desagregada  ou  agregada 


Métodos  composicionais 


Métodos  gráficos/posf  hoc 
Técnicas  multivariadas 
Análise  de  correspondência 


Escolher  uma  abordagem  para  mapeamento  perceptual 

Os  atributos  avaliativos  são  especificados  pelo 
pesquisador  (composicional)  ou  são  usadas  apenas 
medidas  gerais  de  preferência  (decomposicional)? 


Questões  de  planejamento  de  pesquisa 
Número  de  objetos 

Dados  de  entrada  métricos  versus  não-métricos 


Métodos  decomposicionais 


Técnicas  tradicionais  de  escalonamento 
multidimensional 


Tipo  de  avaliação  feita 

O  respondente  está  descrevendo  similaridades 
entre  objetos,  preferências  entre  os  mesmos, 
ou  uma  combinação  de  ambas? 


Similaridades 

Comparação  de  pares  de  objetos 
Dados  de  confusão 


Preferências 
Ordenação  direta 
Comparação  aos  pares 


Ambas  as  medidas,  similaridade  e  preferência 
Combinação  de  medidas  de  similaridade 
e  preferência 


FIGURA  9-3  Estágios  1  -3  no  diagrama  de  decisão  do  escalonamento  multidimensional. 
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Decisões-chave  para  estabelecer  objetivos 

A  força  do  mapeamento  perceptual  é  sua  habilidade  para 
inferir  dimensões  sem  a  necessidade  de  atributos  defini¬ 
dos.  A  flexibilidade  e  a  natureza  inferencial  do  MDS  atri¬ 
buem  uma  maior  responsabilidade  ao  pesquisador  para 
definir  corretamente  a  análise.  Considerações  conceituais, 
bem  como  práticas,  essenciais  para  que  o  MDS  consiga 
seus  melhores  resultados,  são  tratadas  através  de  três  de¬ 
cisões-chave: 

1.  Selecionar  os  objetos  que  serão  avaliados 

2.  Decidir  se  similaridades  ou  preferências  devem  ser  analisa¬ 
das 

3.  Escolher  se  a  análise  será  realizada  no  grupo  ou  individual¬ 
mente. 

Identificação  de  todos  os  objetos 
relevantes  a  serem  avaliados 

A  questão  mais  básica,  porém  importante,  no  mapea¬ 
mento  perceptual  é  a  definição  de  objetos  a  serem  ava¬ 
liados.  O  pesquisador  deve  garantir  que  todas  as  empre¬ 
sas,  produtos,  serviços  ou  outros  objetos  relevantes  sejam 
incluídos,  pois  o  mapeamento  perceptual  é  uma  técnica 
de  posicionamento  relativo.  A  relevância  é  determinada 
pelas  questões  de  pesquisa  a  serem  abordadas. 


Por  exemplo,  um  estudo  sobre  refrigerantes  deve  incluir 
bebidas  à  base  de  açúcar  e  aquelas  que  não  têm  açúcar,  a 
menos  que  a  questão  de  pesquisa  explicitamente  exclua 
um  tipo  ou  outro.  Analogamente,  um  estudo  de  refrige¬ 
rantes  não  incluiria  sucos  de  fruta. 


Os  mapas  perceptuais  resultantes  de  qualquer  um 
dos  métodos  podem  ser  fortemente  influenciados  tanto 
pela  omissão  de  objetos  quanto  pela  inclusão  de  objetos 
inadequados  [7, 20].  Se  objetos  irrelevantes  ou  não-com- 
paráveis  forem  incluídos,  o  pesquisador  estará  forçando 
a  técnica  não  apenas  a  inferir  as  dimensões  perceptuais 
que  distinguem  objetos  comparáveis,  mas  também  a  in¬ 
ferir  as  dimensões  que  diferenciam  objetos  não-compa- 
ráveis.  Essa  tarefa  está  além  do  escopo  do  MDS  e  re¬ 
sulta  em  uma  solução  que  não  trata  adequadamente  de 
nenhuma  questão.  Analogamente,  a  omissão  de  um  ob¬ 
jeto  relevante  pode  impedir  a  verdadeira  descrição  das 
dimensões  perceptuais. 

Dados  de  similaridade  versus  dados  de  preferência 

Após  ter  selecionado  os  objetos  para  estudo,  o  pesqui¬ 
sador  deve  selecionar  a  base  de  avaliação:  similaridade 
versus  preferência.  Até  este  ponto,  discutimos  o  mapea¬ 
mento  perceptual  e  o  MDS  principalmente  em  termos  de 
julgamentos  de  similaridade.  Ao  fornecer  dados  de  simi¬ 
laridades,  o  respondente  não  aplica  aspecto  “bom-ruim” 
de  avaliação  na  comparação.  A  avaliação  “bom-ruim”  é 
feita,  porém,  dentro  de  dados  de  preferência,  a  qual  assu¬ 


me  que  diferentes  combinações  de  atributos  percebidos 
são  melhor  avaliadas  do  que  outras  combinações. 

Ambas  as  bases  de  comparação  podem  ser  usadas  para 
desenvolver  mapas  perceptuais,  mas  com  diferentes  inter¬ 
pretações: 

•  Mapas  perceptuais  baseados  em  similaridades  representam 
similaridades  de  atributos  e  dimensões  perceptuais  de  com¬ 
paração,  mas  não  refletem  qualquer  idéia  direta  nos  deter¬ 
minantes  de  escolha. 

•  Mapas  perceptuais  baseados  em  preferência  refletem  es¬ 
colhas  preferidas,  mas  não  podem  corresponder  de  forma 
alguma  às  posições  baseadas  em  similaridades,  porque  os 
respondentes  podem  basear  suas  escolhas  em  dimensões  ou 
critérios  inteiramente  diferentes  daqueles  nos  quais  eles  ba¬ 
seiam  as  comparações. 

Sem  qualquer  base  ótima  para  avaliação,  a  decisão  en¬ 
tre  similaridades  e  dados  de  preferência  deve  ser  tomada 
com  a  questão  de  pesquisa  definitiva  em  mente,  pois  essas 
opções  são  fundamentalmente  diferentes  em  relação  ao 
que  representam. 

Análise  agregada  versus  desagregada 

Ao  considerar  dados  de  similaridades  ou  de  preferências, 
estamos  coletando  percepções  de  estímulos  de  respon¬ 
dentes  e  criando  representações  (mapas  perceptuais)  de 
proximidade  de  estímulos  em  espaço  í-dimensional  (onde 
o  número  de  dimensões  t  é  menor  do  que  o  número  de 
estímulos).  Em  questão,  porém,  está  o  nível  de  análise  (in¬ 
dividual  ou  em  grupo)  no  qual  os  dados  são  analisados. 
Cada  abordagem  apresenta  vantagens  e  desvantagens. 

Análise  desagregada.  Uma  das  características  distintivas 
de  técnicas  MDS  é  sua  habilidade  de  estimar  soluções  para 
cada  respondente,  um  método  conhecido  como  análise 
desagregada.  Aqui  o  pesquisador  gera  mapas  perceptuais 
em  uma  base  sujeito-por-sujeito  (produzindo  tantos  ma¬ 
pas  quanto  sujeitos).  A  vantagem  é  a  representação  dos 
elementos  únicos  das  percepções  de  cada  respondente.  A 
principal  desvantagem  é  que  o  pesquisador  deve  identi¬ 
ficar  as  dimensões  comuns  dos  mapas  perceptuais  entre 
múltiplos  respondentes. 

Análise  agregada.  Técnicas  MDS  também  podem  com¬ 
binar  respondentes  e  criar  um  único  mapa  perceptual  por 
meio  de  uma  análise  agregada.  A  agregação  pode  ocorrer 
antes  ou  depois  de  escalonar  os  dados  dos  sujeitos.  Três 
abordagens  básicas  para  este  tipo  de  análise  são  agrega¬ 
ção  antes  da  análise  MDS,  resultados  individuais  agrega¬ 
dos  e  INDSCAL. 

Agregação  antes  da  análise  MDS.  A  abordagem 
mais  simples  é  o  pesquisador  encontrar  as  avaliações  mé¬ 
dias  para  todos  os  respondentes  e  então  obter  uma  úni¬ 
ca  solução  para  o  grupo  de  respondentes  como  um  todo. 
E  também  o  tipo  mais  comum  de  análise  agregada.  Para 
identificar  subgrupos  de  respondentes  semelhantes  e  seus 
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mapas  perceptuais  individuais,  o  pesquisador  pode  ana¬ 
lisar  por  agrupamento  as  respostas  dos  sujeitos  para  en¬ 
contrar  alguns  poucos  sujeitos  médios  ou  representativos 
e  então  desenvolver  mapas  para  o  “respondente  médio” 
do  agrupamento. 

Resultados  individuais  agregados.  Alternativa¬ 
mente,  o  pesquisador  pode  desenvolver  mapas  para  cada 
indivíduo  e  agrupar  os  mapas  de  acordo  com  as  coorde¬ 
nadas  dos  estímulos  nos  mapas.  Recomenda-se,  porém, 
que  a  abordagem  prévia  de  encontrar  avaliações  médias 
seja  usada  em  vez  de  se  agruparem  os  mapas  perceptu¬ 
ais  individuais,  pois  pequenas  rotações  do  mapa,  que  é 
essencialmente  o  mesmo,  podem  causar  problemas  na 
criação  de  agrupamentos  razoáveis  pela  segunda  abor¬ 
dagem. 

INDSCAL:  uma  téenica  de  combinação.  Uma  for¬ 
ma  especializada  de  análise  agregada  está  disponível  com 
INDSCAL  (escalonamento  de  diferenças  individuais)  [4] 
e  suas  variantes,  que  têm  características  de  análises  de¬ 
sagregada  e  agregada.  Uma  análise  INDSCAL  assume 
que  todos  os  indivíduos  compartilham  um  espaço  comum 
(uma  solução  agregada),  mas  que  os  respondentes  indivi¬ 
dualmente  ponderam  as  dimensões,  incluindo  pesos  nu¬ 
los  quando  ignoram  totalmente  uma  dimensão.  A  análise 
prossegue  em  dois  passos: 

1.  Como  primeiro  passo,  INDSCAL  obtém  o  espaço  perceptu- 
al  compartilhado  por  todos  os  indivíduos,  como  ocorre  em 
outras  soluções  agregadas. 

2.  No  entanto,  os  indivíduos  também  são  representados  em  um 
mapa  especial  de  grupo,  onde  a  posição  do  respondente  é 
determinada  por  seu  peso  para  cada  dimensão.  Responden¬ 
tes  colocados  próximos  uns  dos  outros  empregam  combina¬ 
ções  similares  das  dimensões  do  espaço  agregado  comum. 
Além  disso,  a  distância  do  indivíduo  ã  origem  é  uma  medida 
aproximada  da  proporção  de  variância  para  aquele  sujeito 
explicada  pela  solução.  Assim,  uma  posição  mais  distante 


da  origem  indica  melhor  ajuste.  Estar  na  origem  significa 
“sem  ajuste”,  pois  todos  os  pesos  são  nulos.  Se  dois  ou  mais 
sujeitos  ou  grupos  de  sujeitos  estão  na  origem,  os  espaços 
agregados  separados  precisam  ser  configurados  para  cada 
um  deles. 


Como  exemplo,  consideremos  que  derivamos  uma  solu¬ 
ção  agregada  bidimensional  (ver  passo  1).  INDSCAL  de¬ 
riva  também  pesos  para  cada  dimensão,  o  que  permitiria 
para  cada  respondente  ser  retratado  em  um  gráfico  bidi¬ 
mensional  (ver  Figura  9-4).  Para  o  respondente  A,  quase 
toda  a  solução  foi  orientada  em  torno  da  dimensão  I,  en¬ 
quanto  o  contrário  foi  percebido  para  o  respondente  C. 
Os  respondentes  B  e  D  têm  um  equilíbrio  entre  as  duas 
dimensões. 

Também  determinamos  o  ajuste  para  cada  respon¬ 
dente  dado  pela  distância  do  mesmo  à  origem.  Os  res¬ 
pondentes  A,  B  e  C  são  relativamente  semelhantes  em 
suas  distâncias  da  origem,  indicando  ajuste  comparável. 
No  entanto,  o  respondente  D  tem  um  nível  substancial¬ 
mente  menor  de  ajuste  dado  por  sua  grande  proximidade 
da  origem. 


Em  uma  análise  INDSCAL,  é  apresentada  ao  pes¬ 
quisador  não  somente  uma  representação  geral  do  mapa 
perceptual,  mas  também  o  grau  em  que  cada  respondente 
é  representado  pelo  mapa  perceptual  geral.  Esses  resulta¬ 
dos  para  cada  respondente  podem  então  ser  usados  para 
agrupar  respondentes  e  mesmo  identificar  diferentes  ma¬ 
pas  perceptuais  em  análises  subseqüentes. 

Escolha  entre  uma  análise  desagregada  e  uma  agregada. 

A  escolha  entre  análise  agregada  e  desagregada  é  baseada 
nos  objetivos  do  estudo.  Se  o  foco  é  uma  compreensão  das 
avaliações  gerais  de  objetos  e  das  dimensões  empregadas 
em  tais  avaliações,  uma  análise  agregada  é  mais  adequada. 
Mas  se  o  objetivo  é  entender  a  variação  entre  indivíduos. 


O 

ICO 


■D 

0) 


Peso  sobre  dimensão  I 


FIGURA  9-4  Pesos  de  respondentes  em  uma  análise  desagregada  INDSCAL. 
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-  REGRAS  PRÁTICAS  9-1  - 

Objetivos  do  MDS 

•  MDS  é  uma  técnica  exploratória  adequada  para: 

•  Identificar  dimensões  não-reconhecidas  usadas  por 
respondentes  para  fazer  comparações  entre  objetos 
(marcas,  produtos,  lojas  etc.) 

•  Fornecer  uma  base  objetiva  para  comparação  entre 
objetos  com  base  nessas  dimensões 

•  Identificar  atributos  específicos  que  possam 
corresponder  a  essas  dimensões 

•  Uma  solução  MDS  requer  identificação  de  todos  os 
objetos  relevantes  (p.ex.,  todas  as  marcas  competidoras 
dentro  de  uma  categoria  de  produto)  que  estabeleçam 
os  limites  para  a  questão  de  pesquisa 

•  Os  respondentes  fornecem  um  ou  ambos  os  tipos  de 
percepção: 

•  Distâncias  perceptuais  que  indiquem  o  quão 
semelhantes/distintos  os  objetos  são  entre  si,  ou 

•  Avaliações  do  tipo  “bom-ruim”  de  objetos 
competidores  (comparações  de  preferência)  que 
auxiliam  na  identificação  de  combinações  de 
atributos  que  são  bem  cotados 

•  MDS  pode  ser  executado  no  nível  individual  ou  em 
grupo: 

•  Análise  desagregada  (individual): 

•  Permite  construção  de  mapas  perceptuais  em  uma 
base  respondente-por-respondente 

•  Avalia  variação  entre  indivíduos 

•  Fornece  uma  base  para  análise  de  segmentação 

•  Análise  agregada  (em  grupo) 

•  Cria  mapas  perceptuais  de  um  ou  mais  grupos 

•  Ajuda  a  entender  avaliações  gerais  de  objetos  e/ 
ou  dimensões  empregadas  nas  mesmas 

•  Deve  ser  encontrada  usando-se  as  avaliações 
médias  de  todos  os  respondentes  em  um  grupo 


particularmente  como  prelúdio  para  a  análise  de  segmen¬ 
tação,  então  uma  abordagem  desagregada  é  mais  útil. 


ESTÁGIO  2:  PROJETO  DE 
PESQUISA  DO  MDS 

Apesar  de  o  MDS  parecer  muito  simples  em  termos  com¬ 
putacionais,  os  resultados,  assim  como  em  outras  técnicas 
multivariadas,  são  fortemente  influenciados  por  diversas 
questões-chave  que  devem  ser  resolvidas  antes  que  a  pes¬ 
quisa  possa  prosseguir.  Cobrimos  quatro  das  principais 
questões,  que  variam  de  discussões  sobre  delineamento 
de  pesquisa  (seleção  da  abordagem  e  de  objetos  ou  estí¬ 
mulos  para  estudo)  até  aspectos  metodológicos  específi¬ 
cos  (métodos  métricos  versus  não-métricos)  e  métodos  de 
coleta  de  dados. 


Seleção  entre  uma  abordagem 
decomposicional  (livre  de  atributos)  ou 
composicional  (baseada  em  atributos) 

As  técnicas  de  mapeamento  perceptual  podem  ser  classifi¬ 
cadas  em  um  entre  dois  tipos  conforme  a  natureza  das  res¬ 
postas  obtidas  a  partir  do  indivíduo  relativas  ao  objeto: 

•  O  método  decomposicional  mede  apenas  a  impressão  ou 
avaliação  geral  de  um  objeto  e  então  tenta  derivar  posi¬ 
ções  espaciais  em  um  espaço  multidimensional  que  reflitam 
tais  percepções.  Essa  técnica  normalmente  é  associada  ao 
MDS. 

•  O  método  composicional  é  uma  abordagem  alternativa  que 
emprega  diversas  das  técnicas  multivariadas  já  discutidas 
que  são  usadas  para  formar  uma  impressão  ou  avaliação  ba¬ 
seada  em  uma  combinação  de  atributos  específicos. 

Cada  abordagem  tem  vantagens  e  desvantagens  que 
abordamos  nas  seções  a  seguir.  Nossa  discussão  aqui  se 
concentra  nas  diferenças  entre  as  duas  abordagens,  e  em 
seguida  focalizamos  principalmente  as  técnicas  decompo- 
sicionais  no  restante  do  capítulo. 

Abordagem  decomposicional  ou  sem  atributos 

Comumente  associados  às  técnicas  de  MDS,  os  métodos 
decomposicionais  se  sustentam  em  medidas  globais  ou 
gerais  de  similaridade,  a  partir  das  quais  os  mapas  per¬ 
ceptuais  e  os  posicionamentos  relativos  de  objetos  são 
formados.  Por  conta  da  tarefa  relativamente  simples  apre¬ 
sentada  ao  respondente,  métodos  decomposicionais  têm 
duas  vantagens  distintas: 

1.  Exigem  apenas  que  os  respondentes  forneçam  suas  percep¬ 
ções  gerais  dos  objetos.  Os  respondentes  não  têm  que  deta¬ 
lhar  os  atributos  ou  a  importância  de  cada  atributo  usado  na 
avaliação. 

2.  Como  cada  respondente  fornece  uma  avaliação  completa  de 
similaridades  entre  todos  os  objetos,  os  mapas  perceptuais 
podem  ser  desenvolvidos  para  respondentes  individuais  ou 
agregados  para  formar  um  mapa  composto. 

Os  métodos  decomposicionais  também  apresentam 
desvantagens,  principalmente  relacionadas  com  as  infe¬ 
rências  exigidas  do  pesquisador  para  avaliação  dos  mapas 
perceptuais: 

1.  O  pesquisador  não  dispõe  de  base  objetiva  fornecida  pelo 
respondente  para  identificar  as  dimensões  básicas  de  ava¬ 
liação  dos  objetos  (isto  é,  a  correspondência  de  dimensões 
perceptuais  e  objetivas).  Em  muitos  casos,  a  utilidade  de 
estudos  livres  de  atributos  para  administradores  é  restrita, 
pois  tais  estudos  fornecem  pouca  orientação  para  ação  espe¬ 
cífica.  Por  exemplo,  a  falta  de  habilidade  para  desenvolver 
uma  ligação  direta  entre  ações  da  empresa  (a  dimensão  ob¬ 
jetiva)  e  posições  de  mercado  de  seus  produtos  (a  dimensão 
perceptual)  muitas  vezes  diminui  o  valor  do  mapeamento 
perceptual. 

2.  Pouca  orientação,  além  de  orientações  generalizadas  ou 
crenças  a  priori,  está  disponível  para  determinar  a  dimen- 
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sionalidade  do  mapa  perceptual  e  a  representatividade  da 
solução.  Apesar  de  algumas  medidas  gerais  de  ajuste  esta¬ 
rem  disponíveis,  elas  são  não-estatísticas,  e,  assim,  decisões 
sobre  a  solução  final  envolvem  um  substancial  julgamento 
do  pesquisador. 

Caracterizada  pela  categoria  generalizada  de  técnicas 
MDS,  uma  vasta  gama  de  possíveis  técnicas  decomposi- 
cionais  está  disponível.  A  seleção  de  um  método  específi¬ 
co  requer  decisões  relativas  à  natureza  dos  dados  do  res- 
pondente  (avaliação  versus  ordenação),  se  similaridades 
ou  preferências  são  obtidas  e  se  mapas  perceptuais  indi¬ 
viduais  ou  compostos  são  derivados.  Entre  os  programas 
de  escalonamento  multidimensional  mais  comuns  estão 
KYST,  MDSCAL,  PREFMAP,  MDPREF,  INDSCAL, 
ALSCAL,  MINISSA,  POLYCON  e  MULTISCALE. 
Descrições  detalhadas  dos  programas  e  fontes  para  obtê- 
los  estão  disponíveis  [23,  24]. 

Abordagem  composicional  ou 
baseada  em  atributos 

Os  métodos  composicionais  incluem  algumas  das  técnicas 
multivariadas  mais  tradicionais  (p.ex.,  a  análise  discrimi¬ 
nante  ou  a  análise  fatorial),  bem  como  métodos  especifi¬ 
camente  elaborados  para  mapeamento  perceptual,  como  a 
análise  de  correspondência.  Elm  princípio  comum  a  todos 
esses  métodos,  porém,  é  a  avaliação  de  similaridade,  na 
qual  um  conjunto  definido  de  atributos  é  considerado  no 
desenvolvimento  da  similaridade  entre  objetos.  As  várias 
técnicas  incluídas  no  conjunto  de  métodos  composicionais 
podem  ser  agrupadas  em  uma  de  três  categorias  básicas: 

1.  Abordagens  gráficas  ou  post  hoc.  Incluídas  nesta  classe  estão 
análises  como  gráficos  diferenciais  semânticos  ou  matrizes 
de  importância-desempenho,  que  se  sustentam  no  julgamen¬ 
to  do  pesquisador  e  em  representações  univariadas  ou  biva- 
riadas  dos  objetos. 

2.  Técnicas  estatísticas  multivariadas  convencionais.  Estas  técni¬ 
cas,  especialmente  a  análise  fatorial  e  a  análise  discriminante, 
são  particularmente  úteis  no  desenvolvimento  de  uma  estru¬ 
tura  dimensional  entre  numerosos  atributos  e  na  posterior 
representação  de  objetos  quanto  a  essas  dimensões. 

3.  Métodos  de  mapeamento  perceptual  especializados.  Notável 
nessa  classe  é  a  análise  de  correspondência,  desenvolvida  es¬ 
pecificamente  para  fornecer  mapeamento  perceptual  apenas 
com  dados  em  escala  qualitativa  ou  nominal. 

Métodos  composicionais  em  geral  têm  duas  vantagens 
distintas  oriundas  de  seus  atributos  definidos  usados  em 
comparação: 

•  Primeiro,  a  descrição  explícita  das  dimensões  do  espaço 
perceptual.  Como  o  respondente  fornece  avaliações  deta¬ 
lhadas  em  numerosos  atributos  para  cada  objeto,  os  crité¬ 
rios  de  avaliação  representados  pelas  dimensões  da  solução 
são  muito  mais  fáceis  de  se  averiguar. 

•  Além  disso,  essas  técnicas  fornecem  um  método  direto  para 
representar  atributos  e  objetos  em  um  só  mapa,  em  que  di¬ 
versas  abordagens  fornecem  o  posicionamento  adicional  de 


grupos  de  respondentes.  Essa  informação  nos  dá  uma  visão 
administrativa  única  do  ambiente  competitivo  de  mercado. 

No  entanto,  a  descrição  explícita  das  dimensões  de  com¬ 
paração  também  apresenta  desvantagens: 

•  A  similaridade  entre  objetos  é  limitada  somente  aos  atribu¬ 
tos  avaliados  pelos  respondentes.  Omitir  atributos  salientes 
elimina  a  oportunidade  para  o  respondente  de  incorporá-los, 
como  ocorreria  se  uma  medida  geral  fosse  usada. 

•  O  pesquisador  deve  assumir  algum  método  de  combinação 
desses  atributos  para  representar  a  similaridade  geral,  e  o 
método  escolhido  pode  não  representar  o  pensamento  dos 
respondentes. 

•  O  esforço  de  coleta  de  dados  é  considerável,  especialmente  à 
medida  que  o  número  de  objetos  de  escolha  aumenta. 

•  Os  resultados  raramente  estão  disponíveis  para  o  responden¬ 
te  individual. 

Ainda  que  modelos  composicionais  sigam  o  conceito 
de  uma  variável  estatística  descrita  em  muitas  das  outras 
técnicas  multivariadas  que  discutimos  em  outras  seções 
do  texto,  eles  representam  uma  técnica  bastante  diferen¬ 
te,  com  vantagens  e  desvantagens  quando  comparados  aos 
métodos  decomposicionais.  E  uma  escolha  que  o  pesqui¬ 
sador  deve  fazer  com  base  nas  metas  de  pesquisa  de  cada 
estudo  em  particular. 

Seleção  entre  técnicas  composicionais 
e  decomposicionais 

O  mapeamento  perceptual  pode  ser  executado  com  téc¬ 
nicas  composicionais  ou  decomposicionais,  mas  cada  uma 
tem  vantagens  e  desvantagens  específicas  que  devem  ser 
consideradas  do  ponto  de  vista  dos  objetivos  da  pesquisa: 

•  Se  o  mapeamento  perceptual  é  empreendido  no  espírito  de 
um  dos  dois  objetivos  básicos  discutidos  anteriormente  (ver 
estágio  1),  as  abordagens  decomposicionais  ou  livres  de  atri¬ 
butos  são  as  mais  apropriadas. 

•  Se,  contudo,  os  objetivos  de  pesquisa  mudam  para  a  retrata¬ 
ção  de  objetos  em  um  conjunto  definido  de  atributos,  então 
as  técnicas  composicionais  se  tornam  a  alternativa  preferida. 

Nossa  discussão  sobre  os  métodos  composicionais  em 
capítulos  anteriores  ilustrou  seus  usos  e  aplicações,  junta¬ 
mente  com  suas  forças  e  fraquezas.  O  pesquisador  deve 
sempre  se  lembrar  das  alternativas  disponíveis  no  caso  de 
os  objetivos  da  pesquisa  se  alterarem.  Assim,  concentra¬ 
mo-nos  aqui  nas  abordagens  decomposicionais,  seguidas 
por  uma  discussão  sobre  a  análise  de  correspondência, 
uma  técnica  composicional  amplamente  usada  e  particu¬ 
larmente  adequada  ao  mapeamento  perceptual.  Como  tal, 
também  consideramos  sinônimos  os  termos  mapeamento 
perceptual  e  escalonamento  multidimensional,  a  menos  que 
distinções  necessárias  sejam  feitas. 

Objetos:  seu  número  e  seleção 

Antes  de  iniciar  qualquer  estudo  de  mapeamento  percep¬ 
tual,  o  pesquisador  deve  tratar  de  duas  questões  sobre  os 
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objetos  em  avaliação.  Tais  questões  lidam  com  aspectos 
relativos  à  tarefa  básica  (ou  seja,  a  garantia  de  comparabi- 
lidade  dos  objetos),  bem  como  a  complexidade  da  análise 
(isto  é,  o  número  de  objetos  sob  avaliação). 

Seleção  de  objetos 

A  questão-chave  na  seleção  de  objetos  é:  os  objetos  são  real¬ 
mente  comparáveis?  Uma  suposição  implícita  em  mapea¬ 
mento  perceptual  é  que  existem  características  em  comum, 
sejam  objetivas  ou  percebidas,  que  o  respondente  pode  usar 
para  avaliações.  Portanto,  é  essencial  que  os  objetos  sob 
comparação  tenham  algum  conjunto  de  atributos  inerentes 
que  caracterizem  cada  um  deles  e  que  formem  a  base  para 
comparação  por  parte  do  respondente.  Não  é  possível  para 
o  pesquisador  forçar  o  respondente  a  fazer  comparações 
pela  criação  de  pares  de  objetos  não-comparáveis.  Ainda 
que  as  respostas  sejam  dadas  em  tal  situação  forçada,  sua 
utilidade  é  questionável. 

O  número  de  objetos 

Uma  segunda  questão  lida  com  a  quantia  de  objetos  a  se¬ 
rem  avaliados.  Ao  decidir  quantos  objetos  serão  incluídos, 
o  pesquisador  deve  equilibrar  dois  desejos:  um  menor  nú¬ 
mero  de  objetos  para  facilitar  o  esforço  por  parte  do  res¬ 
pondente  versus  o  número  exigido  de  objetos  para  obter 
uma  solução  multidimensional  estável.  Essas  considerações 
opostas  impõem  limites  sobre  a  análise: 

•  Uma  orientação  sugerida  para  soluções  estáveis  é  ter  mais  do 
que  quatro  vezes  a  quantia  de  objetos  em  relação  ao  número 
de  dimensões  desejadas  [9].  Assim,  pelo  menos  cinco  objetos 
são  exigidos  para  um  mapa  perceptual  unidimensional,  nove 
objetos  são  exigidos  para  uma  solução  bidimensional,  e  assim 
por  diante. 

•  Quando  usamos  o  método  para  avaliação  de  pares  em  termos 
de  similaridade,  o  respondente  deve  fazer  36  comparações  dos 
nove  objetos  -  uma  tarefa  considerável.  Uma  solução  tridi¬ 
mensional  demanda  pelo  menos  13  objetos  a  serem  avaliados 
e  necessita  da  avaliação  de  78  pares  de  objetos. 

Portanto,  uma  comparação  deve  ser  feita,  ponderando- 
se  a  dimensionalidade  acomodada  pelos  objetos  (e  o  conse- 
qüente  número  de  dimensões  inerentes  que  podem  ser  iden¬ 
tificadas)  e  o  esforço  exigido  por  parte  do  respondente. 

O  número  de  objetos  também  afeta  a  determinação  de 
um  nível  aceitável  de  ajuste.  Muitas  vezes,  ter  menos  do 
que  a  quantia  de  objetos  sugerida  para  uma  dada  dimen¬ 
sionalidade  provoca  uma  estimativa  exagerada  de  ajuste. 
Semelhante  ao  problema  de  superajuste  que  encontramos 
em  regressão,  ficar  abaixo  da  orientação  recomendada  de 
pelo  menos  quatro  objetos  por  dimensão  aumenta  muito  as 
chances  de  uma  solução  enganosa. 


Por  exemplo,  um  estudo  empírico  demonstrou  que 
quando  sete  objetos  são  ajustados  a  três  dimensões  com 
valores  de  similaridade  aleatórios,  níveis  de  desajuste 


aceitáveis  e  mapas  perceptuais  aparentemente  válidos 
são  gerados  em  mais  de  50%  das  vezes.  Se  os  sete  obje¬ 
tos  com  similaridades  aleatórias  são  ajustados  a  quatro 
dimensões,  os  valores  de  desajuste  decaem  para  zero,  in¬ 
dicando  ajuste  perfeito,  em  metade  dos  casos  [18].  Mes¬ 
mo  assim,  nas  duas  situações,  não  havia  qualquer  padrão 
real  de  similaridade  entre  os  objetos. 


Portanto,  devemos  estar  cientes  dos  riscos  associa¬ 
dos  com  a  violação  das  orientações  para  o  número  de 
objetos  por  dimensão  e  do  impacto  que  isso  tem  sobre 
as  medidas  de  ajuste  e  a  validade  dos  mapas  perceptuais 
resultantes. 

Métodos  não-métricos  versus  métricos 

Os  programas  MDS  originais  eram  verdadeiramente 
não-métricos,  o  que  significa  que  exigiam  apenas  dados 
não-métricos,  mas  também  forneciam  apenas  resultados 
não-métricos  (ordenação).  O  resultado  não-métrico,  po¬ 
rém,  limitava  a  interpretabilidade  do  mapa  perceptual. 
Portanto,  todos  os  programas  MDS  usados  hoje  em  dia 
produzem  saídas  métricas.  As  posições  multidimensio- 
nais  métricas  podem  ser  rotacionadas  em  torno  da  ori¬ 
gem,  a  origem  pode  ser  transladada  pelo  acréscimo  de 
uma  constante,  os  eixos  podem  ser  trocados  (reflexão)  ou 
a  solução  inteira  pode  ser  uniformemente  expandida  ou 
comprimida,  tudo  isso  sem  alterar  as  posições  relativas 
dos  objetos. 

Como  todos  os  programas  atuais  produzem  saídas 
métricas,  as  distinções  nas  abordagens  são  baseadas  nas 
medidas  de  similaridade. 

•  Métodos  não-métricos,  diferenciados  pelos  dados  não- 
métricos  normalmente  gerados  pela  ordenação  de  pares  de 
objetos,  são  mais  flexíveis,  no  sentido  de  que  não  assumem 
qualquer  tipo  específico  de  relação  entre  a  distância  calcu¬ 
lada  e  a  medida  de  similaridade.  No  entanto,  como  os  mé¬ 
todos  não-métricos  contêm  menos  informação  para  criar  o 
mapa  perceptual,  têm  maior  probabilidade  de  resultar  em 
soluções  degeneradas  ou  subótimas.  Esse  problema  surge 
quando  existem  grandes  variações  nos  mapas  perceptuais 
entre  respondentes  ou  quando  as  percepções  entre  objetos 
não  são  distintas  ou  bem  definidas. 

•  Os  métodos  métricos  consideram  que  tanto  dados  quanto 
saídas  são  métricos.  Essa  suposição  permite  fortalecer  a  re¬ 
lação  entre  a  dimensionalidade  final  resultante  e  os  dados 
de  entrada.  Melhor  do  que  assumir  que  apenas  relações  or¬ 
denadas  são  preservadas  nos  dados  de  entrada,  podemos 
assumir  que  o  resultado  preserva  as  qualidades  de  intervalo 
e  de  proporção  desses  dados.  Mesmo  que  as  suposições  ine¬ 
rentes  aos  programas  métricos  sejam  mais  difíceis  de  apoiar 
conceitualmente  em  muitos  casos,  os  resultados  de  proce¬ 
dimentos  não-métricos  e  métricos  aplicados  aos  mesmos 
dados  freqüentemente  são  semelhantes. 

Logo,  a  seleção  do  tipo  de  dados  de  entrada  deve  con¬ 
siderar  tanto  a  situação  de  pesquisa  (variações  de  percep- 
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ções  entre  respondentes  e  distinção  entre  objetos)  quanto 
o  modo  preferido  de  coleta  de  dados. 

Coleta  de  dados  de  similaridade 
ou  de  preferência 

Como  já  observado,  a  distinção  fundamental  entre  os  pro¬ 
gramas  MDS  é  o  tipo  de  dado  (métrico  versus  não-métri- 
co)  e  se  os  dados  representam  similaridades  ou  preferên¬ 
cias.  Aqui  abordamos  questões  associadas  a  julgamentos 
baseados  em  similaridades  e  em  preferência.  Para  muitos 
dos  métodos  de  coleta  de  dados,  tanto  dados  métricos 
(avaliações)  quanto  não-métricos  (ordenações)  podem 
ser  coletados.  Em  alguns  casos,  porém,  as  respostas  são 
limitadas  a  apenas  um  tipo  de  dados. 

Dados  de  similaridades 

Quando  coleta  dados  de  similaridades,  o  pesquisador 
está  tentando  determinar  quais  itens  são  os  mais  pare¬ 
cidos  uns  com  os  outros  e  quais  são  os  mais  diferentes. 
Os  termos  de  dissimilaridade  e  similaridade  muitas  vezes 
são  empregados  alternadamente  para  representar  me¬ 
didas  das  diferenças  entre  objetos.  Implícita  na  medida 
de  similaridade  está  a  habilidade  de  comparar  todos  os 
pares  de  objetos. 


Se,  por  exemplo,  todos  os  pares  de  objetos  do  conjunto 
A,  B,  C  (ou  seja,  AB,  AC,  BC)  são  ordenados,  então  to¬ 
dos  os  pares  de  objetos  também  podem  ser  comparados. 
Considere  que  os  pares  foram  ordenados  AB  =  1,  AC  = 
2  e  BC  =  3  (onde  1  denota  maior  similaridade).  Eviden¬ 
temente,  o  par  AB  é  mais  similar  do  que  AC,  o  par  AB 
é  mais  similar  do  que  BC,  e  o  par  AC  é  mais  similar  do 
que  BC. 


Diversos  procedimentos  são  comumente  empre¬ 
gados  para  obter  percepções  de  respondentes  quanto 
a  similaridades  entre  estímulos.  Cada  procedimento  é 
baseado  na  noção  de  que  as  diferenças  relativas  entre 
qualquer  par  de  estímulos  devem  ser  medidas  de  forma 
que  o  pesquisador  possa  determinar  se  o  par  é  mais  ou 
menos  similar  do  que  qualquer  outro  par.  Discutimos 
três  procedimentos  normalmente  usados  para  obter 
percepções  de  respondentes  quanto  a  similaridades: 
comparações  de  pares  de  objetos,  dados  de  confusão  e 
medidas  derivadas. 

Comparação  de  pares  de  objetos.  Com  larga  vanta¬ 
gem,  o  método  mais  usado  para  obter  julgamentos  de 
similaridades  é  o  de  pares  de  objetos,  no  qual  o  respon- 
dente  é  solicitado  a  simplesmente  ordenar  ou  avaliar  a 
similaridade  de  todos  os  pares  de  objetos.  Se  temos  es¬ 
tímulos  A,  B,  C,  D  e  E,  podemos  ordenar  os  pares  AB, 
AC,  AD,  AE,  BC,  BD,  BE,  CD,  CE  e  DE  do  mais  ao 
menos  similar. 


Se,  por  exemplo,  o  par  AB  é  ordenado  como  f,  consi¬ 
deraríamos  que  o  respondente  vê  aquele  par  como  con¬ 
tendo  os  dois  estímulos  que  são  os  mais  similares,  em 
comparação  com  todos  os  demais  pares  (ver  exemplo  na 
seção  anterior). 


Esse  procedimento  forneceria  uma  medida  não-mé¬ 
trica  de  similaridade.  Medidas  métricas  de  similaridade 
envolveriam  uma  avaliação  de  similaridade  (p.ex.,  de  1 
“muito  similar”  a  10  “nada  semelhante”).  Qualquer  for¬ 
ma  (métrica  ou  não-métrica)  pode  ser  usada  na  maioria 
dos  programas  MDS. 

Dados  de  confusão  A  medida  de  similaridade  por  pa- 
reamento  (ou  confusão)  do  estímulo  I  com  o  estímulo  /  é 
conhecida  como  dados  de  confusão.  Também  conhecido 
como  agrupamento  subjetivo,  um  procedimento  típico 
para  reunir  esses  dados  quando  o  número  de  objetos  é 
grande  segue  abaixo: 

•  Colocar  os  objetos  cuja  similaridade  deve  ser  medida  em 
pequenos  cartões,  de  maneira  descritiva  ou  com  imagens. 

•  O  respondente  é  solicitado  a  ordenar  os  cartões  em  pilhas, 
de  forma  que  todos  os  cartões  de  uma  pilha  representem 
doces  semelhantes.  Alguns  pesquisadores  dizem  aos  res¬ 
pondentes  para  ordenar  em  um  número  fixo  de  pilhas;  ou¬ 
tros  dizem  para  ordenar  em  quantas  pilhas  o  respondente 
quiser. 

•  Os  dados  de  cada  respondente  são  então  agregados  em  uma 
matriz  de  similaridades  parecida  com  uma  tabela  de  tabu¬ 
lação  cruzada.  Cada  célula  contém  o  número  de  vezes  que 
cada  par  de  objetos  foi  incluído  na  mesma  pilha.  Esses  da¬ 
dos  indicam  quais  produtos  apareceram  juntos  com  maior 
freqüência  e,  por  isso,  são  considerados  os  mais  similares. 

A  coleta  de  dados  dessa  maneira  permite  apenas  o 
cálculo  de  similaridades  agregadas,  pois  as  respostas  de 
todos  os  indivíduos  são  combinadas  para  obter  a  matriz 
de  similaridades. 

Medidas  derivadas.  Similaridades  baseadas  em  escores 
dados  a  estímulos  por  respondentes  são  conhecidas  como 
medidas  derivadas.  Q  pesquisador  define  as  dimensões 
(atributos)  e  o  respondente  avalia  cada  objeto  em  cada  di¬ 
mensão.  A  partir  dessas  avaliações  a  similaridade  de  cada 
objeto  é  calculada  por  métodos  como  a  correlação  entre 
objetos  ou  alguma  forma  de  índice  de  concordância. 


Por  exemplo,  sujeitos  são  solicitados  a  avaliar  três  es¬ 
tímulos  (refrigerante  de  cereja,  morango  e  lima-limão) 
quanto  a  alguns  atributos  (diet  versus  normal,  doce  ver¬ 
sus  azedo,  sabor  leve  versus  sabor  forte),  usando  escalas 
diferenciais  semânticas.  As  respostas  são  avaliadas  para 
cada  respondente  (p.ex.,  correlação  ou  índice  de  con¬ 
cordância)  para  criar  medidas  de  similaridade  entre  os 
objetos. 
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Três  suposições  importantes  estão  presentes  nesta 
abordagem: 

1.  O  pesquisador  seleciona  as  dimensões  adequadas  à  medi¬ 
da. 

2.  As  escalas  podem  ser  ponderadas  (por  igual  ou  não)  para 
conseguir  os  dados  de  similaridades  para  um  sujeito  ou  gru¬ 
po  de  sujeitos. 

3.  Todos  os  indivíduos  têm  os  mesmos  pesos. 

Dentre  os  três  procedimentos  que  discutimos,  a  medi¬ 
da  derivada  é  a  menos  desejável  para  atender  ao  espírito 
de  MDS  -  de  que  a  avaliação  de  objetos  seja  feita  com  a 
mínima  influência  por  parte  do  pesquisador. 

Dados  de  preferência 

A  preferência  implica  que  os  estímulos  devem  ser  julgados 
em  termos  de  relações  de  predomínio;  ou  seja,  os  estímu¬ 
los  são  ordenados  em  termos  da  preferência  por  alguma 
propriedade.  Ela  permite  ao  pesquisador  fazer  afirmações 
diretas  sobre  qual  o  objeto  preferido  (p.ex.,  a  marca  A  é 
preferida  em  relação  à  C).  Os  dois  procedimentos  mais 
comuns  para  obter  dados  de  preferência  são  a  ordenação 
direta  e  a  comparação  aos  pares. 

Ordenação  direta.  Cada  respondente  ordena  os  objetos 
do  mais  preferido  ao  menos  preferido.  Esse  é  um  método 
muito  popular  para  reunir  dados  de  similaridades  não- 
métricos,  pois  é  fácil  administrar  para  um  número  peque¬ 
no  ou  moderado  de  objetos.  E  conceitualmente  muito  pa¬ 
recido  com  a  técnica  de  agrupamento  subjetivo  discutida 
anteriormente,  só  que  nesse  caso  a  cada  objeto  deve  ser 
dada  uma  ordem  única  (sem  empates). 

Comparações  aos  pares.  Um  respondente  é  defrontado 
com  todos  os  possíveis  pares  e  solicitado  a  indicar  qual 
membro  de  cada  par  é  preferido.  Assim,  preferência  geral 
é  baseada  no  número  total  de  vezes  que  cada  objeto  foi  o 
membro  preferido  da  comparação  pareada.  Desse  modo, 
o  pesquisador  reúne  dados  explícitos  para  cada  compara¬ 
ção.  Esta  abordagem  cobre  todas  as  possíveis  combina¬ 
ções  e  é  muito  mais  detalhada  do  que  apenas  as  ordena¬ 
ções  diretas.  A  principal  desvantagem  desse  método  é  o 
grande  número  de  tarefas  envolvidas,  mesmo  com  uma 
quantia  relativamente  pequena  de  objetos.  Por  exemplo, 
10  objetos  resultam  em  45  comparações  aos  pares,  o  que 
representa  muitas  tarefas  para  a  maioria  das  situações  de 
pesquisa.  Note  que  as  comparações  aos  pares  também  são 
usadas  na  coleta  de  dados  de  similaridades,  como  obser¬ 
vado  no  exemplo  do  início  do  capítulo,  mas  lá  os  pares 
de  objetos  são  ordenados  ou  avaliados  quanto  ao  grau  de 
similaridade  entre  os  dois  objetos  no  par. 

Dados  de  preferência  versus 
dados  de  similaridade 

Tanto  os  dados  de  similaridade  quanto  os  de  preferên¬ 
cia  fornecem  uma  base  para  a  construção  de  um  mapa 
perceptual  que  pode  retratar  as  posições  relativas  dos 


-  REGRAS  PRÁTICAS  9-2  - 

Planejamento  de  pesqnisa  de  MDS 

•  Mapas  perceptuais  podem  ser  gerados  através  de 
abordagens  decomposicionais  ou  composicionais: 

•  Abordagens  decomposicionais  são  o  método 
MDS  mais  tradicional  e  comum,  exigindo  apenas 
comparações  gerais  de  similaridade  entre  objetos 

•  Abordagens  composicionais  são  usadas  quando  os 
objetivos  de  pesquisa  envolvem  a  comparação  de 
objetos  em  um  conjunto  definido  de  atributos 

•  O  número  de  objetos  a  ser  avaliado  é  uma  decisão 
ponderada  entre: 

•  Um  pequeno  número  de  objetos  para  facilitar  a 
tarefa  do  respondente 

•  Um  número  de  objetos  quatro  vezes  maior  do  que 
o  de  dimensões  desejadas  (ou  seja,  cinco  objetos 
por  uma  dimensão,  9  objetos  por  duas  dimensões,  e 
assim  por  diante)  para  obter  uma  solução  estável 


objetos  através  de  dimensões  percebidas  (inferidas).  A 
escolha  entre  as  duas  técnicas  depende  dos  objetivos  a 
serem  alcançados: 

•  Mapas  perceptuais  baseados  em  similaridade  são  mais  ade¬ 
quados  para  compreender  os  atributos/dimensões  que  des¬ 
crevem  os  objetos.  Nesta  técnica,  o  foco  está  na  caracteri¬ 
zação  da  natureza  de  cada  objeto  e  da  sua  composição  em 
relação  aos  demais. 

•  Dados  de  preferência  permitem  ao  pesquisador  ver  a  loca¬ 
lização  de  objetos  em  um  mapa  perceptual  no  qual  a  distân¬ 
cia  implica  diferenças  de  preferência.  Esse  procedimento  é 
útil  porque  a  percepção  de  um  indivíduo  quanto  a  objetos 
em  um  contexto  de  preferência  pode  ser  diferente  daquela 
em  um  contexto  de  similaridade.  Isto  é,  uma  dimensão  em 
particular  pode  ser  útil  na  descrição  das  semelhanças  entre 
dois  objetos,  mas  pode  não  ser  identificada  como  resultado 
na  determinação  de  preferência. 

As  diferentes  bases  para  comparação  nas  duas  técnicas 
muitas  vezes  resultam  em  mapas  perceptuais  muito  distin¬ 
tos.  Dois  objetos  podem  ser  percebidos  como  diferentes 
em  um  mapa  baseado  em  similaridades,  mas  serem  seme¬ 
lhantes  em  um  mapa  baseado  em  preferências,  resultando 
em  dois  mapas  bem  diferentes.  Por  exemplo,  duas  marcas 
distintas  de  doce  poderiam  estar  bem  distantes  em  um 
mapa  de  similaridades,  mas,  por  terem  preferência  equi¬ 
valente,  Acarem  próximas  uma  da  outra  em  um  mapa  de 
preferência.  O  pesquisador  deve  escolher  o  mapa  que  me¬ 
lhor  atende  às  metas  da  análise. 

Resumo 

Os  procedimentos  de  coleta  para  dados  de  similaridades  e 
de  preferência  têm  o  propósito  em  comum  de  obter  uma 
série  de  respostas  unidimensionais  que  representem  os 
julgamentos  dos  respondentes.  Esses  julgamentos  então 
servem  como  dados  de  entrada  para  os  muitos  procedi- 
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mentos  MDS  que  definem  o  padrão  multidimensional  ine¬ 
rente  que  leva  a  tais  julgamentos. 


ESTÁGIO  3:  SUPOSIÇÕES 
DA  ANÁLISE  DE  MDS 

O  escalonamento  multidimensional  não  tem  suposições 
restritivas  sobre  a  metodologia,  tipo  de  dados  ou  forma 
das  relações  entre  as  variáveis,  mas  o  MDS  exige  que  o 
pesquisador  aceite  três  princípios  fundamentais  sobre 
percepção: 

1.  Variação  em  dimensionalidade.  Os  respondentes  podem  va¬ 
riar  na  dimensionalidade  que  eles  usam  para  formar  suas 
percepções  sobre  um  objeto  (apesar  de  se  imaginar  que  a 
maioria  das  pessoas  julga  em  termos  de  um  número  limi¬ 
tado  de  características  ou  dimensões).  Por  exemplo,  alguns 
poderiam  avaliar  um  carro  em  termos  de  sua  potência  e  apa¬ 
rência,  ao  passo  que  outros  não  considerariam  esses  fatores 
de  forma  alguma,  mas  o  avaliariam  em  termos  de  custo  e 
conforto  interior. 

2.  Variação  em  importância.  Os  respondentes  não  precisam 
associar  o  mesmo  nível  de  importância  a  uma  dimensão, 
mesmo  que  todos  os  respondentes  percebam  essa  dimensão. 
Por  exemplo,  dois  respondentes  percebem  um  refrigerante 
em  termos  de  seu  nível  de  gás,  mas  um  pode  considerar  essa 
dimensão  sem  importância  enquanto  outro  pode  considerá- 
la  muito  relevante. 

3.  Variação  no  tempo.  Os  julgamentos  de  um  estímulo  em  ter¬ 
mos  de  dimensões  ou  níveis  de  importância  não  precisam 
permanecer  estáveis  com  o  tempo.  Em  outras  palavras,  não 
se  pode  esperar  que  os  respondentes  mantenham  as  mesmas 
percepções  durante  longos  períodos. 

Apesar  das  diferenças  que  podemos  esperar  entre  in¬ 
divíduos,  os  métodos  MDS  podem  representar  as  percep¬ 
ções  espacialmente,  de  modo  que  todas  essas  diferenças 
sejam  acomodadas.  Tal  capacidade  permite  que  técnicas 
MDS  não  apenas  ajudem  o  pesquisador  a  entender  cada 
indivíduo  em  separado,  mas  também  a  identificar  percep¬ 
ções  compartilhadas  e  avaliar  dimensões  dentro  da  amos¬ 
tra  de  respondentes. 


ESTÁGIO  4:  DETERMINAÇÁO  DA 
SOLUÇÁO  MDS  E  AVALIAÇÁO 
DO  AJUSTE  GERAL 

Hoje  em  dia,  os  programas  MDS  básicos  disponíveis  em 
todos  os  principais  programas  estatísticos  podem  acomo¬ 
dar  os  diferentes  tipos  de  dados  de  entrada  e  de  repre¬ 
sentações  espaciais,  bem  como  as  variadas  alternativas 
de  interpretação.  Nossa  meta  aqui  é  fornecer  uma  visão 
geral  do  MDS  para  viabilizar  uma  rápida  compreensão 
das  diferenças  entre  esses  programas.  No  entanto,  como 
acontece  com  outras  técnicas  multivariadas,  existe  um 
desenvolvimento  contínuo  em  aplicações  e  teoria.  Assim, 


indicamos  para  o  usuário  interessado  em  aplicações  espe¬ 
cíficas  outros  textos  dedicados  somente  ao  escalonamento 
multidimensional  [9, 10, 16, 18,  23]. 

Determinação  da  posição  de  um 
objeto  no  mapa  perceptual 

A  primeira  tarefa  do  estágio  4  envolve  o  posicionamento 
de  objetos  para  melhor  refletir  as  avaliações  de  similarida¬ 
des  fornecidas  pelos  respondentes  (ver  Figura  9-5).  Aqui 
as  técnicas  MDS  determinam  as  localizações  ótimas  para 
cada  objeto  em  uma  dimensionalidade  especificada.  As 
soluções  para  cada  dimensionalidade  (duas  dimensões, 
três  etc.)  são  então  comparadas  para  a  escolha  de  uma  so¬ 
lução  final  que  define  o  número  de  dimensões  e  a  posição 
relativa  de  cada  objeto  em  tais  dimensões. 

Criação  do  mapa  perceptual 

Os  programas  MDS  seguem  um  processo  em  comum  de 
três  passos  para  determinar  as  posições  ótimas  em  uma 
dimensionalidade  escolhida: 

1.  Selecione  uma  configuração  inicial  de  estímulos  {S^  em 
uma  dimensionalidade  inicial  desejada  (f).  Há  várias  opções 
disponíveis  para  se  obter  a  configuração  inicial.  As  duas 
mais  usadas  são  configurações  aplicadas  pelo  pesquisador 
com  base  em  dados  prévios  ou  aquelas  geradas  pela  seleção 
de  pontos  pseudo-aleatórios  de  uma  distribuição  multiva- 
riada  aproximadamente  normal. 

2.  Compute  as  distâncias  entre  os  pontos  de  estímulos  e  com¬ 
pare  as  relações  (observadas  versus  obtidas)  com  uma  me¬ 
dida  de  ajuste.  Logo  que  uma  configuração  é  encontrada,  as 
distâncias  entre  estímulos  (d.^)  nas  configurações  iniciais  são 
comparadas  com  medidas  de  distância  (d--)  obtidas  a  partir 
de  julgamentos  de  similaridades  (í^^).  As  duas  medidas  de 
distância  são  então  comparadas  por  uma  medida  de  ajus¬ 
te,  normalmente  uma  medida  de  desajuste.  (As  medidas  de 
ajuste  são  discutidas  em  uma  seção  posterior.) 

3.  Se  a  medida  de  desajuste  não  atender  a  um  valor  de  parada 
pré-definido,  encontre  uma  nova  configuração  para  a  qual  a 
medida  de  desajuste  seja  ainda  mais  minimizada.  O  progra¬ 
ma  determina  as  direções  nas  quais  o  maior  melhoramento 
pode  ser  conseguido  e  então  desloca  os  pontos  na  configura¬ 
ção  naquelas  direções  com  pequenos  incrementos. 

A  necessidade  de  um  programa  de  computador  em  vez 
de  cálculos  manuais  se  torna  evidente  quando  o  número 
de  objetos  e  dimensões  aumenta.  Examinemos  uma  típica 
análise  MDS  e  vejamos  o  que  realmente  está  envolvido. 

Com  10  produtos  a  serem  avaliados,  cada  respondente 
deve  ordenar  os  45  pares  de  objetos  possíveis  do  mais  si¬ 
milar  (1)  ao  menos  semelhante  (45).  Com  essas  ordena¬ 
ções,  prosseguimos  com  a  tentativa  de  definir  a  dimen¬ 
sionalidade  e  as  posições  de  cada  objeto. 

1.  Primeiro,  considere  que  estamos  começando  com 
uma  solução  bidimensional.  Apesar  de  podermos 
definir  qualquer  número  de  dimensões,  é  mais  fácil 

(Continua) 
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Estágio  4 


Estágio  5 


Estágio  6 


FiGURA  9-5  Estágios  4-6  no  diagrama  de  decisões  do  escalonamento  multidimensional. 
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(Continuação) 

visualizar  o  processo  em  uma  situação  simples  de 
duas  dimensões. 

2.  Coloque  os  10  pontos  (que  representam  os  10  pro¬ 
dutos)  aleatoriamente  em  um  gráfico  impresso  (re¬ 
presentando  as  duas  dimensões)  e  então  meça  as 
distâncias  entre  cada  par  de  pontos  (45  distâncias). 

3.  Calcule  a  qualidade  de  ajuste  da  solução  medindo  a 
concordância  de  ordenação  entre  as  distâncias  eu¬ 
clidianas  (comprimento  de  segmentos  de  reta)  dos 
objetos  colocados  no  gráfico  e  as  45  ordenações  ori¬ 
ginais. 

4.  Se  as  distâncias  em  segmentos  retos  não  concordam 
com  as  ordenações  originais,  mova  os  10  pontos  e 
tente  novamente.  Continue  a  mover  os  objetos  até 
você  conseguir  um  ajuste  satisfatório  entre  as  dis¬ 
tâncias  entre  todos  os  objetos  e  as  ordenações  indi¬ 
cativas  de  similaridade. 

5.  Você  pode  então  posicionar  os  10  objetos  em  um 
espaço  tridimensional  e  seguir  o  mesmo  processo. 
Se  o  ajuste  de  distâncias  reais  com  os  postos  de  si¬ 
milaridade  for  melhor,  então  a  solução  tridimensio¬ 
nal  pode  ser  mais  adequada. 


Como  o  leitor  pode  perceber,  o  processo  rapidamen¬ 
te  se  torna  intratável  quando  o  número  de  objetos  e  de 
dimensões  aumenta.  Computadores  executam  os  cálculos 
e  viabilizam  uma  solução  mais  precisa  e  detalhada.  O  pro¬ 
grama  calcula  a  melhor  solução  sobre  qualquer  número 
de  dimensões,  fornecendo  assim  uma  base  de  comparação 
entre  várias  soluções. 

O  principal  critério  em  todos  os  casos  para  encontrar  a 
melhor  representação  dos  dados  é  a  preservação  da  rela¬ 
ção  ordenada  entre  os  dados  de  postos  originais  e  as  dis¬ 
tâncias  obtidas  entre  pontos.  Qualquer  medida  de  ajuste 
(p.ex.,  desajuste)  é  simplesmente  uma  medida  do  quanto 
os  postos  baseados  nas  distâncias  no  mapa  concordam  (ou 
não)  com  as  ordenações  dadas  pelos  respondentes. 

Prevenção  contra  soluções  degeneradas 

Ao  avaliar  um  mapa  perceptual,  o  pesquisador  sempre 
deve  estar  ciente  das  soluções  degeneradas.  Soluções 
degeneradas  são  mapas  perceptuais  obtidos  que  não  são 
representações  precisas  das  respostas  de  similaridade. 
Quase  sempre  são  provocadas  por  inconsistências  nos 
dados  ou  por  uma  falta  de  habilidade  do  programa  MDS 
em  alcançar  uma  solução  estável.  Geralmente  são  carac¬ 
terizadas  por  um  padrão  circular  no  qual  todos  os  objetos 
são  mostrados  como  igualmente  semelhantes,  ou  por  uma 


solução  agrupada  na  qual  os  objetos  são  agregados  em 
dois  extremos  de  uma  só  dimensão.  Em  ambos  os  casos,  o 
MDS  é  incapaz  de  diferenciar  os  objetos  por  algum  moti¬ 
vo.  Q  pesquisador  deve  então  reexaminar  o  delineamento 
da  pesquisa  para  ver  onde  as  inconsistências  ocorrem. 

Seleção  da  dimensionalidade 
do  mapa  perceptual 

Como  visto  na  seção  anterior,  o  MDS  define  o  mapa  per¬ 
ceptual  ótimo  em  várias  soluções  de  diversas  dimensiona- 
lidades.  Com  estas  soluções  em  mãos,  o  objetivo  do  próxi¬ 
mo  passo  é  a  seleção  de  uma  configuração  espacial  (mapa 
perceptual)  em  um  número  especificado  de  dimensões.  A 
determinação  de  quantas  dimensões  estão  realmente  re¬ 
presentadas  nos  dados  geralmente  é  conseguida  por  meio 
de  uma  entre  três  abordagens:  avaliação  subjetiva,  gráficos 
scree  das  medidas  de  desajuste,  ou  índice  geral  de  ajuste. 

Avaliação  subjetiva 

O  mapa  espacial  é  um  bom  ponto  de  partida  para  a  ava¬ 
liação.  Q  número  de  mapas  necessário  à  interpretação  de¬ 
pende  do  número  de  dimensões.  Um  mapa  é  produzido 
para  cada  combinação  de  dimensões.  Um  objetivo  do  pes¬ 
quisador  deve  ser  o  de  obter  o  melhor  ajuste  com  o  menor 
número  possível  de  dimensões.  A  interpretação  de  solu¬ 
ções  obtidas  em  mais  de  três  dimensões  é  extremamente 
difícil  e  geralmente  não  compensa  a  melhoria  no  ajuste. 
Q  pesquisador  normalmente  faz  uma  avaliação  subjetiva 
dos  mapas  perceptuais  e  determina  se  a  configuração  pa¬ 
rece  razoável.  Essa  avaliação  é  importante  porque,  em  um 
estágio  posterior,  as  dimensões  precisarão  ser  interpreta¬ 
das  e  explicadas. 

Medidas  de  desajuste 

Uma  segunda  abordagem  é  usar  uma  medida  de  desajus¬ 
te,  a  qual  indica  a  proporção  da  variância  das  disparidades 
(diferenças  em  distâncias  entre  objetos  no  mapa  percep¬ 
tual  e  os  julgamentos  de  semelhança  dos  respondentes) 
não  explicadas  pelo  modelo  MDS.  Essa  medida  varia  de 
acordo  com  o  tipo  de  programa  e  os  dados  analisados.  Q 
desajuste  de  Kruskal  [17]  é  a  medida  mais  comumente 
usada  para  determinar  uma  adequação  de  ajuste  do  mo¬ 
delo.  Ele  é  definido  por: 
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onde 

d  =  distância  média  {Y,djjln^  no  mapa 
djj  =  distância  obtida  do  mapa  perceptual 
d,,  =  distância  original  baseada  em  julgamentos 
de  similaridade 

O  valor  de  desajuste  se  torna  menor  à  medida  que  as 
djj  estimadas  se  aproximam  das  originais.  O  desajuste 
é  minimizado  quando  os  objetos  são  colocados  em  uma 
configuração,  de  modo  que  as  distâncias  entre  os  objetos 
combinem  melhor  com  as  distâncias  originais. 

No  entanto,  um  problema  encontrado  ao  usar  o  desa¬ 
juste  é  análogo  ao  de  i?^em  regressão  múltipla,  no  sentido 
de  que  o  desajuste  sempre  melhora  quando  aumentam 
as  dimensões.  (Lembre-se  que  sempre  aumenta  com 
variáveis  adicionais.)  Assim,  um  equilíbrio  deve  ser  feito 
entre  o  ajuste  da  solução  e  o  número  de  dimensões.  Como 
foi  feito  para  a  extração  de  fatores  em  análise  fatorial, 
podemos  representar  graficamente  o  valor  de  desajuste 
versus  o  número  de  dimensões  para  determinar  o  melhor 
número  de  dimensões  a  ser  utilizado  na  análise  [18]. 


Por  exemplo,  no  gráfico  scree  na  Figura  9-6,  a  quebra 
indica  que  há  uma  melhora  substancial  na  qualidade  de 
ajuste  quando  o  número  de  dimensões  aumenta  de  1 
para  2.  Portanto,  o  melhor  ajuste  é  conseguido  com  uma 
quantia  relativamente  pequena  (2)  de  dimensões. 


índice  de  ajuste 

Um  índice  de  correlação  quadrada  às  vezes  é  usado  como 
índice  de  ajuste.  Ele  pode  ser  interpretado  como  indicati¬ 
vo  da  proporção  de  variância  das  disparidades  explicada 
pelo  procedimento  MDS.  Em  outras  palavras,  é  uma  me¬ 
dida  do  quanto  os  dados  originais  se  ajustam  ao  modelo 
MDS. 

A  medida  em  escalonamento  multidimensional 
representa  essencialmente  a  mesma  medida  de  variân¬ 
cia  que  ocorre  com  outras  técnicas  multivariadas.  Logo, 


é  possível  usar  critérios  de  medida  semelhantes.  Ou 
seja,  medidas  de  0,60  ou  melhores  que  isso  são  consi¬ 
deradas  aceitáveis.  Naturalmente,  quanto  maior  o  R^, 
melhor  o  ajuste. 

Incorporação  de  preferências  ao  MDS 

Até  este  ponto,  nos  concentramos  em  desenvolver  mapas 
perceptuais  baseados  em  julgamentos  de  similaridade.  No 
entanto,  mapas  perceptuais  também  podem  ser  obtidos  a 
partir  de  preferências.  A  meta  é  determinar  a  combinação 
preferida  de  características  para  um  conjunto  de  estímulos 
que  preveja  preferência,  dada  uma  configuração  de  obje¬ 
tos  [8, 9].  Ao  se  fazer  isso,  cria-se  um  espaço  conjunto  que 
representa  tanto  os  objetos  (estímulos)  quanto  os  sujeitos 
(pontos  ideais).  Uma  suposição  crítica  é  a  homogeneidade 
de  percepção  ao  longo  dos  indivíduos  para  o  conjunto  de 
objetos.  Essa  homogeneidade  permite  que  todas  as  dife¬ 
renças  sejam  atribuídas  a  preferências,  e  não  a  diferenças 
perceptuais. 

Pontos  ideais 

O  termo  ponto  ideal  tem  sido  mal  compreendido  ou  en¬ 
ganoso  algumas  vezes.  Podemos  considerar  que  se  loca¬ 
lizamos  (no  mapa  perceptual  obtido)  o  ponto  que  repre¬ 
senta  a  combinação  preferida  de  atributos  percebidos, 
identificamos  a  posição  de  um  objeto  ideal.  Igualmente, 
podemos  considerar  que  a  posição  desse  ponto  ideal  (re¬ 
lativa  aos  outros  produtos  no  mapa  perceptual  derivado) 
define  preferências  relativas  de  forma  que  produtos  mais 
distantes  do  ideal  devem  ser  menos  preferidos.  Assim, 
um  ponto  ideal  é  posicionado  de  maneira  que  a  distância 
do  ideal  transmita  mudanças  em  preferência. 


Considere,  por  exemplo,  a  Figura  9-7.  Quando  os  dados 
de  preferência  sobre  os  seis  doces  (A  a  F)  foram  obti¬ 
dos  de  um  respondente,  o  ponto  ideal  deles  (indicado 
pelo  ponto)  foi  posicionado  de  maneira  que  o  aumento 
da  distância  do  mesmo  indicava  preferência  em  declínio. 

(Continua) 


FIGURA  9-6  Uso  de  um  gráfico  scree  para  determinar  a  dimensionalidade  adequada. 
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Dimensão  II 


Dimensão  I 


•  Indica  ponto  ideal  do  respondente 

FIGURA  9-7  Ponto  ideal  de  um  respondente  dentro  do  mapa  perceptual. 


{Conlinuação) 

Com  base  neste  mapa  perceptual,  a  ordem  de  preferên¬ 
cia  desse  respondente  é  C,  F,  D,  E,  A,  B.  Deduzir  que 
o  doce  ideal  está  exatamente  naquele  ponto  ou  mesmo 
além  dele  (na  direção  mostrada  pela  linha  tracejada  a 
partir  da  origem)  pode  ser  enganoso.  O  ponto  ideal  sim¬ 
plesmente  define  a  relação  de  preferência  ordenada  (do 
mais  preferido  ao  menos)  no  conjunto  de  seis  doces  para 
aquele  respondente. 


Apesar  de  os  pontos  ideais  não  poderem  oferecer  mui¬ 
ta  perspectiva  individualmente,  agrupamentos  deles  po¬ 
dem  ser  úteis  para  definir  segmentos.  Muitos  responden- 


tes  com  pontos  ideais  na  mesma  área  geral  representam 
segmentos  de  mercado  potenciais  de  pessoas  com  prefe¬ 
rências  semelhantes,  como  indicado  na  Figura  9-8. 

Determinação  de  pontos  ideais 

Duas  abordagens  geralmente  funcionam  para  determinar 
pontos  ideais:  estimação  explícita  e  implícita.  A  principal 
diferença  entre  as  duas  técnicas  é  o  tipo  de  resposta  ava- 
liativa  requisitada  ao  respondente.  Discutimos  cada  abor¬ 
dagem  nas  seções  a  seguir. 

Estimação  explícita.  A  estimação  explícita  provém  de 
respostas  diretas  de  sujeitos,  tipicamente  pedindo-se  ao 


Dimensão  II 


Dimensão  I 


•  Indica  0  ponto  ideal  de  um  respondente 


FIGURA  9-8  Incorporação  de  múltiplos  pontos  ideais  no  mapa  perceptual. 
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sujeito  que  avalie  um  ideal  hipotético  sobre  os  mesmos 
atributos  nos  quais  os  outros  estímulos  são  avaliados.  Al¬ 
ternativamente,  o  respondente  é  solicitado  a  incluir,  entre 
os  estímulos  usados  para  reunir  dados  de  similaridade,  um 
estímulo  ideal  hipotético  (p.ex.,  marca,  imagem). 

Quando  pedimos  para  respondentes  conceituarem  um 
ideal  de  algo,  geralmente  enfrentamos  problemas.  Fre- 
qüentemente  o  respondente  conceitua  o  ideal  nos  extre¬ 
mos  das  avaliações  explícitas  usadas  ou  como  similares  ao 
produto  preferido  entre  aqueles  com  os  quais  o  respon¬ 
dente  tem  experiência.  Além  disso,  o  respondente  deve 
pensar  em  termos  não  de  similaridades,  mas  de  preferên¬ 
cias,  o  que  costuma  ser  difícil  com  objetos  relativamente 
desconhecidos.  Muitas  vezes,  esses  problemas  perceptuais 
levam  o  pesquisador  a  usar  a  estimação  implícita  de  ponto 
ideal. 

Estimação  implícita.  Diversos  procedimentos  para  po¬ 
sicionar  pontos  ideais  implicitamente  são  descritos  na 
próxima  seção.  A  suposição  básica  inerente  à  maioria  dos 
procedimentos  é  que  as  medidas  obtidas  de  posições  espa¬ 
ciais  de  pontos  ideais  são  maximamente  consistentes  com 
as  preferências  de  respondentes  individuais.  Srinivasan  e 
Schocker  [25]  consideram  que  o  ponto  ideal  para  todos  os 
pares  de  estímulos  é  determinado  de  forma  a  violar  com  o 
menor  prejuízo  possível  a  restrição  de  que  o  mesmo  deve 
ser  mais  próximo  do  mais  preferido  de  cada  par  do  que  do 
menos  preferido. 

Resumo.  Em  resumo,  existem  muitos  modos  de  tratar  a 
estimação  de  pontos  ideais,  e  nenhum  método  em  particu¬ 
lar  demonstrou  ser  o  melhor  em  todos  os  casos.  A  escolha 
depende  das  habilidades  do  pesquisador  e  do  procedi¬ 
mento  MDS  selecionado. 

Posicionamento  implicito  do  ponto  ideal 

O  posicionamento  implícito  do  ponto  ideal  a  partir  de  da¬ 
dos  de  preferência  pode  ser  conseguido  por  meio  de  uma 
análise  interna  ou  externa. 

•  A  análise  interna  de  dados  de  preferência  refere-se  ao  de¬ 
senvolvimento  de  um  mapa  compartilhado  por  pontos  (ou 
vetores)  de  estímulos  e  sujeitos  somente  a  partir  de  dados 
de  preferência. 

•  A  análise  externa  de  preferência  usa  uma  configuração 
pré-especificada  de  objetos  e  então  tenta  colocar  os  pontos 
ideais  dentro  desse  mapa  perceptual. 

Cada  abordagem  tem  vantagens  e  desvantagens,  que 
são  discutidas  nas  próximas  seções. 

Análise  interna.  A  análise  interna  deve  considerar  cer¬ 
tas  suposições  para  obter  o  mapa  perceptual  tanto  de 
estímulos  quanto  de  pontos  ideais.  As  posições  dos  ob¬ 
jetos  são  calculadas  com  base  nos  dados  de  preferência 
revelados  para  cada  indivíduo.  Os  resultados  refletem 
dimensões  perceptuais  que  são  expandidas  e  ponderadas 
para  prever  preferência.  Uma  característica  dos  métodos 


de  estimação  interna  é  que  eles  normalmente  empregam 
uma  representação  vetorial  do  ponto  ideal  (ver  a  próxi¬ 
ma  seção  para  uma  discussão  sobre  representações  ve¬ 
toriais  versus  pontuais),  ao  passo  que  modelos  externos 
podem  estimar  tanto  representações  vetoriais  quanto 
pontuais. 

Como  um  exemplo  dessa  abordagem,  MDPREF  [5] 
ou  MDSCAL  [17],  dois  dos  programas  mais  usados,  per¬ 
mitem  ao  usuário  encontrar  configurações  de  estímulos  e 
pontos  ideais.  Ao  fazer  isso,  o  pesquisador  deve  assumir 
o  seguinte: 

1.  Nenhuma  diferença  entre  respondentes 

2.  Configurações  separadas  para  cada  respondente 

3.  Uma  única  configuração  com  pontos  ideais  individuais. 

Reunindo  os  dados  de  preferência,  o  pesquisador  pode 
representar  os  estímulos  e  respondentes  em  um  só  mapa 
perceptual. 

Análise  externa.  A  análise  externa  de  dados  de  pre¬ 
ferência  se  refere  ao  ajuste  de  pontos  ideais  (baseados 
em  dados  de  preferência)  a  espaço  de  estímulos  desen¬ 
volvido  a  partir  de  dados  de  similaridades  conseguidos 
com  os  mesmos  sujeitos.  Por  exemplo,  poderíamos  es¬ 
calonar  dados  de  similaridade  individualmente,  exami¬ 
nar  os  mapas  individuais  em  busca  de  percepções  em 
comum,  e  então  escalonar  os  dados  de  preferência  para 
qualquer  grupo  identificado  dessa  forma.  Se  essa  meto¬ 
dologia  for  seguida,  o  pesquisador  deverá  reunir  dados 
de  preferência  e  de  similaridade  para  conseguir  uma 
análise  externa. 

O  PREFMAP  [6]  foi  desenvolvido  exclusivamente 
para  executar  a  análise  externa  de  dados  de  preferência. 
Como  a  matriz  de  similaridades  define  os  objetos  no  mapa 
perceptual,  o  pesquisador  agora  pode  definir  descritores 
de  atributos  (assumindo  que  o  espaço  perceptual  é  o  mes¬ 
mo  que  as  dimensões  de  avaliação)  e  pontos  ideais  para 
indivíduos.  O  PREFMAP  fornece  estimativas  para  vários 
tipos  de  pontos  ideais,  cada  um  baseado  em  diferentes 
suposições  quanto  à  natureza  de  preferências  (p.ex.,  re¬ 
presentações  vetoriais  versus  pontuais,  ou  pesos  dimen¬ 
sionais  iguais  versus  diferentes). 

Escolha  entre  análise  interna  e  externa.  Geralmente 
aceita-se  [9,  10,  23]  que  a  análise  externa  é  claramente 
preferível  à  análise  interna.  Essa  conclusão  se  baseia  nas 
dificuldades  computacionais  com  procedimentos  de  aná¬ 
lise  interna  e  na  confusão  de  diferenças  em  preferência 
com  diferenças  em  percepção.  Além  disso,  as  saliências 
de  dimensões  percebidas  podem  se  alterar  quando  mu¬ 
damos  de  espaço  perceptual  (os  estímulos  são  similares 
ou  dissimilares?)  para  espaço  avaliativo  (qual  estímulo  é 
preferido?). 

Ilustramos  o  procedimento  de  estimação  externa  em 
nosso  exemplo  de  mapeamento  perceptual  com  o  MDS 
no  final  deste  capítulo. 
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Representações  vetoriais  versus  pontuais 

A  discussão  sobre  mapeamento  perceptual  de  dados  de 
preferência  enfatizou  um  ponto  ideal  que  retrata  a  relação 
de  ordem  de  preferência  de  um  indivíduo  para  um  con¬ 
junto  de  estímulos.  A  seção  anterior  discutiu  as  questões 
relativas  ao  tipo  dos  dados  e  análise  usada  na  estimação  e 
posicionamento  do  ponto  ideal.  O  restante  da  discussão  se 
concentra  na  maneira  em  que  os  outros  objetos  no  mapa 
perceptual  se  relacionam  com  o  ponto  ideal  para  refletir 
preferência.  As  duas  abordagens  (representação  pontual 
versus  vetorial)  são  discutidas  a  seguir. 

Representação  pontual.  O  método  mais  facilmente  en¬ 
tendido  de  representação  gráfica  do  ponto  ideal  é  o  uso  da 
distância  em  linha  reta  (euclidiana)  de  ordem  de  preferên¬ 
cia  a  partir  do  ponto  ideal  até  todos  os  pontos  que  repre¬ 
sentam  os  objetos.  Estamos  considerando  que  a  direção 
da  distância  a  partir  do  ponto  ideal  não  é  algo  crítico,  mas 
apenas  a  distância  relativa. 


Um  exemplo  é  mostrado  na  Figura  9-9.  Aqui,  o  ponto 
ideal,  como  está  posicionado,  indica  que  o  objeto  prefe¬ 
rido  é  E,  seguido  por  C,  B,  D  e,  finalmente,  A.  A  ordem 
de  preferência  é  diretamente  relacionada  à  distância  do 
ponto  ideal. 


Representação  vetorial.  O  ponto  ideal  também  pode  ser 
exibido  como  um  vetor.  Para  calcular  as  preferências  nes¬ 
sa  abordagem,  retas  perpendiculares  (também  conhecidas 
como  projeções)  são  esboçadas  a  partir  dos  objetos  até  o 
vetor.  A  preferência  aumenta  na  direção  em  que  o  vetor 


está  apontando.  As  preferências  podem  ser  lidas  direta¬ 
mente  da  ordem  das  projeções. 


A  Figura  9-10  ilustra  a  abordagem  vetorial  para  dois  su¬ 
jeitos  com  o  mesmo  conjunto  de  posições  de  estímulos. 
Para  o  sujeito  1,  o  vetor  tem  a  direção  de  menor  prefe¬ 
rência,  no  canto  esquerdo  inferior,  para  maior  preferên¬ 
cia,  no  canto  direito  superior.  Quando  a  projeção  para 
cada  objeto  é  feita,  a  ordem  de  preferência  (de  maior 
para  menor)  é  A,  B,  C,  E  e  D.  No  entanto,  os  mesmos  ob¬ 
jetos  têm  uma  ordem  de  preferência  muito  diferente  para 
o  sujeito  2.  Para  o  segundo  sujeito,  a  ordem  varia  do  mais 
preferido,  E,  para  o  menos  preferido,  C.  Desse  modo,  um 
vetor  em  separado  pode  representar  cada  sujeito. 


A  abordagem  vetorial  não  fornece  um  único  ponto 
ideal,  mas  considera-se  que  o  ponto  ideal  está  a  uma  dis¬ 
tância  infinita  exteriormente  ao  vetor. 

Apesar  de  tanto  as  representações  pontuais  quanto 
vetoriais  poderem  indicar  quais  combinações  de  atributos 
são  preferidas,  essas  observações  geralmente  não  são  con¬ 
firmadas  por  experimentação  complementar.  Por  exemplo, 
Raymond  [22]  cita  um  exemplo  no  qual  a  conclusão  foi  de 
que  as  pessoas  iriam  preferir  bolachas  com  base  em  sua 
umidade  e  na  quantia  de  chocolate.  Quando  os  técnicos 
em  alimentação  aplicaram  esse  resultado  no  laboratório, 
descobriram  que  suas  bolachas  fabricadas  com  tais  espe¬ 
cificidades  experimentais  eram  simplesmente  leite  com 
chocolate.  Não  se  pode  considerar  sempre  que  as  relações 
encontradas  são  independentes  ou  lineares,  ou  que  elas 
continuam  válidas  com  o  passar  do  tempo,  como  já  obser- 


Dimensão  II 


Curva  de 
nível  de 
preferência 


Dimensão  I 


Ordem  de  preferência  (da  maior  para  a  menor):  E>C>B>D>A 
Objeto  Ponto  ideal 


FIGURA  9-9  Representação  pontual  de  um  ponto  ideal. 
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Dimensão  II 


Ordem  de  preferência  (da  maior  para  a  menor):  Sujeito  1:A>B>C>E>D 

Sujeito  2:E>A>D>B>C 

FIGURA  9-10  Representações  vetoriais  de  dois  pontos  ideais:  sujeitos  1  e  2. 


vamos.  Contudo,  o  MDS  é  um  começo  para  a  compreensão 
de  percepções  e  de  escolha  que  irá  se  expandir  considera¬ 
velmente  conforme  as  aplicações  ampliarem  nosso  conhe¬ 
cimento  acerca  de  metodologia  e  percepção  humana. 

Resumo 

Os  dados  de  preferência  são  melhor  examinados  usando- 
se  a  análise  externa  como  um  meio  para  compreender  me¬ 
lhor  as  diferenças  perceptuais  entre  objetos  baseadas  em 
julgamentos  de  similaridades  e  as  escolhas  de  preferência 
feitas  dentro  desse  mapa  perceptual  de  objetos.  Dessa  ma¬ 
neira,  o  pesquisador  pode  distinguir  entre  ambos  os  tipos 
de  avaliações  perceptuais  e,  mais  precisamente,  entender 
as  percepções  de  indivíduos  no  verdadeiro  espírito  do  es¬ 
calonamento  multidimensional. 


ESTÁGIO  5:  INTERPRETAÇÃO 
DOS  RESULTADOS  DO  MDS 

Uma  vez  que  o  mapa  perceptual  é  obtido,  as  duas  aborda¬ 
gens  -  composicional  e  decomposicional  -  novamente  di¬ 
vergem  na  sua  interpretação  dos  resultados.  As  diferenças 
de  interpretação  são  sustentadas  na  quantia  de  informa¬ 
ção  diretamente  fornecida  na  análise  (p.ex.,  os  atributos 
incorporados  na  análise  composicional  versus  sua  ausên¬ 
cia  na  análise  decomposicional)  e  a  generalidade  dos  re¬ 
sultados  para  o  real  processo  de  tomada  de  decisões. 

•  Para  métodos  composicionais,  o  mapa  perceptual  pode  ser 
diretamente  interpretado  com  os  atributos  incorporados  na 
análise.  A  solução,  porém,  deve  ser  validada  contra  outras  me¬ 
didas  de  percepção,  pois  as  posições  são  totalmente  definidas 
pelos  atributos  especificados  pelo  pesquisador.  Por  exemplo. 


os  resultados  de  análise  discriminante  podem  ser  aplicados  a 
um  novo  conjunto  de  objetos  ou  respondentes,  avaliando  a 
habilidade  de  diferenciar  com  essas  novas  observações. 

•  Para  métodos  decomposicionais,  a  questão  mais  importante 
é  a  descrição  das  dimensões  perceptuais  e  sua  correspon¬ 
dência  a  atributos.  Avaliações  de  semelhança  ou  preferên¬ 
cia  são  feitas  sem  preocupação  com  atributos,  evitando-se 
assim  uma  questão  de  erro  de  especificação.  O  risco,  po¬ 
rém,  é  que  as  dimensões  perceptuais  não  sejam  correta¬ 
mente  traduzidas,  no  sentido  de  que  as  dimensões  usadas 
nas  avaliações  não  são  refletidas  pelos  atributos  escolhidos 
para  sua  interpretação.  Técnicas  descritivas  para  rotular  as 
dimensões,  bem  como  integrar  preferências  (para  objetos 
e  atributos)  com  os  julgamentos  de  similaridades,  são  dis¬ 
cutidas  adiante.  Novamente,  de  acordo  com  seus  objetivos, 
os  métodos  decomposicionais  fornecem  uma  visão  inicial  de 
percepções  a  partir  das  quais  perspectivas  mais  formaliza¬ 
das  podem  emergir. 

Como  outros  capítulos  deste  texto  lidam  com  muitas 
das  técnicas  composicionais,  o  restante  deste  capítulo  se 
concentra  em  métodos  decomposicionais,  principalmente 
nas  técnicas  utilizadas  em  escalonamento  multidimensio¬ 
nal.  Uma  exceção  notável  é  a  discussão  de  uma  aborda¬ 
gem  composicional  -  análise  de  correspondência  -  que, 
até  certo  ponto,  preenche  a  lacuna  entre  as  duas  aborda¬ 
gens  em  sua  flexibilidade  e  métodos  de  interpretação. 

Identificação  das  dimensões 

Como  discutido  no  Capítulo  3,  sobre  a  interpretação  de 
fatores  em  análise  fatorial,  a  identificação  de  dimensões 
inerentes  geralmente  é  uma  tarefa  difícil.  As  técnicas  de 
escalonamento  multidimensional  não  têm  procedimen¬ 
tos  internos  para  rotular  as  dimensões.  O  pesquisador, 
após  ter  desenvolvido  os  mapas  com  uma  dimensionali- 
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dade  selecionada,  pode  adotar  diversos  procedimentos, 
sejam  subjetivos  ou  objetivos. 

Procedimentos  subjetivos 

A  interpretação  sempre  deve  incluir  algum  elemento 
de  julgamento  do  pesquisador  ou  do  respondente,  e  em 
muitos  casos  isso  demonstra  ser  adequado  às  questões 
em  mãos.  Um  método  muito  simples,  mas  efetivo,  é  a 
rotulação  (por  inspeção  visual)  das  dimensões  do  mapa 
perceptual  pelo  respondente.  Os  respondentes  podem 
ser  solicitados  a  interpretar  a  dimensionalidade  subjeti¬ 
vamente  por  inspeção  dos  mapas,  ou  um  conjunto  de  es¬ 
pecialistas  pode  avaliar  e  identificar  as  dimensões.  Ape¬ 
sar  de  não  haver  tentativa  de  conectar  quantitativamente 
as  dimensões  com  atributos,  essa  abordagem  pode  ser  a 
melhor  possível  se  as  dimensões  são  consideradas  alta¬ 
mente  intangíveis,  ou  afetivas  ou  emocionais  em  con¬ 
teúdo,  de  forma  que  descritores  adequados  não  possam 
ser  delineados. 

De  maneira  semelhante,  o  pesquisador  pode  descre¬ 
ver  as  dimensões  em  termos  de  características  conhecidas 
(objetivas).  Dessa  maneira,  a  correspondência  é  feita  en¬ 
tre  dimensões  objetivas  e  perceptuais  diretamente,  ape¬ 
sar  de  essas  relações  não  serem  um  resultado  de  opinião 
do  respondente,  mas  do  julgamento  do  pesquisador. 

Procedimentos  objetivos 

Como  complemento  dos  procedimentos  subjetivos,  di¬ 
versos  métodos  mais  formalizados  foram  desenvolvidos. 
O  método  mais  amplamente  usado,  PROFIT  (PROperty 
FITting)  [3],  coleta  avaliações  de  atributos  para  cada  ob¬ 
jeto  e  então  encontra  a  melhor  correspondência  de  cada 
atributo  com  o  espaço  perceptual  obtido.  O  objetivo  é 
identificar  os  atributos  determinantes  nos  julgamentos 
de  similaridade  feitos  por  indivíduos.  Medidas  de  ajuste 
são  dadas  para  cada  atributo,  bem  como  sua  correspon¬ 
dência  com  as  dimensões.  O  pesquisador  pode  então  de¬ 
terminar  quais  atributos  melhor  descrevem  as  posições 
perceptuais  e  são  ilustrativos  das  dimensões.  A  necessi¬ 
dade  de  correspondência  entre  os  atributos  e  as  dimen¬ 
sões  definidas  diminui  com  o  uso  de  resultados  métricos, 
já  que  as  dimensões  podem  ser  rotacionadas  livremente 
sem  quaisquer  mudanças  de  interpretação. 

Escolha  entre  procedimentos 
subjetivos  e  objetivos 

Tanto  para  procedimentos  subjetivos  quanto  objetivos, 
o  pesquisador  deve  lembrar  que,  apesar  de  uma  dimen¬ 
são  poder  representar  um  único  atributo,  ela  geralmen¬ 
te  não  o  faz.  Um  procedimento  mais  comum  é  coletar 
dados  sobre  vários  atributos,  associá-los  subjetiva  ou 
empiricamente  às  dimensões  quando  isso  for  aplicável,  e 
determinar  rótulos  para  cada  dimensão  usando  múltiplos 
atributos,  semelhante  à  análise  fatorial.  Muitos  pesqui¬ 
sadores  sugerem  que  o  uso  de  dados  de  atributos  para 
ajudar  a  nomear  as  dimensões  é  a  melhor  alternativa.  O 


problema,  porém,  é  que  o  pesquisador  pode  não  incluir 
todos  os  atributos  importantes  no  estudo.  Logo,  ele  nun¬ 
ca  pode  estar  totalmente  seguro  de  que  os  rótulos  repre¬ 
sentam  todos  os  atributos  relevantes. 

Os  procedimentos  subjetivos  e  objetivos  ilustram  a 
dificuldade  de  rotular  os  eixos.  Essa  tarefa  é  essencial,  já 
que  os  rótulos  dimensionais  são  exigidos  para  posterior 
interpretação  e  uso  dos  resultados.  O  pesquisador  deve 
selecionar  o  tipo  de  procedimento  que  melhor  se  ajuste 
aos  objetivos  da  pesquisa  e  à  informação  disponível.  As¬ 
sim,  ele  deve  planejar  a  derivação  dos  rótulos  dimensio¬ 
nais,  bem  como  a  estimação  do  mapa  perceptual. 


ESTÁGIO  6:  VALIDAÇÃO  DOS 
RESULTADOS  DO  MDS 

A  validação  em  MDS  é  tão  importante  quanto  em  outra 
técnica  multivariada.  Devido  à  natureza  altamente  infe- 
rencial  do  MDS,  esse  esforço  deve  ser  direcionado  à  ga¬ 
rantia  de  generalidade  dos  resultados  entre  objetos  e  para 
a  população.  Como  se  vê  na  próxima  discussão,  o  MDS 
apresenta  questões  particularmente  problemáticas  na 
validação,  tanto  de  um  ponto  de  vista  substancial  quanto 
metodológico. 

Questões  da  validação 

Qualquer  solução  MDS  deve  lidar  com  duas  questões  es¬ 
pecíficas  que  complicam  os  esforços  para  validação  dos 
resultados: 

•  O  único  resultado  de  MDS  que  pode  ser  usado  para  fins 
comparativos  envolve  as  posições  relativas  dos  objetos. 
Logo,  apesar  de  as  posições  poderem  ser  comparadas,  as  di¬ 
mensões  inerentes  não  têm  qualquer  base  para  comparação. 
Se  as  posições  variam,  o  pesquisador  não  pode  determinar 
se  os  objetos  são  vistos  diferentemente,  se  as  dimensões 
perceptuais  variam,  ou  se  ambos  acontecem. 

•  Métodos  sistemáticos  de  comparação  não  foram  desenvolvi¬ 
dos  e  integrados  nos  programas  estatísticos.  O  pesquisador 
deve  improvisar  com  procedimentos  que  abordem  questões 
gerais  mas  que  não  sejam  específicos  para  resultados  MDS. 

Como  resultado,  pesquisadores  devem  insistir  em  seus 
esforços  de  validação,  para  manter  comparabilidade  en¬ 
tre  soluções  enquanto  se  provê  uma  base  empírica  para 
comparação. 

Abordagens  para  validação 

Qualquer  abordagem  de  validação  tenta  avaliar  genera¬ 
lidade  (p.ex.,  similaridade  em  diferentes  amostras),  en¬ 
quanto  mantém  comparabilidade.  Qs  problemas  discu¬ 
tidos  na  seção  anterior,  porém,  tornam  essas  exigências 
difíceis  para  qualquer  solução  MDS.  Diversas  técnicas  de 
validação  que  atendem  cada  exigência  em  algum  grau  são 
discutidas  a  seguir. 
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Análise  de  amostras  particionadas 

A  abordagem  de  validação  mais  direta  é  uma  comparação 
entre  amostras  particionadas  ou  multi-amostras,  na  qual  a 
amostra  original  é  dividida  ou  uma  nova  amostra  é  cole¬ 
tada.  Em  qualquer  caso,  o  pesquisador  deve  então  encon¬ 
trar  um  meio  para  comparar  os  resultados.  Muitas  vezes, 
a  comparação  entre  resultados  é  feita  visualmente  ou  com 
uma  simples  correlação  de  coordenadas.  Alguns  progra¬ 
mas  de  comparação  estão  disponíveis,  como  FMATCH 
[24],  mas  o  pesquisador  ainda  deve  determinar  quantas 
das  disparidades  decorrem  das  diferenças  em  percepções 
de  objetos,  em  dimensões  ou  ambas. 

Comparação  de  soluções  decomposicionais 
versus  composicionais 

Um  outro  método  é  obter  uma  convergência  de  resulta¬ 
dos  MDS  pela  aplicação  de  técnicas  composicionais  e  de¬ 
composicionais  na  mesma  amostra.  Os  métodos  decom¬ 
posicionais  poderiam  ser  aplicados  em  primeiro  lugar, 
juntamente  com  a  interpretação  das  dimensões  para  iden¬ 
tificar  atributos-chave.  Então,  um  ou  mais  métodos  com¬ 
posicionais,  particularmente  a  análise  de  correspondência, 
poderiam  ser  aplicados  para  confirmar  os  resultados.  O 
pesquisador  deve  perceber  que  isso  não  é  uma  verdadei¬ 
ra  validação  dos  resultados  em  termos  de  generalidade, 
mas  confirma  a  interpretação  da  dimensão.  Deste  ponto 
de  vista,  esforços  de  validação  com  outras  amostras  e  ou¬ 
tros  objetos  poderiam  ser  empreendidos  para  demonstrar 
a  generalidade  para  outras  amostras. 

Resumo 

A  falta  de  métodos  internos  para  comparação  direta  entre 
soluções,  juntamente  com  a  difícil  tarefa  de  se  comparar 
soluções  perceptuais,  resulta  em  vários  métodos  ad  hoc 
para  validação,  sendo  que  nenhum  deles  é  completamen¬ 
te  satisfatório.  Pesquisadores  são  encorajados  a  aplicarem 
ambas  as  técnicas  de  validação  sempre  que  possível,  para 
obterem  o  máximo  de  suporte  para  a  generalidade  de 
qualquer  solução  MDS. 


VISÃO  GERAL  DO  ESCALONAMENTO 
MULTIDIMENSIONAL 

Escalonamento  multidimensional  representa  um  método 
distinto  para  a  análise  multivariada  quando  comparado 
com  outros  métodos  neste  texto.  Enquanto  outras  téc¬ 
nicas  estão  focadas  na  especificação  precisa  de  atributos 
abrangendo  variáveis  independentes  e/ou  dependentes, 
o  escalonamento  multidimensional  segue  um  tratamento 
totalmente  diferente.  Ele  reúne  apenas  medidas  globais 
ou  holísticas  de  similaridade  ou  preferência  e,  em  seguida, 
infere  empiricamente  as  dimensões  (caráter  e  número) 
que  refletem  a  melhor  explicação  das  respostas  de  um  in¬ 
divíduo,  seja  em  separado  ou  coletivamente.  Nesta  técni¬ 


-  REGRAS  PRÁTICAS  9-3  - 

Obtenção  e  validação  de  uma  solução  MDS 

•  Medidas  de  desajuste  (valores  menores  são  melhores) 
representam  um  ajuste  de  solução  MDS 

•  Pesquisadores  podem  identificar  uma  solução  MDS 
degenerada  que  é  geralmente  problemática  procurando 
por: 

•  Um  padrão  circular  de  objetos  que  sugere  que  todos 
eles  são  igualmente  semelhantes,  ou 

•  Uma  solução  multiagregada  na  qual  objetos  são 
reunidos  em  dois  extremos  de  um  único  contínuo 

•  O  número  apropriado  de  dimensões  para  um  mapa 
perceptual  é  baseado  em: 

•  Um  julgamento  subjetivo  se  a  solução  com  uma  dada 
dimensionalidade  é  razoável 

•  Uso  de  um  gráfico  scree  para  identificar  onde 
acontece  uma  substancial  melhora  de  ajuste 

•  Uso  de  como  um  índice  de  ajuste;  medidas  de  0,6 
ou  mais  são  consideradas  aceitáveis 

•  Análise  externa,  como  a  executada  por  PREFMAP,  é 
considerada  preferível  na  geração  de  pontos  ideais,  em 
comparação  com  análise  interna 

•  O  método  de  validação  mais  direto  é  uma  abordagem 
via  amostras  particionadas 

•  Múltiplas  soluções  são  geradas  particionando  a 
amostra  original  ou  coletando  novos  dados 

•  Validade  é  indicada  quando  as  múltiplas  soluções 
conferem 


ca,  a  variável  estatística  usada  em  muitos  outros  métodos 
se  transforma  nas  dimensões  perceptuais  inferidas  a  partir 
da  análise.  Como  tal,  o  pesquisador  não  tem  que  se  pre¬ 
ocupar  com  questões  como  erro  de  especificação,  multi- 
colinearidade  ou  características  estatísticas  das  variáveis. 
O  desafio  para  o  pesquisador,  porém,  é  a  interpretação 
da  variável  estatística;  sem  uma  interpretação  válida,  os 
objetivos  principais  de  MDS  ficam  comprometidos. 

A  aplicação  de  MDS  é  adequada  quando  o  objetivo  é 
mais  orientado  para  a  compreensão  das  preferências  ou 
percepções  gerais,  em  vez  de  perspectivas  detalhadas  que 
envolvam  atributos  individuais.  No  entanto,  uma  técnica 
combina  a  especificidade  da  análise  de  atributos  dentro  de 
soluções  do  tipo  MDS.  Tal  método,  análise  de  correspon¬ 
dência,  é  discutido  na  seção  a  seguir,  onde  as  semelhanças 
e  diferenças  em  relação  a  técnicas  tradicionais  de  MDS 
são  destacadas. 


ANÁLISE  DE  CORRESPONDÊNCIA 

Até  este  ponto,  discutimos  as  abordagens  decomposicio¬ 
nais  tradicionais  para  MDS;  mas  e  quanto  às  técnicas  com¬ 
posicionais?  No  passado,  as  abordagens  composicionais 
basearam-se  em  técnicas  multivariadas  tradicionais,  como 
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as  análises  discriminante  e  fatorial.  Mas  desenvolvimen¬ 
tos  recentes  combinam  aspectos  de  ambos  os  métodos  e 
o  MDS  para  formar  novas  e  poderosas  ferramentas  para 
mapeamento  perceptual. 

Características  diferenciadas 
Análise  de  correspondência  (CA)  é  uma  técnica  de  inter¬ 
dependência  que  tem  se  tornado  cada  vez  mais  popular 
para  redução  dimensional  e  mapeamento  perceptual  [1,  2, 
11, 13, 19].  Também  é  conhecida  como  escalonamento  ou 
escore  ótimo,  média  recíproca  ou  análise  de  homogeneida¬ 
de.  Quando  comparada  com  as  técnicas  MDS  descritas  na 
parte  anterior  deste  capítulo,  a  análise  de  correspondência 
apresenta  três  características  que  a  distinguem: 

1.  É  uma  técnica  composicional,  e  não  decomposicional,  por¬ 
que  o  mapa  perceptual  é  baseado  na  associação  entre  obje¬ 
tos  e  um  conjunto  de  características  descritivas  ou  atributos 
especificados  pelo  pesquisador. 

2.  Sua  aplicação  mais  direta  é  na  retratação  da  correspondência 
de  categorias  de  variáveis,  particularmente  aquelas  medidas 
em  escalas  nominais.  Tal  correspondência  é,  desse  modo,  a 
base  para  o  desenvolvimento  de  mapas  perceptuais. 

3.  Os  únicos  benefícios  de  CA  residem  em  sua  habilidade  para 
representar  linhas  e  colunas,  por  exemplo,  marcas  e  atribu¬ 
tos,  em  um  espaço  conjunto. 

Diferenças  de  outras  técnicas  multivariadas 

Entre  as  técnicas  composicionais,  a  análise  fatorial  é  a 
mais  semelhante  pela  definição  de  dimensões  compostas 
(fatores)  das  variáveis  (p.ex.,  atributos)  e  pela  representa¬ 
ção  gráfica  de  objetos  (p.  ex.,  produtos)  em  seus  escores 
sobre  cada  dimensão.  Na  análise  discriminante,  produtos 
podem  ser  distinguidos  por  seus  perfis  em  um  conjunto  de 
variáveis  e  graficamente  representados  em  um  espaço  di¬ 
mensional.  A  análise  de  correspondência  se  estende  além 
dessas  duas  técnicas  composicionais: 

•  CA  pode  ser  usada  com  dados  nominais  (p.ex.,  contagens 
de  frequência  de  preferência  para  objetos  em  um  conjunto 
de  atributos)  em  vez  de  avaliações  métricas  de  cada  obje¬ 
to  sobre  cada  objeto*.  Tal  capacidade  permite  que  CA  seja 
usada  em  muitas  situações  nas  quais  as  técnicas  multivaria¬ 
das  mais  tradicionais  são  inadequadas. 


*  N.  de  R.  T.:  A  frase  correta  seria  “de  cada  objeto  sobre  cada  atri¬ 
buto”. 


•  CA  cria  mapas  perceptuais  em  um  único  passo,  onde  va¬ 
riáveis  e  objetos  são  simultaneamente  representados  no 
mapa  perceptual  com  base  diretamente  na  associação  de 
variáveis  e  objetos.  As  relações  entre  objetos  e  variáveis 
são  a  meta  explícita  da  CA. 

Primeiro  examinamos  um  exemplo  simples  da  CA  para 
ter  uma  noção  de  seus  princípios  básicos.  Em  seguida,  dis¬ 
cutimos  cada  um  dos  seis  estágios  do  processo  de  tomada 
de  decisões  introduzido  no  Capítulo  1.  A  ênfase  está  nos 
elementos  únicos  da  CA  quando  comparada  com  os  méto¬ 
dos  decomposicionais  de  MDS  discutidos  anteriormente. 

Um  exemplo  simples  de  CA 

Examinemos  uma  situação  simples  como  uma  introdução 
à  CA.  Em  sua  forma  mais  básica,  a  CA  examina  as  rela¬ 
ções  entre  categorias  de  dados  nominais  em  uma  tabela 
de  contingência,  a  tabulação  cruzada  de  duas  variáveis 
categóricas  (não-métricas).  Talvez  a  forma  mais  comum 
de  tabela  de  contingência  seja  a  tabulação  cruzada  de  ob¬ 
jetos  e  atributos  (p.  ex.,  os  atributos  mais  distintos  para 
cada  produto  ou  vendas  por  categoria  demográfica).  A 
CA  pode  ser  aplicada  a  qualquer  tabela  de  contingência 
e  retratar  um  mapa  perceptual  relacionando  as  catego¬ 
rias  de  cada  variável  não-métrica  em  um  único  mapa. 


Usemos  um  exemplo  simples  de  vendas  de  produtos 
ao  longo  de  uma  única  variável  demográfica  (idade). 
Os  dados  em  tabulação  cruzada  (ver  Tabela  9-2)  retra¬ 
tam  as  vendas  para  os  produtos  A,  B  e  C  distribuídas 
em  três  categorias  de  idade  (jovens  adultos,  que  estão 
entre  18  e  35  anos;  meia-idade,  entre  36  e  55  anos;  e 
idosos,  a  partir  de  56). 


Utilização  de  dados  de  tabulação  cruzada 

O  que  podemos  aprender  a  partir  dos  dados  de  tabulação 
cruzada?  Primeiro,  podemos  olhar  os  totais  das  colunas 
e  linhas  para  identificar  a  ordenação  das  categorias  (de 
maiores  para  menores).  Mas  mais  importante,  podemos 
ver  os  tamanhos  relativos  de  cada  célula  da  tabela  de 
contingência  refletindo  a  quantia  de  cada  variável  para 
cada  objeto.  A  comparação  de  células  pode  identificar 
padrões  que  refletem  associações  entre  certos  objetos  e 
atributos. 


TABELA  9-2  Dados  de  tabulação  cruzada  detalhando  vendas  de  produtos  por  categoria  etária 


Categoria  etária 

Vendas 

A 

B 

C 

Total 

Jovens  adultos  (18-35  anos) 

20 

20 

20 

60 

Meia-idade  (36-55  anos) 

40 

10 

40 

90 

Indivíduos  idosos  (56  anos  ou  mais) 

20 

10 

40 

70 

Total 

80 

40 

100 

220 
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Vendo  a  Tabela  9-2,  percebemos  que  as  vendas  variam 
bastante  com  os  produtos  (o  produto  C  tem  as  mais  al¬ 
tas  vendas  totais,  e  o  produto  B,  as  mais  baixas)  e  com 
os  grupos  etários  (meia-idade  compra  mais  unidades,  e 
jovens  adultos  compram  menos).  Mas  queremos  identifi¬ 
car  algum  padrão  para  as  vendas,  de  modo  que  possamos 
estabelecer  que  os  jovens  compram  mais  do  produto  X 
ou  os  idosos  compram  mais  do  produto  Z. 


Para  identificarmos  padrões  distintos,  precisamos  de 
mais  dois  elementos  que  ajudem  a  refletir  a  distinção  de 
cada  célula  (freqüência)  relativa  a  outras  células. 

Padronização  de  contagens  de  freqüência.  O  primeiro 
é  uma  medida  padronizada  das  contagens  de  células  que 
considera  simultaneamente  as  diferenças  em  totais  de  li¬ 
nhas  e  colunas.  Podemos  diretamente  comparar  as  células 
quando  todos  os  totais  de  linhas  e  colunas  são  iguais,  o 
que  raramente  é  o  caso.  Em  vez  disso,  os  totais  de  linhas  e 
colunas  são  geralmente  desiguais.  Neste  caso,  precisamos 
de  uma  medida  que  compare  o  valor  de  cada  célula  com 
um  valor  esperado  que  reflita  os  totais  específicos  de  linha 
e  coluna  daquela  célula. 


Em  nosso  exemplo  de  vendas,  esperamos  que  cada  grupo 
etário  do  produto  C  tenha  os  maiores  totais  se  todas  as 
demais  coisas  forem  iguais,  pois  o  produto  C  tem  as  maio¬ 
res  vendas  gerais.  Analogamente,  como  os  dados  incluem 
mais  adultos  de  meia-idade  do  que  de  qualquer  outra 
categoria,  esperamos  assim  que  a  célula  para  vendas  do 
produto  C  entre  adultos  de  meia  idade  seja  a  maior.  Ain¬ 
da  que  o  valor  de  40  seja  o  maior,  diversas  outras  células 
também  apresentam  o  mesmo  valor.  Tais  valores  signifi¬ 
cam  que  aquela  célula  é  tão  alta  quanto  o  esperado,  e  se 
não,  qual  entre  as  demais  células  é  realmente  a  maior? 
Assim,  precisamos  de  uma  medida  que  mostre  o  quão  aci¬ 
ma  ou  abaixo  uma  célula  específica  está  quando  compara¬ 
da  com  algumas  medidas  esperadas  de  vendas. 


Representação  de  cada  célula.  Mesmo  com  uma  medida 
padronizada,  ainda  precisamos  de  um  método  para  re¬ 
tratar  cada  célula  em  um  mapa  perceptual.  Aqui,  células 
com  valores  padronizados  maiores  que  o  esperado  devem 
fazer  com  que  combinações  de  objetos/variáveis  fiquem 
localizadas  mais  próximas,  ao  passo  que  valores  padroni¬ 
zados  muito  menores  que  o  esperado  podem  fazer  com 
que  tais  combinações  fiquem  mais  separadas.  A  tarefa  é 
desenvolver  um  mapa  perceptual  que  melhor  retrate  to¬ 
das  as  associações  representadas  pelas  células  da  tabela 
de  contingência. 


Em  nosso  exemplo  de  produto,  examinemos  as  três  cé¬ 
lulas  com  valores  de  40.  Como  descrevemos,  a  célula  de 


Meia-idade/Produto  C  deve  ter  um  valor  alto  por  ser 
uma  combinação  das  maiores  categorias  de  linha  e  co¬ 
luna.  Mas  e  quanto  às  vendas  de  40  unidades  da  catego¬ 
ria  do  Produto  A  na  categoria  Meia-idade?  O  Produto 
A  tem  vendas  gerais  menores  que  o  Produto  C,  e  assim 
esse  resultado  provavelmente  mostra  uma  associação  de 
algum  modo  maior  entre  essas  duas  categorias.  Então 
temos  as  vendas  de  40  unidades  entre  indivíduos  idosos 
e  o  Produto  C.  Aqui,  podemos  dizer  que  esta  célula  tem 
associação  maior  do  que  nossa  primeira  célula  (Produto 
C/Meia-idade),  pois  ambas  são  para  o  Produto  C.  Como 
esses  resultados  se  comparam  com  vendas  do  Produto 
A  no  grupo  de  Meia-idade?  Não  importa  quais  sejam 
os  valores  padronizados,  queremos  ter  as  categorias  de 
Indivíduos  Idosos/Produto  C  e  Meia-idade/Produto  A 
representadas  mais  proximamente  entre  si  em  um  mapa 
perceptual  do  que  Meia-idade/Produto  C. 

Em  uma  representação  gráfica,  grupos  etários  esta¬ 
riam  localizados  mais  próximos  a  produtos  com  os  quais 
são  altamente  associados  e  mais  afastados  daqueles  com 
menores  associações.  Analogamente,  queremos  ser  ca¬ 
pazes  de  ver  qualquer  produto  e  perceber  suas  associa¬ 
ções  com  vários  grupos  etários. 


Para  este  fim,  discutimos  nas  próximas  seções  como 
CA  calcula  uma  medida  padronizada  de  associação  com 
base  nas  contagens  de  células  da  contingência,  e  então  o 
processo  pelo  qual  essas  associações  são  convertidas  em 
um  mapa  perceptual. 

Cálculo  de  uma  medida  de 
associação  ou  similaridade 

A  análise  de  correspondência  usa  um  dos  conceitos  es¬ 
tatísticos  mais  básicos,  o  qui-quadrado,  para  padroni¬ 
zar  os  valores  de  freqüência  da  tabela  de  contingência 
e  formar  a  base  para  associação  ou  similaridade.  Qui- 
quadrado  é  uma  medida  padronizada  de  freqüências 
reais  de  células  comparadas  com  freqüências  esperadas 
de  células.  Em  nossos  dados  tabulados,  cada  célula  con¬ 
tém  os  valores  para  uma  combinação  específica  de  linha/ 
coluna.  O  procedimento  qui-quadrado  prossegue  então 
em  quatro  passos  para  calcular  um  valor  qui-quadrado 
para  cada  célula  e  então  transformá-lo  em  uma  medida 
de  associação: 

Passo  1:  Cálculo  das  vendas  esperadas.  O  primeiro  pas¬ 
so  é  calcular  o  valor  esperado  para  uma  célula  como  se 
não  existisse  qualquer  associação.  As  vendas  esperadas 
são  definidas  como  a  probabilidade  conjunta  da  combi¬ 
nação  da  coluna  com  a  linha.  Isso  é  calculado  como  a  pro¬ 
babilidade  marginal  para  a  coluna  (total  da  coluna  /  total 
geral)  vezes  a  probabilidade  marginal  para  a  linha  (total 
da  linha  /  total  geral).  Esse  valor  é  então  multiplicado  pelo 
total  geral.  Para  qualquer  célula,  o  valor  esperado  pode 
ser  simplificado  pela  seguinte  equação: 
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Contagem  esperada 
da  célula 


Total  da  coluna  da  célula 
X  Total  da  linha  da  célula 

Total  geral 


Este  cálculo  representa  a  freqüência  esperada  da  célu¬ 
la  dadas  as  proporções  para  os  totais  de  linha  e  coluna. 

As  freqüências  esperadas  fornecem  uma  base  para 
comparação  com  as  freqüências  reais  e  viabilizam  o  cál¬ 
culo  de  uma  medida  padronizada  de  associação  usada  na 
construção  do  mapa  perceptual. 


Em  nosso  exemplo  simples,  as  vendas  esperadas  para  os 
Jovens  adultos  que  compram  o  Produto  A  são  de  21,82 
unidades,  como  mostrado  no  seguinte  cálculo: 


vendas  .sperate  82 

Esse  cálculo  é  feito  para  cada  célula,  com  os  resulta¬ 
dos  exibidos  na  Tabela  9-3. 


Passo  2:  Diferença  entre  freqüências  de  célnlas  esperadas 
e  reais.  O  próximo  passo  é  calcular  a  diferença  entre  as 
freqüências  esperadas  e  as  reais  da  seguinte  maneira: 

Diferença  =  Freqüência  esperada  -  Freqüência  real. 

A  magnitude  de  diferença  denota  a  força  de  asso¬ 
ciação  e  o  sinal  (positivo  para  associação  menor  que  o 
esperado,  e  negativo  para  uma  associação  maior  que  o 


TABELA  9-3  Cálculo  de  valores  qui-quadrado  de  similaridade  para  dados  de  tabulação  cruzada 

Vendas  de  produto 

Categoria  etária  ABC  Totai 


Jovens 


Vendas 

20 

20 

20 

60 

Percentual  da  coluna 

25% 

50% 

20% 

27% 

Percentual  da  linha 

33% 

33% 

33% 

100% 

Vendas  esperadas® 

21,82 

10,91 

27,27 

60 

Diferença*’ 

1,82 

-9,09 

7,27 

- 

Valor  qui-quadrado® 

0,15 

7,58 

1,94 

9,67 

Meia-idade 

Vendas 

40 

10 

40 

90 

Percentual  da  coluna 

50% 

25% 

40% 

41% 

Percentual  da  linha 

44% 

11% 

44% 

100% 

Vendas  esperadas 

32,73 

16,36 

40,91 

90 

Diferença 

-7,27 

6,36 

0,91 

- 

Valor  qui-quadrado 

1,62 

2,47 

0,02 

4,11 

Idosos 

Vendas 

20 

10 

40 

70 

Percentual  da  coluna 

25% 

25% 

40% 

32% 

Percentual  da  linha 

29% 

14% 

57% 

100% 

Vendas  esperadas 

25,45 

12,73 

31,82 

70 

Diferença 

5,45 

2,73 

-8,18 

- 

Valor  qui-quadrado 

1,17 

0,58 

2,10 

3,85 

Total 

Vendas 

80 

40 

100 

220 

Percentual  da  coluna 

100% 

100% 

100% 

100% 

Percentual  da  linha 

36% 

18% 

46% 

100% 

Vendas  esperadas 

80 

40 

100 

220 

Diferença 

- 

- 

- 

- 

Valor  qui-quadrado 

2,94 

10,63 

4,06 

17,63 

“Vendas  esperadas  =  (Total  da  linha  x  Total  da  coluna)/Total  geral 

Exemplo:  Célulaj„„„3,,„|,„3  =  (60  X  80)  /  220  =  21 ,82 

“Diterença  =  Vendas  esperadas  -  Vendas  reais 

Exemplo:  Célulaj„„„3,,„|,,„  =  21,82  -  20,00  =  1,82 

‘Valor  qui-quadrado  = - Diferença - 

Vendas  esperadas 


Jovens  adultos.  Produto  A 


Exemplo:  Célula 


=  1,82^21,82  =  0,15 
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esperado)  representado  neste  valor.  É  importante  obser¬ 
var  que  o  sinal,  na  verdade,  é  invertido  quanto  ao  tipo  de 
associação  -  um  sinal  negativo  significa  uma  associação 
positiva  (freqüências  reais  excederam  as  esperadas)  e 
vice-versa. 


Novamente,  em  nosso  exemplo  da  célula  para  Jovens 
que  compram  o  Produto  A,  a  diferença  é  1,82  (21,82  - 
20,00).  A  diferença  positiva  indica  que  as  vendas  reais 
são  menores  do  que  o  esperado  para  esta  combinação  de 
grupo  etário  com  produto,  o  que  significa  menos  vendas 
do  que  o  esperado  (uma  associação  negativa).  Células 
nas  quais  acontecem  diferenças  negativas  indicam  asso¬ 
ciações  positivas  (a  célula  realmente  comprou  mais  do 
que  o  esperado).  As  diferenças  para  cada  célula  também 
são  exibidas  na  Tabela  9-3. 


Passo  3:  Cálculo  do  valor  quí-quadrado.  O  próximo 
passo  é  padronizar  as  diferenças  ao  longo  das  células  de 
forma  que  comparações  possam  ser  facilmente  realizadas. 
A  padronização  é  exigida  porque  seria  muito  mais  fácil 
as  diferenças  ocorrerem  se  a  freqüência  da  célula  fosse 
muito  alta  comparada  com  uma  célula  com  apenas  poucas 
vendas.  Portanto,  padronizamos  as  diferenças  para  for¬ 
mar  um  valor  quí-quadrado  dividindo  cada  diferença  ao 
quadrado  pelo  valor  de  vendas  esperado.  Assim,  o  valor 
qui-quadrado  para  uma  célula  é  calculado  como: 

Valor  qui-quadrado  _  Diferença^ 

(x^)  de  uma  célula  Frequência  esperada  da  célula 


Para  a  célula  de  nosso  exemplo,  o  valor  qui-quadrado 
seria: 

/  (1,82)^  n.r 

Valor  qui-quadrado (x  adui.os,p™du.oA=  = 

Os  valores  calculados  para  as  outras  células  também 
são  mostrados  na  Tabela  9-3. 


Passo  4:  Criação  de  uma  medida  de  associação.  O  passo 
final  é  converter  o  valor  do  qui-quadrado  para  uma  medida 
de  similaridade.  O  qui-quadrado  denota  o  grau  ou  quantia 
de  similaridade  ou  associação,  mas  o  processo  de  calcular 
o  qui-quadrado  (elevando  a  diferença  ao  quadrado)  remo¬ 
ve  a  direção  da  similaridade.  Para  restaurar  tal  direção, 
usamos  o  sinal  da  diferença  original.  Para  tornar  a  medida 
de  similaridade  mais  intuitiva  (ou  seja,  valores  positivos 
são  associação  maior  e  valores  negativos  são  associação 
menor)  também  invertemos  o  sinal  da  diferença  original. 
O  resultado  é  uma  medida  que  atua  simplesmente  como  as 
medidas  de  similaridade  usadas  em  exemplos  anteriores. 
Valores  negativos  indicam  menor  associação  (similarida¬ 
de)  e  valores  positivos  apontam  para  maior  associação. 


Em  nosso  exemplo,  o  valor  qui-quadrado  para  Jovens 
adultos  que  compram  o  Produto  A  de  0,15  seria  declarado 
como  um  valor  de  similaridade  de  -0,15,  pois  a  diferença 
(1,82)  foi  positiva.  Este  sinal  negativo  é  necessário  porque 
o  cálculo  de  qui-quadrado  eleva  as  diferenças  ao  quadrado, 
o  que  elimina  sinais  negativos.  Os  valores  qui-quadrado 
para  cada  célula  são  também  exibidos  na  Tabela  9-3. 

As  células  com  grandes  valores  positivos  de  simila¬ 
ridade  (indicativos  de  uma  associação  positiva)  são  Jo¬ 
vens  adultos/Produto  B  (17,58)*,  Meia-idade/Produto  A 
(11,62)*  e  Idosos/Produto  C  (12,10)***.  Cada  um  desses 
pares  de  categorias  deve  estar  próximo  um  do  outro  em  um 
mapa  perceptual.  Células  com  grandes  valores  negativos 
de  similaridade  (o  que  significa  que  as  vendas  esperadas 
superaram  as  vendas  reais,  ou  seja,  uma  associação  nega¬ 
tiva)  foram  Jovens  adultos/Produto  C  (-1,94),  Meia-idade/ 
Produto  B  (-2,47)  e  Idosos/Produto  A  (-1,17).  Se  possível, 
essas  categorias  devem  estar  bem  distantes  no  mapa. 


Criação  do  mapa  perceptual 

Os  valores  de  similaridades  (qui-quadrados  com  sinal) 
fornecem  uma  medida  padronizada  de  associação,  mui¬ 
to  parecida  com  os  julgamentos  de  similaridades  usados 
anteriormente  nos  métodos  MDS.  Com  essas  medidas  de 
associação/similaridade,  a  CA  cria  um  mapa  perceptual 
usando  a  medida  padronizada  para  estimar  dimensões  or¬ 
togonais  sobre  as  quais  as  categorias  podem  ser  colocadas 
para  explicar  melhor  a  intensidade  de  associação  repre¬ 
sentada  pelas  distâncias  qui-quadrado. 

Como  fizemos  no  exemplo  do  MDS,  consideramos  pri¬ 
meiro  uma  solução  unidimensional,  e  então  expandimos 
para  duas  dimensões  e  continuamos  até  que  alcancemos  o 
número  máximo  de  dimensões.  O  máximo  é  um  a  menos 
do  que  o  menor  dentre  os  números  de  linhas  ou  colunas. 


Em  nosso  exemplo,  podemos  ter  apenas  duas  dimensões 
(menor  dos  números  de  linhas  ou  colunas  menos  um,  ou 
3  - 1  =  2).  O  mapa  perceptual  bidimensional  é  mostrado  na 
Figura  9-11.  Correspondendo  ao  nosso  exame  das  medidas 
de  similaridade,  o  grupo  etário  de  Jovens  Adultos  está  mais 
próximo  do  Produto  B,  a  Meia-idade  está  mais  próxima  do 
Produto  A,  e  os  Idosos  estão  mais  próximos  do  Produto 
C.  De  modo  semelhante,  as  associações  negativas  também 
estão  representadas  nas  posições  de  produtos  e  grupos  etá¬ 
rios.  O  pesquisador  pode  examinar  o  mapa  perceptual  para 
entender  as  preferências  por  produtos  entre  grupos  etários 
com  base  em  seus  padrões  de  vendas.  Entretanto,  assim 
como  em  MDS,  não  sabemos  por  que  os  padrões  de  vendas 
existem,  porém  apenas  como  identificá-los. 


*  N.  de  R.  T.:  O  número  correto  é  7,58. 

**  N.  de  R.  T.:  O  número  correto  é  1,62. 

***  N.  de  R.  T.:  O  número  correto  é  2,10. 
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FIGURA  9-1 1  Mapa  perceptual  da  análise  de  correspondência. 


Resumo 

Análise  de  correspondência  é  nm  método  híbrido  de  es¬ 
calonamento  multidimensional  no  sentido  de  que  utiliza 
dados  não-métricos  cruzados  para  criar  mapas  percep- 
tuais  que  podem  posicionar  as  categorias  de  todas  as 
variáveis  em  um  único  mapa.  Fazendo  isso,  ela  estende 
a  análise  MDS  para  todo  um  domínio  de  questões  de 
pesquisa  previamente  não  tratáveis  pelos  métodos  MDS 
tradicionais. 

Uma  estrutura  de  decisão  para 
auálise  de  correspoudêucia 

A  análise  de  correspondência  e  as  questões  associadas 
com  uma  análise  bem  sucedida  podem  ser  vistas  po  meio 
do  processo  de  construção  de  modelo  introduzido  no  Ca¬ 
pítulo  1.  Nas  seções  a  seguir,  examinamos  as  questões  úni¬ 
cas  associadas  com  análise  de  correspondência  em  com¬ 
paração  com  métodos  MDS  ao  longo  de  seis  estágios  do 
processo  decisório. 

Estágio  1:  Objetivos  da  CA 

Os  pesquisadores  são  constantemente  confrontados  com  a 
necessidade  de  quantificar  os  dados  qualitativos  encontra¬ 
dos  em  variáveis  nominais.  A  CA  difere  de  outras  técnicas 
MDS  em  sua  habilidade  de  acomodar  tanto  dados  não- 
métricos  quanto  relações  não-lineares.  Ela  faz  redução 
dimensional  semelhante  a  escalonamento  multidimen¬ 


sional  e  um  tipo  de  mapeamento  perceptual  no  qual  as 
categorias  são  representadas  no  espaço  multidimensional. 
A  proximidade  indica  o  nível  de  associação  entre  as  cate¬ 
gorias  linha  ou  coluna.  A  CA  pode  satisfazer  qualquer  um 
dos  dois  objetivos  básicos: 

1.  Associação  entre  somente  categorias  de  linha  ou  de  coluna. 
A  CA  pode  ser  usada  para  examinar  a  associação  entre  as 
categorias  de  apenas  uma  linha  ou  coluna.  Um  uso  comum 
é  o  exame  das  categorias  de  uma  escala,  como  a  escala  Li- 
kert  (cinco  categorias  que  variam  de  “concordo  plenamen¬ 
te”  a  “discordo  plenamente”)  ou  outras  escalas  qualitativas 
(p.ex.,  excelente,  bom,  regular,  ruim).  As  categorias  podem 
ser  comparadas  para  ver  se  duas  podem  ser  combinadas 
(isto  é,  elas  estão  muito  próximas  no  mapa)  ou  se  fornecem 
discriminação  (ou  seja,  estão  localizadas  separadamente  no 
espaço  perceptual). 

2.  Associação  entre  categorias  de  linha  e  coluna.  Nesta  aplica¬ 
ção,  o  interesse  repousa  na  representação  da  associação  en¬ 
tre  categorias  das  linhas  e  colunas,  como  nosso  exemplo  de 
vendas  de  produto  por  faixa  etária.  Esse  uso  é  mais  seme¬ 
lhante  ao  exemplo  anterior  de  MDS  e  tem  impelido  a  CA  a 
um  uso  mais  amplo  em  diversas  áreas  de  pesquisa. 

O  pesquisador  deve  determinar  os  objetivos  especí¬ 
ficos  da  análise,  porque  certas  decisões  são  baseadas  em 
qual  tipo  de  objetivo  é  escolhido.  A  CA  fornece  uma 
representação  multivariada  de  interdependência  para 
dados  não-métricos  que  não  é  possível  com  outros  méto¬ 
dos.  Com  uma  técnica  composicional,  o  pesquisador  deve 
garantir  que  todas  as  variáveis  relevantes  adequadas  à 
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questão  de  pesquisa  tenham  sido  incluídas.  Isso  está  em 
contraste  com  os  procedimentos  decomposicionais  MDS 
descritos  anteriormente,  os  quais  exigem  apenas  a  medida 
geral  de  similaridade. 

Estágio  2:  Projeto  de  pesquisa  de  CA 

A  análise  de  correspondência  exige  apenas  uma  matriz 
retangular*  de  dados  (tabulação  cruzada)  de  entradas 
não-negativas.  O  tipo  mais  comum  de  matriz  de  entrada 
é  uma  tabela  de  contingência  com  categorias  específicas 
definindo  as  linhas  e  colunas.  Ao  se  criar  a  tabela,  sur¬ 
gem  diversas  questões,  relativas  à  natureza  das  variáveis 
e  categorias  compreendendo  linhas  e  colunas: 

1.  As  linhas  e  colunas  não  têm  significados  pré-definidos  (ou 
seja,  os  atributos  não  têm  que  ser  sempre  linhas  e  assim  por 
diante),  mas,  em  vez  disso,  representam  as  respostas  a  uma 
ou  mais  variáveis  categóricas.  As  categorias  nas  linhas  e  co¬ 
lunas,  porém,  devem  ter  um  significado  específico  para  fins 
de  interpretação. 

2.  As  categorias  para  uma  linha  ou  coluna  não  precisam  ser 
uma  só  variável,  mas  podem  representar  qualquer  conjun¬ 
to  de  relações.  Um  primeiro  exemplo  é  o  método  “escolha 
qualquer  um”  [14, 15],  no  qual  é  dado  aos  respondentes  um 
conjunto  de  objetos  e  características.  Os  respondentes  en¬ 
tão  indicam  quais  objetos,  se  houver  algum,  são  descritos 
pelas  características.  O  respondente  pode  escolher  qualquer 
número  de  objetos  para  cada  característica,  e  a  tabela  de 
tabulação  cruzada  é  o  número  total  de  vezes  em  que  cada 
objeto  foi  descrito  por  cada  característica. 

3.  A  tabulação  cruzada  pode  ocorrer  para  mais  de  duas  variá¬ 
veis  em  uma  forma  matricial  multivariada.  Em  tais  casos,  a 
análise  de  correspondência  múltipla  é  empregada.  Em  um 
procedimento  muito  semelhante  à  análise  bivariada,  as  va¬ 
riáveis  adicionais  são  ajustadas  de  forma  que  todas  as  cate¬ 
gorias  são  colocadas  no  mesmo  espaço  multidimensional. 

A  natureza  generalizada  dos  tipos  de  relações  que  po¬ 
dem  ser  retratadas  na  tabela  de  contingência  torna  a  CA 
uma  técnica  amplamente  aplicável.  Seu  uso  crescente  nos 
últimos  anos  é  um  resultado  direto  do  contínuo  desenvol¬ 
vimento  de  abordagens  que  usam  este  formato  para  anali¬ 
sar  novos  tipos  de  relações. 

Estágio  3:  Suposições  em  CA 

A  análise  de  correspondência  compartilha  com  as  técni¬ 
cas  mais  tradicionais  de  MDS  uma  relativa  liberdade  de 
pressupostos.  O  uso  de  dados  estritamente  não-métricos 
em  sua  forma  mais  simples  (dados  tabulados  cruzados) 
representa  as  relações  lineares  e  não-lineares  igualmente 
bem.  A  falta  de  suposições,  porém,  não  deve  fazer  com 
que  o  pesquisador  negligencie  os  esforços  para  garantir 
a  comparabilidade  de  objetos  e,  como  essa  é  uma  técnica 
composicional,  a  completude  dos  atributos  usados. 


*  N.  de  R.  T.:  Seria  mais  adequada  a  expressão  “de  dupla  entrada”, 
tendo  em  vista  que  tal  matriz  pode  também  ser  quadrada,  quando 
linhas  e  colunas  apresentam  o  mesmo  número  de  categorias. 


Estágio  4:  Determinação  dos  resultados 
da  CA  e  avaliação  do  ajuste  geral 

Com  uma  tabela  de  dados  cruzados,  as  freqüências  para 
qualquer  combinação  de  categorias  de  linhas-colunas  são 
relacionadas  com  outras  combinações  com  base  nas  fre¬ 
qüências  marginais.  Como  descrito  em  nosso  exemplo  an¬ 
terior,  a  análise  de  correspondência  usa  essa  relação  bási¬ 
ca  em  três  passos  para  criar  um  mapa  perceptual: 

1.  Calcula  uma  expectativa  condicional  (a  freqüência  espe¬ 
rada  de  célula)  que  representa  a  similaridade  ou  associação 
entre  categorias  de  linha  e  coluna. 

2.  Uma  vez  obtidas,  computam-se  as  diferenças  entre  as  fre¬ 
qüências  reais  e  esperadas  e  converte-se  as  mesmas  a  uma 
medida  padronizada  (qui-quadrado).  Usando-se  esses  resul¬ 
tados  como  uma  métrica  de  distâncias,  torna-se  os  mesmos 
comparáveis  com  as  matrizes  de  entrada  usadas  nas  aborda¬ 
gens  MDS  já  discutidas. 

3.  Através  de  um  processo  muito  parecido  com  o  escalona¬ 
mento  multidimensional,  cria-se  uma  série  de  soluções  di¬ 
mensionais  (unidimensional,  bidimensional  etc.)  sempre 
que  possível.  As  dimensões  relacionam  simultaneamente  as 
linhas  e  colunas  em  um  único  gráfico  conjunto.  O  resultado 
é  uma  representação  de  categorias  de  linhas  e/ou  colunas 
(p.ex.,  marcas  e  atributos)  no  mesmo  gráfico. 

Determinação  do  impacto  de  células  individuais 

Deve  ser  observado  que  os  dois  termos  específicos,  de¬ 
senvolvidos  em  análise  de  correspondência,  descrevem  as 
propriedades  dos  valores  de  freqüência  e  sua  contribuição 
relativa  à  análise. 

•  O  primeiro  termo  é  massa,  que  é  primeiramente  definido 
para  qualquer  entrada  individual  na  tabulação  cruzada 
como  o  percentual  do  total  representado  por  aquela  entra¬ 
da.  E  calculado  como  o  valor  de  qualquer  entrada  dividido 
por  N  (o  total  para  a  tabela,  que  é  a  soma  das  linhas  ou  colu¬ 
nas).  Assim,  a  soma  de  todas  as  entradas  da  tabela  (células) 
é  igual  a  1,0.  Também  podemos  calcular  a  massa  de  qual¬ 
quer  categoria  de  linha  ou  coluna,  somando  ao  longo  de  to¬ 
das  as  entradas.  Tal  resultado  representa  a  contribuição  de 
qualquer  categoria  de  linha  ou  coluna  para  a  massa  total. 

•  A  segunda  medida  é  inércia,  que  é  definida  como  o  qui- 
quadrado  total  dividido  por  A  (o  total  das  contagens  de  fre¬ 
qüência).  Deste  modo  temos  uma  medida  relativa  de  qui- 
quadrado  que  pode  ser  relacionada  com  qualquer  contagem 
de  freqüência. 

Com  essas  semelhanças  com  MDS  surge  um  conjun¬ 
to  parecido  de  problemas,  centrados  em  duas  questões 
fundamentais  na  avaliação  de  ajuste  geral:  avaliação  da 
importância  relativa  das  dimensões,  e  então  a  identifica¬ 
ção  do  número  apropriado  de  dimensões.  Cada  um  desses 
aspectos  é  discutido  na  próxima  seção. 

Avaliação  do  número  de  dimensões 

Autovalores,  também  conhecidos  como  valores  singula¬ 
res,  são  obtidos  para  cada  dimensão  e  indicam  a  contribui¬ 
ção  relativa  de  cada  dimensão  na  explicação  da  variância 


CAPÍTULO  9  Escalonamento  Multidimensional  e  Análise  de  Correspondência  513 


nas  categorias.  Semelhante  à  análise  fatorial,  podemos 
determinar  a  quantia  de  variância  explicada  tanto  para 
dimensões  individuais  quanto  para  a  solução  como  um 
todo.  Alguns  programas,  como  os  de  SPSS,  introduzem 
uma  medida  chamada  de  inércia,  que  também  mede  va¬ 
riação  explicada  e  está  diretamente  relacionada  com  o 
autovalor. 

Determinação  do  número  de  dimensões 

O  número  máximo  de  dimensões  que  pode  ser  estimado 
é  um  a  menos  do  que  o  menor  número  entre  a  quantia  de 
linhas  ou  de  colunas.  Por  exemplo,  com  seis  colunas  e  oito 
linhas,  o  número  máximo  de  dimensões  seria  cinco,  o  que 
corresponde  a  seis  (o  número  de  colunas)  menos  um. 

O  pesquisador  seleciona  o  número  de  dimensões 
com  base  no  nível  geral  de  variância  explicada  deseja¬ 
da  e  na  explicação  extra  ganha  pelo  acréscimo  de  uma 
outra  dimensão.  Ao  avaliar  dimensionalidade,  o  pesqui¬ 
sador  está  diante  de  negociações  muito  parecidas  com 
outras  soluções  MDS  ou  mesmo  de  análise  fatorial  (Ca¬ 
pítulo  3): 

•  Cada  dimensão  adicionada  à  solução  aumenta  a  variância 
explicada  da  solução,  mas  em  uma  quantia  decrescente  (ou 
seja,  a  primeira  dimensão  explica  a  maior  parte  da  variân¬ 
cia,  a  segunda  explica  a  segunda  maior  parte,  e  assim  por 
diante). 

•  Adicionar  dimensões  aumenta  a  complexidade  do  processo 
de  interpretação;  mapas  perceptuais  com  mais  de  três  di¬ 
mensões  se  tornam  cada  vez  mais  complexos  para  análise. 

O  pesquisador  deve  equilibrar  o  desejo  por  variância 
explicada  maior  versus  a  solução  mais  complexa  que  pos¬ 
sa  afetar  a  interpretação.  Uma  dica  prática  é  que  dimen¬ 
sões  com  inércia  (autovalores)  maiores  que  0,2  devem  ser 
incluídas  na  análise. 

Estimação  do  modelo 

Vários  programas  de  computador  estão  à  disposição  para 
realizar  a  análise  de  correspondência.  Entre  os  programas 
mais  populares,  estão  ANACOR  e  HOMALS,  disponí¬ 
veis  no  SPSS;  CA  de  BMDP;  CORRAN  e  CORRESP  de 
PC-MDS  [24];  e  MAPWISE  [21].  Um  grande  número  de 
aplicações  especializadas  tem  surgido  em  disciplinas  es¬ 
pecíficas  como  ecologia,  geologia  e  muitas  das  ciências 
sociais. 

Estágio  5:  Interpretação  dos  resultados 

Logo  que  a  dimensionalidade  tiver  sido  estabelecida,  o 
pesquisador  se  defronta  com  duas  tarefas:  interpretar  as 
dimensões  para  compreender  a  base  para  a  associação  en¬ 
tre  categorias  e  avaliar  o  grau  de  associação  entre  catego¬ 
rias,  dentro  de  uma  linha/coluna  ou  entre  linhas  e  colunas. 
Fazendo  isso,  o  pesquisador  ganha  uma  compreensão  a 
respeito  das  dimensões  inerentes  sobre  as  quais  o  mapa 
perceptual  se  baseia,  juntamente  com  a  associação  deriva¬ 
da  de  qualquer  conjunto  específico  de  categorias. 


Definição  do  caráter  das  dimensões 

Se  o  pesquisador  está  interessado  em  definir  o  caráter  de 
uma  ou  mais  dimensões  em  termos  das  categorias  de  li¬ 
nha  ou  coluna,  medidas  descritivas  em  cada  programa  de 
computador  indicam  a  associação  de  cada  categoria  a  uma 
dimensão  específica.  Por  exemplo,  em  SPSS  a  medida  de 
inércia  (usada  para  avaliar  o  grau  de  variância  explicada) 
é  decomposta  ao  longo  das  dimensões.  Semelhantes,  em 
caráter,  a  cargas  fatoriais,  esses  valores  representam  a  ex¬ 
tensão  da  associação  para  cada  categoria  individualmente 
com  cada  dimensão.  O  pesquisador  pode  então  nomear 
cada  dimensão  em  termos  das  categorias  mais  associadas 
com  ela. 

Além  de  representar  a  associação  de  cada  categoria 
com  cada  dimensão,  os  valores  de  inércia  podem  ser  to¬ 
talizados  ao  longo  de  dimensões  em  uma  medida  cole¬ 
tiva.  Fazendo  isso,  ganhamos  uma  medida  empírica  do 
grau  em  que  cada  categoria  está  representada  ao  longo 
de  todas  as  dimensões.  Conceitualmente,  esta  medida  é 
similar  à  medida  de  comunalidade  de  análise  fatorial  (ver 
Capítulo  3). 

Avaliação  da  associação  entre  categorias 

A  segunda  tarefa  na  interpretação  é  identificar  a  associa¬ 
ção  de  uma  categoria  com  outras,  o  que  pode  ser  feito  vi¬ 
sualmente  ou  por  meio  de  medidas  empíricas.  Qualquer 
que  seja  a  técnica  empregada,  o  pesquisador  deve  primei¬ 
ramente  escolher  os  tipos  de  comparação  a  serem  feitas  e 
então  a  normalização  adequada  para  a  comparação  sele¬ 
cionada.  Os  dois  tipos  de  comparação  são: 

1.  Entre  categorias  da  mesma  linha  ou  coluna.  Aqui  o  foco  é 
apenas  sobre  linhas  ou  colunas,  como  quando  se  examinam 
as  categorias  de  uma  escala  para  ver  se  elas  podem  ser  com¬ 
binadas.  Esses  tipos  de  comparações  podem  ser  feitos  dire¬ 
tamente  a  partir  de  qualquer  análise  de  correspondência. 

2.  Entre  linhas  e  colunas.  Uma  tentativa  de  relacionar  a  asso¬ 
ciação  entre  uma  categoria  de  linha  e  uma  de  coluna.  Este 
tipo  mais  comum  de  comparação  relaciona  categorias  ao 
longo  de  dimensões  (como  em  nosso  exemplo  anterior,  ven¬ 
das  de  produtos  associadas  com  categorias  etárias).  Contu¬ 
do,  desta  vez  há  algum  debate  na  adequação  da  compara¬ 
ção  entre  categorias  de  linha  e  de  coluna.  Em  um  sentido 
estrito,  distâncias  entre  pontos  representando  categorias  só 
podem  ser  feitas  dentro  de  uma  linha  ou  coluna.  E  conside¬ 
rada  inadequada  a  comparação  direta  de  uma  categoria  de 
linha  e  uma  de  coluna.  E  apropriado  fazer  generalizações 
referentes  às  dimensões  e  à  posição  de  cada  categoria  sobre 
tais  dimensões.  Assim,  a  posição  relativa  de  categorias  de 
linha  e  coluna  pode  ser  definida  dentro  dessas  dimensões, 
mas  não  deve  haver  comparação  direta. 

Alguns  programas  de  computador  fornecem  um  proce¬ 
dimento  de  normalização  para  viabilizar  essa  comparação 
direta.  Se  apenas  um  procedimento  de  normalização  de  li¬ 
nha  ou  coluna  está  disponível,  técnicas  alternativas  são  pro¬ 
postas  para  tornar  todas  as  categorias  comparáveis  [2,  21], 
mas  ainda  há  discordâncias  quanto  ao  seu  sucesso  [12].  Nos 
casos  em  que  as  comparações  diretas  não  são  possíveis,  a 
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correspondência  geral  ainda  vale  e  padrões  específicos  po¬ 
dem  ser  distinguidos. 

Os  objetivos  da  pesquisa  podem  se  concentrar  na  ava¬ 
liação  das  dimensões  ou  na  comparação  de  categorias,  e  o 
pesquisador  é  encorajado  a  fazer  ambas  as  interpretações 
já  que  elas  reforçam  uma  a  outra.  Por  exemplo,  a  com¬ 
paração  de  categorias  de  linha  versus  de  coluna  sempre 
pode  ser  complementada  com  a  compreensão  da  natu¬ 
reza  das  dimensões  para  fornecer  uma  perspectiva  mais 
abrangente  do  posicionamento  das  categorias  em  vez  de 
simplesmente  comparações  específicas.  Analogamente, 
a  avaliação  da  comparação  específica  de  categorias  pode 
dar  especificidade  à  interpretação  das  dimensões. 

Estágio  6:  Validação  dos  resultados 

A  natureza  composicional  da  análise  de  correspondência 
fornece  maior  especificidade  para  o  pesquisador  validar 
os  resultados.  Fazendo  isso,  o  pesquisador  deve  buscar 
avaliar  duas  questões-chave  relativas  à  generalidade  de 
dois  elementos: 

•  Amostra.  Como  ocorre  com  todas  as  técnicas  MDS,  deve-se 
enfatizar  a  garantia  da  generalidade  por  meio  de  análises  de 
subamostras  ou  múltiplas  amostras. 

•  Objetos.  A  generalidade  dos  objetos  (representada  indivi¬ 
dualmente  e  como  um  conjunto  pelas  categorias)  também 
deve  ser  estabelecida.  A  sensibilidade  dos  resultados  à  adi¬ 
ção  ou  eliminação  de  uma  categoria  pode  ser  avaliada.  A 
meta  é  avaliar  se  a  análise  depende  de  apenas  poucos  obje¬ 
tos  e/ou  atributos. 

Em  qualquer  caso,  o  pesquisador  deve  entender  o 
verdadeiro  significado  dos  resultados  em  termos  das 
categorias  sendo  analisadas.  A  natureza  inferencial  da 
análise  de  correspondência,  como  outros  métodos  MDS, 
requer  estrita  confiança  na  representatividade  e  genera¬ 
lidade  da  amostra  de  respondentes  e  objetos  (categorias) 
sob  análise. 

Visão  geral  da  análise  de  correspondência 

A  análise  de  correspondência  apresenta  ao  pesquisador 
diversas  vantagens,  variando  da  natureza  generalizada 
dos  dados  de  entrada  ao  desenvolvimento  de  mapas  per- 
ceptuais  únicos: 

•  A  simples  tabulação  cruzada  de  múltiplas  variáveis  categó¬ 
ricas,  como  atributos  de  produtos  versus  marcas,  pode  ser 
representada  em  um  espaço  perceptual.  Essa  abordagem 
permite  ao  pesquisador  analisar  as  respostas  existentes 
ou  reunir  respostas  no  tipo  menos  restritivo  de  medida,  o 
nível  categórico  ou  nominal.  Por  exemplo,  o  respondente 
precisa  avaliar  somente  com  respostas  do  tipo  sim  ou  não 
um  conjunto  de  objetos  quanto  a  alguns  atributos.  Essas 
respostas  podem  então  ser  agregadas  em  uma  tabela  cru¬ 
zada  e  analisadas.  Outras  técnicas,  como  a  análise  fatorial, 
exigem  avaliações  na  escala  intervalar  de  cada  atributo 
para  cada  objeto. 


•  A  CA  retrata  não  somente  as  relações  entre  as  linhas  e 
colunas,  mas  também  as  relações  entre  as  categorias  de 
linhas  ou  colunas.  Por  exemplo,  se  as  colunas  fossem  atri¬ 
butos,  múltiplos  atributos  próximos  teriam  perfis  similares 
ao  longo  de  produtos,  formando  um  grupo  de  atributos 
muito  semelhante  a  um  fator  de  análise  de  componentes 
principais. 

•  A  CA  pode  fornecer  uma  visão  conjunta  de  categorias  das 
linhas  e  colunas  na  mesma  dimensionalidade.  Certas  modi¬ 
ficações  de  programas  permitem  comparações  entre  pontos 
nos  quais  a  proximidade  relativa  está  diretamente  relacio¬ 
nada  com  a  maior  associação  entre  pontos  separados  [1, 21]. 
Quando  essas  comparações  são  possíveis,  permitem  que  ca¬ 
tegorias  das  linhas  e  colunas  sejam  examinadas  simultanea¬ 
mente.  Uma  análise  desse  tipo  capacitaria  o  pesquisador  a 
identificar  grupos  de  produtos  caracterizados  por  atributos 
em  grande  proximidade. 

Junto  com  as  vantagens  da  CA,  porém,  surgem  algu¬ 
mas  desvantagens  ou  limitações. 

•  A  técnica  é  descritiva  e  nada  adequada  ao  teste  de  hipó¬ 
teses.  Se  a  relação  quantitativa  de  categorias  é  desejada, 
métodos  como  modelos  log-lineares  são  sugeridos.  A  CA  é 
mais  adequada  à  análise  exploratória  de  dados. 

•  A  CA,  como  acontece  com  muitos  métodos  de  redução  de 
dimensionalidade,  não  dispõe  de  procedimento  para  deter¬ 
minar  conclusivamente  o  número  apropriado  de  dimensões. 
Como  ocorre  com  métodos  similares,  o  pesquisador  deve 
equilibrar  interpretabilidade  com  parcimônia  da  represen¬ 
tação  dos  dados. 

-  REGRAS  PRÁTICAS  9-4  - 

Análise  de  correspondência 

•  A  análise  de  correspondência  (CA)  é  mais  adequada 
para  pesquisa  exploratória  e  não  é  adequada  para  teste 
de  hipóteses 

•  A  CA  é  uma  forma  de  técnica  composicional  que 
demanda  especificação  de  objetos  e  atributos  a  serem 
comparados 

•  A  análise  de  correspondência  é  sensível  a  observações 
atípicas,  as  quais  devem  ser  eliminadas  antes  de  se  usar 
tal  técnica 

•  O  número  de  dimensões  a  serem  mantidas  na  solução 
se  baseia  em: 

•  Dimensões  com  inércia  (autovalores)  maiores  que 

0,2 

•  Dimensões  suficientes  para  atender  os  objetivos  da 
pesquisa  (geralmente  duas  ou  três) 

•  Dimensões  podem  ser  “nomeadas”  com  base  na 
decomposição  de  medidas  de  inércia  ao  longo  de  uma 
dimensão: 

•  Esses  valores  mostram  a  extensão  de  associação 
para  cada  categoria  individualmente  com  cada 
dimensão 

•  Elas  podem  ser  usadas  para  descrição  como  as 
cargas  em  análise  fatorial 
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•  A  técnica  é  bastante  sensível  a  dados  atípicos,  em  termos  de 
linhas  ou  colunas  (p.ex.,  atributos  ou  marcas).  Além  disso, 
para  fins  de  generalização,  o  problema  de  objetos  ou  atribu¬ 
tos  omitidos  é  crítico. 

No  geral,  a  análise  de  correspondência  provê  uma 
valiosa  ferramenta  analítica  para  um  tipo  de  dado 
(não-métrico)  que  normalmente  não  é  o  ponto  focal  de 
técnicas  multivariadas.  A  análise  de  correspondência 
também  fornece  ao  pesquisador  uma  técnica  composi- 
cional  complementar  ao  MDS,  para  tratar  de  questões 
nas  quais  a  comparação  direta  de  objetos  e  atributos  é 
preferível. 


ILUSTRAÇÃO  DO  MDS  E  DA 
ANÁLISE  DE  CORRESPONDÊNCIA 

Para  demonstrar  o  uso  de  técnicas  MDS,  examinamos  da¬ 
dos  reunidos  em  diversas  entrevistas  com  representantes 
de  companhias  a  partir  de  uma  amostra  representativa  de 
clientes  em  potencial.  No  decorrer  da  análise  do  mapea¬ 
mento  perceptual,  aplicamos  métodos  decomposicionais 
(MDS)  e  composicionais  (análise  de  correspondência).  A 
discussão  prossegue  em  quatro  seções: 

1.  Exame  dos  três  estágios  iniciais  do  processo  de  construção 
do  modelo  (objetivos  da  pesquisa,  planejamento  da  pesqui¬ 
sa  e  suposições)  que  são  comuns  aos  dois  métodos 

2.  Discussão  dos  próximos  dois  estágios  (estimação  de  modelo 
e  interpretação)  para  métodos  decomposicionais  de  MDS 

3.  Discussão  dos  mesmos  dois  estágios  para  o  método  com- 
posicional  (análise  de  correspondência)  aplicado  à  mesma 
amostra  de  respondentes 

4.  Uma  olhada  no  sexto  estágio  do  processo  de  construção  de 
modelo  (validação)  por  meio  de  comparação  dos  resultados 
dos  dois  tipos  de  métodos. 

A  aplicação  de  técnicas  composicionais  e  decomposi¬ 
cionais  permite  ao  pesquisador  conquistar  visões  exclu¬ 
sivas  de  cada  técnica  enquanto  também  estabelece  uma 
base  de  comparação  entre  cada  método. 

Estágio  1:  Objetivos  do 
mapeamento  perceptual 

Um  propósito  comum  da  pesquisa  que  lida  com  mapea¬ 
mento  perceptual  é  explorar  a  imagem  e  competitivida¬ 
de  de  uma  firma.  Essa  exploração  inclui  a  abordagem  de 
percepções  de  um  conjunto  de  firmas  no  mercado,  bem 
como  uma  investigação  de  preferências  entre  clientes  em 
potencial. 


Neste  exemplo,  a  HBAT  emprega  técnicas  de  mapea¬ 
mento  perceptual  em  um  plano  de  duas  fases: 

1.  Identificação  da  posição  de  HBAT  em  um  mapa 
perceptual  de  grandes  competidores  no  mercado 


com  uma  compreensão  das  comparações  de  dimen¬ 
sões  usadas  por  clientes  em  potencial 
2.  Avaliação  das  preferências  por  HBAT  relativamen¬ 
te  a  competidores  importantes 

Concentra-se  interesse  particular  no  exame  das  di¬ 
mensões  de  avaliação  que  possam  ser  mais  subjetivas 
ou  afetivas  na  composição  a  ser  medida  por  escalas 
convencionais.  Além  disso,  a  intenção  é  criar  um  úni¬ 
co  mapa  perceptual  geral  pela  combinação  de  posições 
de  objetos  e  sujeitos,  tornando  muito  mais  diretas  as 
posições  relativas  de  objetos  e  clientes  para  análise  de 
segmentação 


Na  busca  desses  objetivos,  o  pesquisador  deve  abor¬ 
dar  três  questões  fundamentais  que  ditam  o  caráter  bá¬ 
sico  dos  resultados:  objetos  a  serem  considerados  para 
comparação,  o  uso  de  dados  de  preferência  ou  de  simi¬ 
laridade,  e  o  emprego  de  análise  desagregada  ou  agre¬ 
gada.  Cada  uma  dessas  questões  será  tratada  na  discus¬ 
são  a  seguir. 

Identificação  de  objetos  para  inclusão 

Uma  decisão  crítica  para  qualquer  análise  de  mapa  per¬ 
ceptual  é  a  seleção  dos  objetos  a  serem  comparados.  Uma 
vez  que  julgamentos  são  feitos  baseados  na  similaridade 
de  um  objeto  com  outro,  a  inclusão  ou  exclusão  de  objetos 
pode  ter  um  grande  impacto.  Por  exemplo,  a  exclusão  de 
uma  firma  com  características  ímpares  em  relação  a  ou¬ 
tras  pode  ajudar  a  revelar  comparações  entre  empresas  ou 
até  de  dimensões  não  detactadas  de  outra  forma.  Analo¬ 
gamente,  a  exclusão  de  firmas  de  destaque  ou  relevantes 
sob  outra  perspectiva  pode  afetar  os  resultados  de  manei¬ 
ra  semelhante. 


Em  nosso  exemplo,  os  objetos  de  estudo  são  a  HBAT 
e  seus  nove  principais  concorrentes.  Para  entender  as 
percepções  dessas  companhias  concorrentes,  executi¬ 
vos  de  nível  médio  que  representam  potenciais  clientes 
são  pesquisados  quanto  às  suas  percepções  da  HBAT  e 
de  concorrentes.  Espera-se  que  os  mapas  perceptuais 
resultantes  retratem  o  posicionamento  da  HBAT  no 
mercado. 


Análise  baseada  em  dados  de 
similaridade  ou  de  preferência 

A  escolha  de  dados  de  similaridade  ou  de  preferência  de¬ 
pende  dos  objetivos  básicos  da  análise.  Dados  de  similari¬ 
dade  fornecem  a  comparação  mais  direta  de  objetos  com 
base  em  seus  atributos,  enquanto  dados  de  preferência 
permitem  uma  avaliação  direta  do  sentimento  do  respon- 
dente  em  relação  a  um  objeto.  E  possível,  através  do  uso 
de  múltiplas  técnicas,  combinar  os  dois  tipos  de  dados  se 
ambos  são  coletados. 
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Para  esta  análise,  reunir  tanto  dados  de  similaridade  quanto 
de  preferência  viabiliza  aos  pesquisadores  tratar  de  cada  um 
dos  objetivos  de  pesquisa  já  mencionados.  Dados  de  simi¬ 
laridade  são  o  tipo  básico  de  informação  usada  na  análise, 
com  dados  de  preferência  usados  em  análises  suplementa¬ 
res  para  avaliação  de  ordem  de  preferência  entre  objetos. 


Uso  de  uma  análise  desagregada  ou  agregada 

A  decisão  final  é  sobre  o  uso  de  análise  agregada  ou  desa¬ 
gregada  individualmente  ou  em  comum.  Análise  agregada 
fornece  uma  perspectiva  geral  sobre  a  amostra  como  um 
todo  em  uma  só  análise,  com  mapas  perceptuais  represen¬ 
tando  as  percepções  compostas  de  todos  os  respondentes. 
Análise  desagregada  permite  uma  análise  individualizada, 
na  qual  todos  os  respondentes  podem  ser  retratados  com 
seus  próprios  mapas  perceptuais.  Também  é  possível  com¬ 
binar  esses  dois  tipos  de  análise  de  forma  que  resultados 
individuais  são  retratados  em  conjunto  com  os  resultados 
agregados. 


Neste  exemplo  da  HBAT,  a  maior  parte  da  análise  será 
conduzida  no  nível  agregado  sempre  que  possível,  ape¬ 
sar  de  que  em  certos  casos  os  resultados  desagregados 
também  serão  apresentados.  Os  resultados  agregados 
se  aproximam  mais  dos  objetivos  da  pesquisa,  os  quais 
são  um  retrato  geral  da  HBAT  em  relação  aos  maiores 
concorrentes.  Se  a  pesquisa  subseqüente  fosse  mais  con¬ 
centrada  em  segmentação  ou  questões  que  diretamente 
envolvessem  indivíduos,  então  a  análise  desagregada  se¬ 
ria  mais  adequada. 


Tendo  tratado  desses  três  problemas,  podemos  pros¬ 
seguir  com  questões  relativas  ao  planejamento  específico 
de  pesquisa  e  administração  da  análise  de  mapeamento 
perceptual. 

Estágio  2:  Projeto  de  pesquisa  do 
estudo  do  mapeameuto  perceptual 

Com  os  objetivos  definidos  para  a  análise  de  mapeamento 
perceptual,  os  pesquisadores  da  HBAT  devem,  a  seguir, 
tratar  de  um  conjunto  de  decisões  focando  aspectos  de 
planejamento  de  pesquisa  que  definem  os  métodos  usa¬ 
dos  e  as  firmas  específicas  a  serem  estudadas.  Fazendo 
isso,  eles  também  definem  os  tipos  de  dados  que  precisam 
ser  coletados  para  executar  a  análise  desejada.  Cada  uma 
dessas  questões  é  discutida  na  próxima  seção. 

Seleção  de  métodos  decomposicionais 
ou  composicionais 

A  escolha  entre  métodos  decomposicionais  (livres  de 
atributos)  ou  composicionais  (baseados  em  atributos) 
gira  em  torno  da  especificidade  que  o  pesquisador  deseja. 


Na  abordagem  decomposicional,  o  respondente  fornece 
apenas  percepções  ou  avaliações  gerais  a  fim  de  prover  a 
medida  de  similaridade  mais  direta.  Contudo,  o  pesqui¬ 
sador  fica  com  pouca  evidência  objetiva  de  como  essas 
percepções  são  formadas  ou  da  base  em  que  elas  são  for¬ 
madas.  Em  contrapartida,  a  abordagem  composicional 
fornece  alguns  pontos  de  referência  (p.  ex.,  atributos) 
quando  avalia  similaridades,  mas  aí  devemos  estar  cientes 
dos  problemas  em  potencial  quando  atributos  relevantes 
são  omitidos. 


Neste  exemplo,  uma  combinação  de  técnicas  decompo¬ 
sicionais  e  composicionais  é  empregada.  Primeiro,  téc¬ 
nicas  MDS  tradicionais  usando  medidas  gerais  de  simi¬ 
laridade  fornecem  mapas  perceptuais  que  podem  então 
ser  interpretados  usando  dados  adicionais  de  atributos  e 
de  preferência.  Além  disso,  um  método  composicional 
(análise  de  correspondência)  é  utilizado  como  aborda¬ 
gem  complementar  no  mapeamento  perceptual,  contri¬ 
buindo  para  sua  habilidade  de  simultaneamente  retratar 
firmas  e  atributos  em  um  só  mapa. 


Seleção  de  firmas  para  análise 

Ao  selecionar  empresas  para  análise,  o  pesquisador  deve 
resolver  duas  questões.  Primeiro,  será  que  todas  as  firmas 
são  comparáveis  e  relevantes  para  os  propósitos  deste  es¬ 
tudo?  Segundo,  o  número  de  firmas  incluídas  é  suficiente 
para  retratar  a  dimensionalidade  desejada?  O  planeja¬ 
mento  da  pesquisa  para  tratar  de  cada  questão  é  discutido 
aqui. 


Este  estudo  inclui  nove  concorrentes,  mais  a  HBAT,  re¬ 
presentando  todas  as  principais  firmas  nesta  indústria  e 
tendo  coletivamente  mais  de  85%  de  todas  as  vendas. 
Além  disso,  elas  são  consideradas  representativas  de 
todos  os  potenciais  segmentos  existentes  no  mercado. 
Todas  as  demais  firmas  não  incluídas  na  análise  são  ti¬ 
das  como  concorrentes  secundários  em  relação  a  uma  ou 
mais  das  empresas  já  incluídas. 

Incluindo  10  empresas,  os  pesquisadores  podem  es¬ 
tar  razoavelmente  certos  de  que  mapas  perceptuais  de 
duas  dimensões  podem  ser  identificados  e  retratados. 
Apesar  de  isso  envolver  uma  tarefa  de  avaliação  um 
pouco  extensa  por  parte  dos  respondentes,  foi  consi¬ 
derado  necessário  incluir  este  conjunto  de  firmas  para 
permitir  aos  pesquisadores  uma  estrutura  multidimen- 
sional  dentro  da  qual  eles  descrevam  informações  de 
atributos  e  preferência. 


Métodos  não-métricos  versus  métricos 

A  escolha  entre  métodos  não-métricos  e  métricos  se  ba¬ 
seia  no  tipo  de  análise  a  ser  executada  (p.ex.,  composi¬ 
cional  ou  decomposicional)  e  nos  programas  a  serem 
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Utilizados.  Em  alguns  casos,  as  exigências  por  programas 
específicos  (p.  ex.,  a  análise  de  correspondência)  ditam  a 
abordagem,  mas  na  maioria  das  vezes  ambas  as  opções  es¬ 
tão  disponíveis. 


No  estudo  HBAT,  ambos  os  métodos,  métricos  e  não- 
métricos,  são  usados.  As  análises  de  escalonamento  mul¬ 
tidimensional  são  executadas  exclusivamente  com  dados 
métricos  (avaliações  de  similaridades,  preferências  e  de 
atributos).  A  análise  de  correspondência  executa  uma 
análise  não-métrica  usando  dados  na  forma  de  escores 
cruzados  de  freqüência. 


Coleta  de  dados  de  similaridade  e  de  preferência 

Uma  consideração  importante  na  decisão  sobre  o  uso  de 
similaridades  ou  preferências  tem  a  ver  com  os  objetivos 
da  pesquisa:  a  análise  se  concentra  na  compreensão  sobre 
como  os  objetos  se  comparam  conforme  os  antecedentes 
de  escolha  (ou  seja,  similaridades  baseadas  em  atributos 
de  objetos)  ou  segundo  os  resultados  da  escolha  (ou  seja, 
preferências)?  Ao  escolher  uma  abordagem,  o  analis¬ 
ta  deve  então  inferir  sobre  a  outra  por  meio  de  análise 
adicional.  Por  exemplo,  se  similaridades  são  escolhidas 
como  os  dados  de  entrada,  o  pesquisador  ainda  está  incer¬ 
to  sobre  quais  escolhas  seriam  feitas  em  qualquer  tipo  de 
decisão.  Analogamente,  se  preferências  são  analisadas,  o 
pesquisador  não  tem  base  direta  para  entender  os  deter¬ 
minantes  de  escolha  a  menos  que  alguma  análise  adicio¬ 
nal  seja  realizada. 


O  estudo  da  imagem  da  HBAT  é  constituído  de  entre¬ 
vistas  em  profundidade  com  18  administradores  de  nível 
médio  de  diferentes  empresas.  A  partir  dos  objetivos  da 
pesquisa,  a  principal  meta  é  compreender  as  semelhan¬ 
ças  de  firmas  com  base  em  seus  atributos.  Logo,  atenção 
é  dada  a  dados  de  similaridade  para  uso  em  análise  de 
escalonamento  multidimensional  e  em  avaliações  não- 
métricas  de  atributos  para  a  análise  de  correspondência. 
No  decorrer  das  entrevistas,  entretanto,  tipos  adicionais 
de  dados  foram  coletados  para  uso  na  análise  MDS,  in¬ 
cluindo  avaliações  de  atributos  de  empresas  e  preferên¬ 
cias  por  empresas  em  diferentes  situações  de  compra. 


Dados  de  similaridades 

O  ponto  de  partida  para  a  coleta  de  dados  para  a  análise 
MDS  foi  obter  as  percepções  dos  respondentes  quanto  à 
similaridade  ou  dissimilaridade  entre  a  HBAT  e  nove  em¬ 
presas  concorrentes  no  mercado. 


Julgamentos  de  similaridades  foram  feitos  com  a  abor¬ 
dagem  de  comparação  de  pares  de  objetos.  Os  45  pares 
de  empresas  [(10  x  9)/2]  foram  apresentados  aos  res¬ 


pondentes,  os  quais  indicaram  o  quanto  umas  são  pare¬ 
cidas  com  as  outras  em  uma  escala  de  9  pontos,  sendo 
1  “nada  similares”  e  9  “muito  similares”.  Note  que  os 
valores  têm  de  ser  transformados  porque  valores  cres¬ 
centes  para  avaliações  de  similaridades  indicam  maior 
semelhança,  o  oposto  de  uma  medida  de  similaridade 
baseada  em  distância. 


Avaliações  de  atributos 

Além  dos  julgamentos  de  similaridades,  as  avaliações  de 
cada  empresa  em  uma  série  de  atributos  foram  obtidas 
para  fornecer  algum  meio  objetivo  de  descrição  das  di¬ 
mensões  identificadas  nos  mapas  perceptuais.  Essas  ava¬ 
liações,  conseguidas  com  dois  métodos,  seriam  usadas  em 
ambas  as  análises,  MDS  e  de  correspondência. 


Oito  dos  10  atributos  identificados  como  componentes 
dos  quatro  fatores  do  Capítulo  3  foram  escolhidos  para 
este  estudo.  Os  8  atributos  incluídos  foram  Oualidade 
do  Produto;  Suporte  Técnico;  Anúncio;  X^2  Ima¬ 
gem  da  Equipe  de  venda;  X^^  Preço  Competitivo;  X^^ 
Garantia  e  Reclamações;  Ajg  Encomenda  e  Cobrança;  e 
Ajg  Velocidade  de  Entrega. 

Dois  dos  atributos  do  conjunto  original  de  10  foram 
eliminados  nesta  análise.  Primeiro,  X,,  referente  a  Co¬ 
mércio  Eletrônico,  não  foi  usado  porque  cerca  de  me¬ 
tade  das  firmas  não  tinha  uma  presença  de  comércio  em 
forma  eletrônica.  Além  disso,  Xg,  Solução  de  Reclama¬ 
ção,  que  é  fortemente  baseado  em  experiência,  também 
foi  omitido  porque  a  avaliação  feita  por  aqueles  que  não 
são  clientes  seria  difícil  para  os  respondentes. 

Para  as  avaliações  métricas  usadas  em  MDS,  cada  fir¬ 
ma  foi  avaliada  em  uma  escala  de  6  pontos  quanto  a  cada 
atributo.  Para  a  análise  de  correspondência,  avaliações 
não-métricas  foram  coletadas  solicitando-se  que  cada 
respondente  escolhesse  as  firmas  melhor  caracterizadas 
por  conta  de  cada  atributo.  Como  no  método  “escolha 
qualquer  um”  [14, 15],  o  respondente  poderia  selecionar 
qualquer  número  de  firmas  para  cada  atributo. 


Avaliações  de  preferência 

O  tipo  final  de  dados  avaliou  as  preferências  de  cada  res¬ 
pondente  em  um  contexto  específico  de  escolha.  Esses  da¬ 
dos  devem  ser  usados  em  conjunto  com  os  mapas  percep¬ 
tuais  derivados  no  escalonamento  multidimensional  para 
fornecer  uma  visão  sobre  a  correspondência  de  semelhan¬ 
ça  e  julgamentos  de  preferência. 


Três  diferentes  tipos  de  situação  de  compra  -  uma 
recompra  simples,  uma  recompra  modificada  e  uma 
situação  de  nova  compra  -  foram  avaliados  pelos  res¬ 
pondentes.  Em  cada  situação,  os  respondentes  classi- 
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ficaram  as  empresas  em  ordem  de  preferência  para 
aquele  contexto  particular  de  compra.  Por  exemplo,  na 
situação  de  recompra  simples,  o  respondente  indicou  a 
empresa  preferida  para  a  simples  recompra  de  produ¬ 
tos  (posto  de  ordenação  =  1),  a  próxima  preferida  (pos¬ 
to  de  ordenação  =  2)  e  assim  por  diante.  Preferências 
semelhantes  foram  reunidas  para  as  duas  situações  de 
compra  restantes. 


Estágio  3:  Suposições  no 
mapeamento  perceptual 

As  suposições  de  MDS  e  CA  lidam  principalmente  com  a 
comparabilidade  e  representatividade  dos  objetos  avalia¬ 
dos  e  dos  respondentes.  As  técnicas  em  si  impõem  poucas 
limitações  aos  dados,  mas  o  sucesso  delas  se  baseia  em  di¬ 
versas  características  dos  dados. 

Com  relação  à  amostra,  o  plano  amostrai  enfatizou  a 
obtenção  de  uma  amostra  representativa  de  clientes  da 
HBAT.  Além  disso,  tomou-se  cuidado  para  obter  res¬ 
pondentes  de  posição  e  conhecimento  de  mercado  com¬ 
paráveis.  Como  a  HBAT  e  as  outras  empresas  atendem 
um  mercado  bastante  distinto,  todas  as  firmas  avaliadas 
no  mapeamento  perceptual  devem  ser  conhecidas,  garan- 
tindo-se  que  discrepâncias  de  posicionamento  possam  ser 
atribuídas  a  diferenças  perceptuais  entre  respondentes. 

Escalonamento  multidimensional: 

Estágios  4  e  5 

Após  ter  especificado  as  10  empresas  a  serem  incluídas  no 
estudo  de  imagem,  a  administração  da  HBAT  especificou 
que  as  duas  abordagens,  decomposicional  (MDS)  e  com- 


posicional  (CA),  deveriam  ser  empregadas  para  construir 
os  mapas  perceptuais.  Primeiro  discutimos  diversas  técni¬ 
cas  decomposicionais,  e  então  examinamos  uma  aborda¬ 
gem  composicional  para  mapeamento  perceptual. 

Estágio  4:  Obtenção  de  resultados 
MDS  e  avaliação  do  ajuste  geral 

O  processo  de  desenvolvimento  de  um  mapa  perceptual 
é  fundamental  para  uma  solução  MDS,  mas  pode  variar 
bastante  em  termos  dos  tipos  de  dados  de  entrada  e  aná¬ 
lises  associadas  executadas.  Nesta  seção  discutimos  pri¬ 
meiramente  o  processo  de  desenvolvimento  de  um  mapa 
perceptual  com  base  em  julgamentos  de  similaridade.  Em 
seguida,  com  o  mapa  perceptual  estabelecido,  examina¬ 
mos  o  processo  para  incorporação  de  julgamentos  de  pre¬ 
ferência  no  mapa  perceptual  já  existente. 

Desenvolvimento  e  análise  do  mapa  perceptnal.  O  IN- 

DSCAL  [4]  foi  usado  para  desenvolver  um  mapa  percep¬ 
tual,  composto  ou  agregado,  e  as  medidas  das  diferenças 
entre  respondentes  em  suas  percepções.  Os  45  julgamen¬ 
tos  de  similaridades  dos  18  respondentes  foram  incluídos 
como  matrizes  separadas,  mas  uma  matriz  de  escores  mé¬ 
dios  foi  calculada  para  ilustrar  o  padrão  geral  de  simila¬ 
ridades  (ver  Tabela  9-4).  A  tabela  também  especifica  as 
altas  similaridades  (maiores  que  6,0),  bem  como  a  menor 
similaridade  para  cada  empresa.  Com  essas  relações,  os 
padrões  básicos  podem  ser  identificados  e  estão  disponí¬ 
veis  para  comparação  com  o  mapa  resultante. 

Estabelecimento  da  dimensionalidade  apropriada.  A 

primeira  análise  dos  resultados  do  MDS  é  determinar  a 
dimensionalidade  apropriada  e  retratar  os  resultados  em 
um  mapa  perceptual.  Para  fazer  isso,  o  pesquisador  deve 


TABELA  9-4  Médias  das  avaliações  de  similaridade  para  HBAT  e  nove  firmas  concorrentes 


Firma 

Firma 

HBAT 

A 

B 

C 

D 

E 

F 

G 

H 

1 

HBAT 

0,00 

A 

6,61 

0,00 

B 

5,94 

5,39 

0,00 

C 

2,33 

2,61 

3,44 

0,00 

D 

2,56 

2,56 

4,11 

6,94 

0,00 

E 

4,06 

2,39 

2,17 

4,06 

2,39 

0,00 

F 

2,50 

3,50 

4,00 

2,22 

2,17 

4,06 

0,00 

G 

2,33 

2,39 

3,72 

2,67 

2,61 

3,67 

2,28 

0,00 

H 

2,44 

4,94 

6,61 

2,50 

7,06 

5,61 

2,83 

2,56 

0,00 

1 

6,17 

6,94 

2,83 

2,50 

2,50 

3,50 

6,94 

2,44 

2,39 

0,00 

Avaliações  de  similaridade  máxima  e  mínima 

Similaridade 
maior  que  6,0 

A,  1 

HBAT 

1 

H 

D 

C,  H 

Nenhum 

1 

Nenhum 

B,  D 

HBAT 

A,  F 

Menor 

similaridade 

C,  G 

E,  G 

E 

F 

F 

B 

C 

F 

1 

H 

Nota'.  Avaliações  de  similaridade  estão  em  uma  escala  de  9  pontos  (1  =  nada  semelhantes,  9  =  muito  semelhantes). 
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considerar  os  índices  de  ajuste  em  cada  dimensionalidade 
e  a  própria  habilidade  em  interpretar  a  solução. 


A  Tabela  9-5  mostra  os  índices  de  ajuste  para  soluções 
de  duas  a  cinco  dimensões  (uma  solução  unidimensio¬ 
nal  não  foi  considerada  uma  alternativa  viável  para  10 
empresas).  Como  mostra  a  tabela,  existe  uma  melhora 
substancial  na  mudança  de  duas  para  três  dimensões, 
sendo  que  depois  disso  a  melhora  diminui  e  perma¬ 
nece  consistente  quando  aumentamos  o  número  de 
dimensões.  Equilibrando  essa  melhora  no  ajuste  com 
a  crescente  dificuldade  de  interpretação,  as  soluções 
bidimensional  ou  tridimensional  parecem  ser  as  mais 
adequadas.  Para  fins  de  ilustração,  a  solução  bidi¬ 
mensional  é  escolhida  para  posterior  análise,  mas  os 
métodos  que  aqui  discutimos  poderiam  ser  aplicados 
à  solução  tridimensional  com  a  mesma  facilidade.  O 
pesquisador  é  encorajado  a  explorar  outras  soluções 


para  avaliar  se  alguma  conclusão  substancialmente  di¬ 
ferente  seria  alcançada  com  base  na  dimensionalidade 
escolhida. 


Criação  do  mapa  perceptual.  Com  a  dimensionali¬ 
dade  estabelecida  em  duas  dimensões,  o  próximo  passo  é 
posicionar  cada  objeto  (firma)  no  mapa  perceptual.  Lem¬ 
bre  que  a  base  para  o  mapa  (neste  caso,  similaridade)  de¬ 
fine  como  os  objetos  podem  ser  comparados. 


O  mapa  perceptual  agregado  bidimensional  é  exibido  na 
Figura  9-12.  A  HBAT  é  mais  proximamente  associada 
à  empresa  A,  com  respondentes  considerando-as  quase 
idênticas.  Outros  pares  de  empresas  consideradas  alta¬ 
mente  similares  com  base  em  sua  proximidade  são  E  e 
G,  D  e  H,  e  F  e  I.  Comparações  também  podem  ser  feitas 
entre  essas  empresas  e  a  FIBAT.  A  FIBAT  difere  de  C, 

_ {Continua) 


TABELA  9-5  Avaliação  do  ajuste  geral  do  modelo  e  determinação  da  dimensionalidade  adequada 


Medidas  médias  de  ajuste" 

Dimensionalidade  da  solução 

Desajuste*’ 

Variação  percentual 

Ff" 

Variação  percentual 

5 

0,20068 

- 

0,6303 

- 

4 

0,21363 

6,4 

0,5557 

11,8 

3 

0,23655 

10,7 

0,5007 

9,9 

2 

0,30043 

27,0 

0,3932 

21,5 

“Média  ao  longo  de  t8  soluções  individuais 
“Fórmula  de  desajuste  de  Kruskal 

“Proporção  de  avaliações  de  similaridade  original  explicadas  por  dados  (distâncias)  escalonados  do  mapa  perceptual 


A 

B 

"  ■  HBAT 

■ 

H 

■  1 

■ 

D 

■ 

■ 

■  F 

C 

■  E 

G  ■ 

Dimensão  I 


FIGURA  9-12  Mapa  perceptual  de  HBAT  e  principais  concorrentes. 
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E  e  G  principalmente  na  dimensão  II,  ao  passo  que  a  di¬ 
mensão  I  diferencia  a  HBAT  mais  claramente  das  empre¬ 
sas  B,  C,  D  e  H  em  uma  direção,  e  das  empresas  Fel  em 
uma  outra  direção.  Todas  essas  diferenças  são  refletidas 
em  suas  posições  relativas  no  mapa  perceptual.  Compara¬ 
ções  parecidas  podem  ser  feitas  entre  todos  os  conjuntos 
de  empresas.  Para  entender  as  fontes  dessas  diferenças, 
porém,  o  pesquisador  deve  interpretar  as  dimensões. 


Antes  de  prosseguir  com  a  adição  de  dados  de  prefe¬ 
rência  à  análise,  o  pesquisador  deve  examinar  os  resul¬ 
tados  para  identificar  quaisquer  observações  atípicas  em 
potencial  e  verificar  a  suposição  de  homogeneidade  de 
respondentes.  Cada  uma  dessas  questões  é  tratada  antes 
que  o  processo  de  interpretação  comece. 

Avaliação  de  potenciais  observações  atípicas.  No 

processo  de  seleção  da  dimensionalidade  adequada,  uma 
medida  geral  de  ajuste  (desajuste)  foi  examinada.  No  en¬ 
tanto,  tal  medida  não  retrata  de  forma  alguma  o  ajuste  da 
solução  para  comparações  individuais.  Tal  análise  pode 
ser  feita  visualmente  por  meio  de  um  diagrama  de  dis¬ 
persão  de  distâncias  reais  (valores  escalonados  de  simila¬ 
ridade)  versus  distâncias  ajustadas  do  mapa  perceptual. 
Cada  ponto  representa  um  único  julgamento  de  simila¬ 
ridade  entre  dois  objetos,  com  ajuste  pobre  espelhando 
pontos  atípicos  no  gráfico.  Dados  atípicos  são  um  con¬ 
junto  de  julgamentos  de  similaridade  que  refletem  consis¬ 
tentemente  ajuste  ruim  para  um  objeto  ou  respondente 
individual.  Se  um  conjunto  consistente  de  objetos  ou  in¬ 


divíduos  é  identificado  como  atípico,  ele  pode  ser  consi¬ 
derado  para  eliminação. 


A  Figura  9-13  representa  o  diagrama  de  dispersão  de  va¬ 
lores  de  similaridade  versus  as  distâncias  derivadas  do 
programa  MDS.  Neste  caso,  não  surge  qualquer  padrão 
consistente  de  pontos  atípicos  para  uma  firma  ou  respon¬ 
dente  em  especial  para  torná-lo  candidato  à  eliminação 
da  análise. 


Teste  da  suposição  de  homogeneidade  para  respon¬ 
dentes.  Além  de  desenvolver  o  mapa  perceptual  com¬ 
posto,  o  INDSCAL  também  fornece  os  meios  para  ava¬ 
liar  uma  das  suposições  de  MDS,  a  homogeneidade  das 
percepções  dos  respondentes.  Para  cada  respondente, 
calculam-se  pesos  indicativos  da  correspondência  de  seu 
próprio  espaço  perceptual  com  o  mapa  perceptual  agre¬ 
gado.  Esses  pesos  fornecem  uma  medida  de  comparação 
entre  os  respondentes,  pois  os  respondentes  com  pesos 
similares  têm  mapas  perceptuais  individuais  similares.  O 
INDSCAL  também  fornece  uma  medida  de  ajuste  para 
cada  sujeito,  correlacionando  os  escores  computados  com 
as  avaliações  de  similaridades  originais  do  respondente. 


A  Tabela  9-6  contém  os  pesos  e  medidas  de  ajuste  para 
cada  respondente,  e  a  Figura  9-14  é  uma  representação  grá¬ 
fica  dos  respondentes  individuais  baseada  em  seus  pesos.  O 
exame  dos  pesos  (Tabela  9-6)  e  da  Figura  9-14  revela  que 
os  respondentes  são  bem  homogêneos  em  suas  percepções, 

_ {Continua) 


FIGURA  9-13  Diagrama  óe  dispersão  de  ajuste  linear. 
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TABELA  9-6  Medidas  de  diferenças  individuais  em  mapeamento  perceptuai:  medidas  de  ajuste  e  pesos  dimensionais  para 
respondentes  específicos 


Sujeito 

Medidas  de  ajuste 

Pesos  dimensionais 

Desajuste" 

Dimensão  1 

Dimensão  II 

1 

0,358 

0,274 

0,386 

0,353 

2 

0,297 

0,353 

0,432 

0,408 

3 

0,302 

0,378 

0,395 

0,472 

4 

0,237 

0,588 

0,572 

0,510 

5 

0,308 

0,308 

0,409 

0,375 

6 

0,282 

0,450 

0,488 

0,461 

7 

0,247 

0,547 

0,546 

0,499 

8 

0,302 

0,332 

0,444 

0,367 

9 

0,320 

0,271 

0,354 

0,382 

10 

0,280 

0,535 

0,523 

0,511 

11 

0,299 

0,341 

0,397 

0,429 

12 

0,301 

0,343 

0,448 

0,378 

13 

0,292 

0,455 

0,497 

0,456 

14 

0,302 

0,328 

0,427 

0,381 

15 

0,290 

0,371 

0,435 

0,426 

16 

0,311 

0,327 

0,418 

0,390 

17 

0,281 

0,433 

0,472 

0,458 

18 

0,370 

0,443 

0,525 

0,409 

Média'^ 

0,300 

0,393 

“Média  ao  longo  de  18  soiuções  individuais 
‘'Fórmula  de  desajuste  de  Kruskal 

“Proporção  de  avaliações  de  similaridade  original  explicadas  por  dados  escalonados  (distâncias)  do  mapa  perceptuai 


FIGURA  9-14  Pesos  individuais  de  sujeitos. 
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pois  os  pesos  mostram  poucas  diferenças  relevantes  em 
cada  dimensão,  e  nenhum  agrupamento  distinto  de  indiví¬ 
duos  emerge.  Na  Figura  9-14  todos  os  pesos  individuais  re¬ 
caem  sobre  uma  reta,  indicando  um  peso  consistente  entre 
as  dimensões  I  e  II. 

A  distância  de  cada  peso  individual  em  relação  à  ori¬ 
gem  indica  seu  nível  de  ajuste  com  a  solução.  Os  melhores 
ajustes  são  mostrados  pelas  maiores  distâncias  da  origem. 
Logo,  os  respondentes  4, 7  e  10  têm  o  mais  alto  ajuste,  e  os 
respondentes  1  e  9,  o  mais  baixo  ajuste.  Os  valores  de  ajuste 
exibem  consistência  relativa  tanto  em  desajuste  quanto  em 
R^,  com  valores  médios  de  0,300  (desajuste)  e  0,393  (R^). 
Além  disso,  todos  os  respondentes  são  bem  representados 
pelo  mapa  perceptual  composto,  sendo  a  menor  medida  de 
ajuste  0,27.  Assim,  nenhum  indivíduo  deve  ser  eliminado 
devido  a  pouco  ajuste  na  solução  bidimensional. 


Geração  de  avaliações  de  preferência.  Preferências 
diferem  de  comparações  de  similaridade  no  sentido  de 
que  os  respondentes  abordam  a  questão  de  preferência 
entre  objetos  em  um  contexto  específico  de  decisão.  Tais 
avaliações  podem  diferir  sensivelmente  de  julgamentos 
de  similaridade  ou  entre  contextos  de  decisão  (ou  seja, 
comprar  um  produto  como  presente  para  alguém  versus 
para  uso  pessoal).  É  essencial  que  o  contexto  apropriado 
de  decisão  seja  analisado  para  atender  aos  objetivos  da 
pesquisa. 


Incorporação  de  preferências  no  mapa  perceptnal.  Até 

agora,  lidamos  apenas  com  julgamentos  de  empresas 
baseados  em  similaridades,  mas  muitas  vezes  podemos 
querer  estender  a  análise  para  o  processo  de  tomada  de 
decisões  e  entender  as  preferências  do  respondente  pelos 
objetos  (no  caso,  empresas).  Para  tanto,  podemos  empre¬ 
gar  técnicas  MDS  adicionais  que  permitem  a  estimação  de 
pontos  ideais,  a  partir  dos  quais  as  preferências  por  obje¬ 
tos  podem  ser  determinadas. 


Como  descrito  anteriormente,  os  respondentes  foram 
solicitados  a  detalharem  suas  preferência  quanto  a  fir¬ 
mas  em  três  situações  de  compra.  Aqui  examinamos  as 
preferências  para  firmas  na  nova  situação  de  compra. 
Para  fins  de  ilustração,  examinamos  as  preferências  de 
cinco  respondentes.  As  ordenações  de  preferência  para 
esses  cinco  respondentes  são  dadas  na  Tabela  9-7. 


Nesse  exemplo,  usamos  um  método  externo  de  forma¬ 
ção  de  preferência  (PREFMAP  [6])  que  utiliza  os  ma¬ 
pas  perceptuais  agregados  obtidos  na  seção  anterior  e 
os  combina  com  os  julgamentos  de  preferência  forne¬ 
cidos  pelos  respondentes.  O  resultado  é  a  identificação 
de  pontos  ideais  para  indivíduos  e  para  o  respondente 
médio  no  mapa  perceptual. 


Cálculo  de  pontos  ideais.  Usando  o  mapa  percep¬ 
tual  anteriormente  obtido  e  as  avaliações  de  preferência, 
o  programa  pode  estimar  pontos  ideais  tanto  do  ponto  de 
vista  vetorial  quanto  pontual.  A  principal  diferença  en¬ 
tre  essas  duas  abordagens  é  seu  método  de  interpretação, 
com  os  pontos  ideais  pontualmente  representados  sendo 
avaliados  diretamente  por  sua  proximidade  com  posições 
individuais  de  firmas,  enquanto  uma  abordagem  vetorial 
representa  preferência  com  base  em  projeções  para  o  ve¬ 
tor  (ver  discussão  anterior  sobre  esses  dois  métodos). 


Nessa  situação,  a  administração  da  HBAT  decidiu-se  pelas 
representações  pontuais,  o  que  resultou  na  derivação  de 
pontos  ideais  para  os  cinco  respondentes,  mais  um  ponto 

(Continua) 


TABELA  9-7  Dados  de  preferência  da  nova  situação  de  compra  para  respondentes  seiecionados 

Firma 

Ajuste^ 

Sujeito 

HBAT 

A 

B 

C 

D 

E 

F 

G 

H 

1 

2 

3 

5 

6 

7 

4 

10 

8 

1 

9 

1 

-0,867 

-0,972 

-0,920 

-1,096 

-1 ,095 

-0,636 

-0,264 

-1 ,054 

-0,854 

-0,371 

0,787 

5 

2 

7 

6 

9 

3 

4 

1 

10 

8 

2 

-1 ,049 

-1 ,056 

-0,622 

-0,906 

-0,642 

-1,111 

-0,879 

-1 ,596 

-0,413 

-0,825 

0,961 

4 

1 

8 

7 

6 

9 

3 

5 

10 

2 

3 

-0,894 

-0,868 

-0,448 

-0,133 

-0,106 

-0,449 

-0,726 

-0,576 

-0,132 

-0,779 

0,855 

4 

3 

10 

2 

7 

8 

6 

1 

9 

5 

4 

-1 ,098 

-1,128 

-0,736 

-1,060 

-0,813 

-1,136 

-0,822 

-1 ,672 

-0,544 

-0,790 

0,884 

4 

1 

8 

7 

9 

3 

5 

2 

10 

6 

5 

-0,905 

-0,868 

-0,401 

-0,362 

-0,188 

-0,769 

-0,870 

-1 ,019 

-0,126 

-0,838 

0,977 

NA 

NA 

NA 

NA 

NA 

NA 

NA 

NA 

NA 

NA 

Média 

-0,916 

-0,931 

-0,580 

-0,668 

-0,525 

-0,776 

-0,666 

-1,140 

-0,370 

-0,674 

0,990 

Wofa;  Valores  no  topo  de  cada  célula  são  ordenações  originais  de  preferência,  enquanto  a  parte  de  baixo  é  a  distância  quadrada  (com  sinal)  da  firma  até  o  ponto 
Ideal.  NA  indica  ordenações  médias  não  disponíveis. 

“Ajuste  é  a  correlação  quadrada  entre  preferências  e  distâncias  com  sinal. 
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ideal  para  o  sujeito  médio.  Os  resultados  são  mostrados  na 
Figura  9-15.  As  distâncias  de  cada  empresa  até  os  pontos 
ideais  são  fornecidas  na  Tabela  9-7.  Valores  menores  indi¬ 
cam  uma  maior  proximidade  do  ponto  ideal. 


Interpretação  da  solução  baseada  em  preferência.  A 

inclusão  de  julgamentos  de  preferência  é  uma  tentativa  de 
estender  o  mapa  perceptual  com  base  em  julgamentos  de 
similaridade  em  um  contexto  de  decisão.  Deve  ser  obser¬ 
vado  que  uma  técnica  alternativa  é  utilizar  julgamentos 
de  preferência  como  a  base  para  o  mapa  perceptual,  caso 
em  que  resultados  diferentes  podem  ocorrer.  Tal  método, 
contudo,  confina  a  interpretação  a  apenas  um  contexto  es¬ 
pecífico  de  decisão,  enquanto  a  abordagem  descrita  aqui 
usa  o  mapa  perceptual  mais  generalizado  radicado  em  si¬ 
milaridade  em  um  contexto  decisório  específico. 


A  Figura  9-15  retrata  todos  os  respondentes  que  formam 
um  grupo  geral  de  certa  forma  agregado  em  torno  da 
média,  o  que  indica  uma  uniformidade  geral  em  prefe¬ 
rências.  No  entanto,  ainda  podemos  detectar  diferenças 
de  proximidade  para  o  grupo  como  um  todo  tanto  quan¬ 
to  para  empresas  individuais. 

•  Primeiro,  o  grupo  como  um  todo  está  mais  próximo  das 
empresas  C,  D,  F  e  H,  ao  passo  que  a  HBAT,  A,  B,  E  e 
G  estão  de  alguma  forma  mais  afastadas.  Note  que,  nes¬ 


se  caso,  tanto  a  proximidade  quanto  a  dimensionalidade 
são  importantes.  A  suposição  de  uma  análise  externa  é 
que  quando  você  muda  sua  posição  no  mapa  perceptual 
quanto  às  dimensões,  pode  mudar  sua  proximidade  dos 
pontos  ideais  e  sua  ordem  de  preferência. 

•  Em  termos  dos  respondentes  individuais,  algumas  asso¬ 
ciações  próximas  indicam  maiores  preferências.  O  res- 
pondente  1  tem  uma  associação  relativamente  próxima 
com  a  empresa  F,  como  refletido  em  uma  avaliação  de 
preferência  de  10  (ver  Tabela  9-7).  Para  os  responden¬ 
tes  3  e  5,  a  grande  proximidade  com  as  empresas  C,  D  e 
H  corresponde  a  um  padrão  consistente  de  preferências 
mais  elevadas,  como  se  mostra  na  Tabela  9-7.  Embora 
esse  grupo  de  respondentes  seja  relativamente  homogê¬ 
neo  em  suas  preferências,  como  indicado  por  seu  agru¬ 
pamento,  a  Figura  9-15  ainda  retrata  a  posição  relativa 
de  cada  empresa  não  apenas  em  percepção,  mas  agora 
também  em  preferência. 


Estágio  5:  Interpretação  dos  resultados 

Logo  que  o  mapa  perceptual  é  estabelecido,  podemos  co¬ 
meçar  o  processo  de  interpretação.  Como  o  procedimento 
INDSCAL  usa  apenas  os  julgamentos  de  similaridade  ge¬ 
ral,  a  HBAT  também  reuniu  avaliações  de  cada  empresa 
em  uma  série  de  oito  atributos  descritivos  de  estratégias 
típicas  seguidas  nesta  indústria.  As  avaliações  para  cada 
firma  tiveram  médias  calculadas  ao  longo  de  responden¬ 
tes  para  uma  única  avaliação  geral  usada  na  descrição  de 
cada  firma. 


A 

g  ^  ■  HBAT 

♦ 

H 

♦  I 

♦ 

2 

D4 

5  •*  4 

•  A  ,1  ♦F 

0  Média 

3 

♦ 

C 

♦  E 

♦  G 

Dimensão  I 


♦  Firma  •  Indivíduo 

■  HBAT  ▲  Indivíduo  médio 


FIGURA  9-15  Mapa  de  pontos  ideais  para  respondentes  seiecionados  e  médios:  situação  de  nova  compra. 
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Como  descrito  no  estágio  2,  os  oito  atributos  incluídos 
são  Ag  Qualidade  de  Produto;  Ag  Suporte  Técnico;  Ajq 
Anúncio;  Ajj  Imagem  da  Equipe  de  Venda;  Ajj  Preço 
Competitivo;  Aj4  Garantia  e  Reclamações;  Ajg  Enco¬ 
menda  e  Cobrança;  e  Ajg  Velocidade  de  Entrega.  Es¬ 
ses  atributos  representam  as  variáveis  individuais  que 
compõem  os  quatro  fatores  desenvolvidos  no  Capítulo 
3,  excluindo  A,,  Comércio  eletrônico,  e  Ag,  Solução  de 
Reclamação.  Os  escores  médios  para  cada  firma  são 
mostrados  na  Tabela  9-8. 


Uma  abordagem  subjetiva  para  interpretação.  O  pes¬ 
quisador  pode  levar  a  cabo  diversas  técnicas  subjetivas 
para  interpretação.  Primeiro,  as  firmas  podem  ser  carac¬ 
terizadas  em  termos  de  suas  avaliações  de  atributos  com 
atributos  distintos  identificados  para  cada  empresa.  Dessa 
maneira,  cada  firma  é  caracterizada  sobre  um  conjunto 
de  atributos,  com  o  pesquisador  relacionando  os  mesmos 
com  a  associação  entre  empresas,  se  possível.  Interpretar 
as  dimensões  é  mais  complicado,  no  sentido  de  que  o  pes¬ 
quisador  deve  relacionar  as  posições  das  firmas  com  as  di¬ 
mensões  em  termos  de  suas  características.  Em  ambas  as 
abordagens,  porém,  o  pesquisador  confia  em  julgamento 
pessoal  para  identificar  as  características  distintas  e  então 
relacioná-las  com  as  posições  das  firmas  e  a  interpretação 
resultante  das  dimensões. 

Essas  técnicas  são  mais  apropriadas  para  uso  em  situa¬ 
ções  nas  quais  os  objetos  e  as  características  básicas  são 
bem  estabelecidos.  Então  o  pesquisador  usa  conhecimen¬ 
to  geral  de  relações  existentes  entre  atributos  e  objetos 
para  auxiliar  na  interpretação.  Em  situações  nas  quais  o 
pesquisador  deve  desenvolver  tais  relações  e  associações 
a  partir  da  análise  em  si,  as  abordagens  objetivas  descritas 
na  próxima  seção  são  recomendadas,  pois  elas  fornecem 
um  método  sistemático  para  identificar  as  questões  bási¬ 
cas  envolvidas  na  interpretação  de  objetos  e  dimensões. 


A  administração  da  HB  AT  teve  acesso  aos  perfis  de  cada 
firma  com  base  nos  oito  atributos  (ver  Tabela  9-8).  No 
entanto,  devido  a  uma  vontade  de  evitar  a  introdução 
de  qualquer  viés  na  análise  por  conta  de  julgamento  ou 
percepção  pessoal,  as  abordagens  subjetivas  não  foram 
usadas.  Em  vez  disso,  métodos  objetivos  seriam  usados 
exclusivamente  na  fase  de  interpretação. 


Abordagens  objetivas  para  interpretação.  Para  fornecer 
uma  maneira  objetiva  de  interpretação,  PROFIT  [3],  um 
modelo  vetorial  foi  usado  para  combinar  as  avaliações 
para  as  posições  da  firma  no  mapa  perceptual  com  as  ava¬ 
liações  de  atributo  para  cada  objeto.  A  meta  é  identificar 
os  atributos  determinantes  nos  julgamentos  de  similarida¬ 
de  feitos  por  indivíduos  para  determinar  quais  atributos 
melhor  descrevem  as  posições  perceptuais  das  firmas  e  as 
dimensões. 


Os  resultados  da  aplicação  dos  dados  de  avaliação  ao 
mapa  perceptual  composto  são  mostrados  na  Figura  9-16 
como  três  grupos  ou  dimensões  distintas  de  atributos.  O 
primeiro  envolve  Ajg  (Velocidade  de  Entrega),  Ajg  (En¬ 
comenda  e  Cobrança)  e  Ag  (Qualidade  do  Produto),  os 
quais  estão  todos  apontados  na  mesma  direção,  e  A^ 
(Preço  Competitivo),  que  está  na  direção  oposta  à  das 
demais  três  variáveis.  Essa  diferença  na  direção  indica 
uma  correspondência  negativa  de  Competitividade  de 
Preço  em  relação  às  outras  três  variáveis,  o  que  é  secun¬ 
dado  pelas  relações  encontradas  no  Capítulo  3,  onde  Ag 
e  Aj3  formam  um  fator,  mas  com  Ag  tendo  uma  carga 
negativa  que  indica  uma  relação  negativa  com  A^.  Deve 
ser  observado  que  Ajg  e  Ajg  também  são  membros  de 
um  mesmo  fator,  o  que  apóia  a  proximidade  dos  mesmos 
nesta  análise  também. 

Q  segundo  conjunto  de  variáveis  reflete  duas  outras 
variáveis  descobertas  como  representantes  de  uma  di¬ 
mensão  de  suporte  técnico  (fator):  Ag  (Suporte  Técnico) 
e  Aj4  (Garantia  e  Reclamações),  junto  com  Aj,,  (Anún¬ 
cio).  Finalmente,  Ajj  (Imagem  da  Equipe  de  Venda) 
anda  quase  perpendicularmente  a  todas  as  demais  variá¬ 
veis,  indicando  em  algum  grau  uma  dimensão  separada  e 
distinta  de  avaliação. 


Interpretação  das  dimensões.  Para  interpretar  as  di¬ 
mensões,  o  pesquisador  procura  atributos  proximamente 
alinhados  em  relação  ao  eixo.  Como  o  mapa  perceptual  é 
uma  representação  pontual,  os  eixos  podem  ser  rotacio- 
nados  sem  qualquer  impacto  sobre  as  posições  relativas. 


Nesse  caso,  os  dois  grupos  de  atributos  estão  levemen¬ 
te  inclinados  em  relação  ao  eixo  original.  No  entanto,  a 
leve  rotação  dos  eixos  (muito  parecido  com  o  que  se  faz 
em  análise  fatorial  no  Capítulo  3)  resulta  em  um  perfil 
consistente  da  dimensão  I  (horizontal),  que  consiste  de 
serviço  ao  cliente  (Ajg  e  Ajg)  e  valor  do  produto  (Ag  e 
Ay)  versus  a  dimensão  II  (vertical)  de  marketing  (Ajg  e 
Ajj)  e  suporte  técnico  (Ag  e  Aj4).  Uma  característica  de 
destaque  da  segunda  dimensão  é  a  maneira  na  qual  Ajj 
(Imagem  da  Equipe  de  Venda)  opera  quase  em  contras¬ 
te  com  Ajg  (Anúncio),  ainda  que  ambas  sejam  altamente 
relacionadas.  Este  resultado  ocorre  porque  firmas  são 
distintas  nessas  variáveis  em  separado  ao  invés  de  jun¬ 
tamente,  em  contraste  com  as  outras  variáveis  que  pa¬ 
reciam  seguir  as  relações  entre  variáveis  anteriormente 
observadas. 


Apesar  de  não  ser  realmente  necessário  realizar  a  rota¬ 
ção  porque  empresas  podem  ser  comparadas  diretamente 
quanto  aos  vetores  de  atributos,  muitas  vezes  a  rotação 
pode  contribuir  para  uma  compreensão  mais  fundamen¬ 
tal  da  dimensão  percebida.  A  rotação  é  especialmente  útil 
em  soluções  que  envolvem  mais  de  duas  dimensões. 
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Atributos 

■  HBAT  Xg  Qualidade  de  produto 

♦  Firmas  rivais  Xg  Suporte  técnico 

X^Q  Anúncio 

Xi2  Imagem  da  equipe  de  venda 
Xi3  Preço  competitivo 
Xi4  Garantia  e  reclamações 
X^g  Encomenda  e  cobrança 
Xig  Velocidade  de  entrega 


FIGURA  9-16  Mapa  perceptual  com  representação  vetorial  de  atributos. 


Caracterização  das  firmas.  Para  determinar  os  valo¬ 
res  para  qualquer  empresa  em  um  vetor  de  atributo,  pre¬ 
cisamos  calcular  as  projeções  da  empresa  sobre  o  vetor. 
Para  ajudar  na  interpretação,  o  programa  PROFIT  forne¬ 
ce  valores  de  projeção  para  cada  atributo.  Esses  valores 
fornecem  uma  posição  relativa  para  cada  objeto  sobre  o 
vetor  de  atributo.  No  entanto,  os  valores  em  si  não  são 
apresentados  em  termos  da  escala  original  do  attributo. 
Para  fornecer  alguma  base  para  comparação,  médias  do 
objeto  para  o  atributo  também  são  em  geral  consideradas. 


Os  valores  de  projeção  de  atributos  estão  listados  na  se¬ 
gunda  linha  de  valores  para  cada  variável  na  Tabela  9-8. 
Também  estão  incluídas  as  avaliações  originais  (valores 
na  primeira  linha)  para  ver  se  o  vetor  representa  bem  as 
percepções  reais  dos  respondentes. 

Em  nosso  exemplo,  podemos  examinar  a  corres¬ 
pondência  das  projeções  com  as  avaliações  de  atributos 
para  quaisquer  atributos.  Selecionemos  as  avaliações 


em  Xg  (Suporte  Técnico).  Se  ordenarmos  os  objetos 
do  maior  para  o  menor,  a  ordem  será  C,  D,  H,  G,  B,  I, 
E,  HBAT,  F  e  A.  Usando  as  projeções  vetoriais,  per¬ 
cebemos  que  a  ordem  de  empresas  é  C,  D,  H,  G,  E, 
B,  A,  HBAT,  Fel.  Esta  comparação  demonstra  uma 
correspondência  relativamente  próxima  entre  os  valo¬ 
res  originais  e  os  calculados,  particularmente  entre  as 
primeiras  quatro  hrmas.  Essa  ordem  é  conhrmada  pela 
medida  estatística  de  ajuste  para  cada  atributo,  que  é  a 
correlação  entre  as  avaliações  originais  e  as  projeções 
vetoriais.  No  caso  de  Suporte  Técnico,  a  correlação  é 
de  0,829. 


O  pesquisador  não  deve  esperar  um  ajuste  perfeito  por 
várias  razões.  Primeiro,  o  mapa  perceptual  é  baseado  na 
avaliação  geral,  a  qual  pode  não  ser  diretamente  compará¬ 
vel  com  as  avaliações.  Segundo,  as  avaliações  são  subme¬ 
tidas  ao  cálculo  da  média  ao  longo  dos  respondentes,  de 
modo  que  seus  valores  são  determinados  por  diferenças 
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entre  indivíduos,  bem  como  diferenças  entre  empresas. 
Dados  esses  fatores,  o  nível  de  ajuste  para  os  atributos  é 
aceitável  individual  e  coletivamente. 

Visão  geral  dos  resultados  decomposicionais 

Os  métodos  decomposicionais  empregados  neste  estudo 
de  imagem  ilustram  a  inerente  negociação  e  as  vantagens 
e  desvantagens  resultantes  de  técnicas  de  escalonamento 
multidimensional  livre  de  atributos. 

•  Vantagem:  O  uso  de  julgamentos  de  similaridades  gerais 
fornece  um  mapa  perceptual  baseado  apenas  nos  critérios 
relevantes  escolhidos  por  parte  de  cada  respondente.  O 
respondente  pode  fazer  tais  julgamentos  com  base  em  qual¬ 
quer  conjunto  de  critérios  considerados  relevantes  em  uma 
única  medida  de  similaridade  geral. 

versus 

•  Desvantagem:  O  emprego  de  uma  técnica  livre  de  atribu¬ 
tos  dá  origem,  porém,  à  notável  dificuldade  de  interpre¬ 
tação  do  mapa  perceptual  em  termos  de  atributos  espe¬ 
cíficos.  O  pesquisador  é  solicitado  a  inferir  as  bases  para 
comparação  entre  objetos  sem  confirmação  direta  do  res¬ 
pondente. 

O  pesquisador  usando  tais  métodos  deve  examinar  os 
objetivos  de  pesquisa  e  decidir  se  os  benefícios  resultantes 
dos  mapas  perceptuais  desenvolvidos  através  de  aborda¬ 
gens  livres  de  atributos  são  mais  importantes  do  que  as 
limitações  impostas  na  interpretação.  Podemos  examinar 
os  resultados  da  análise  da  HBAT  para  avaliarmos  as  ne¬ 
gociações,  os  benefícios  e  os  custos. 


A  HBAT  pode  obter  muitas  novas  idéias  sobre  as  per¬ 
cepções  relativas  da  HBAT  e  das  demais  nove  firmas. 
Em  termos  de  percepções,  a  HBAT  é  a  mais  associada 
com  a  firma  A  e,  um  pouco,  com  as  firmas  Bei.  Alguns 
agrupamentos  competitivos  (p.ex.,  F  e  I,  E  e  G)  também 
devem  ser  considerados.  Nenhuma  empresa  é  considera¬ 
velmente  distinta,  de  forma  a  ser  considerada  atípica.  A 
HBAT  pode  ser  considerada  a  média  em  diversos  atri¬ 
butos  (Ag,  Ajge  Ajg),  mas  tem  escores  menores  em  diver¬ 
sos  atributos  (Ag,  Ajq  e  em  contraste  com  um  eleva¬ 
do  escore  para  o  atributo  A^j.  Finalmente,  a  HBAT  não 
tem  vantagem  real  em  termos  de  proximidade  a  pontos 
ideais  de  respondente,  com  outras  empresas,  como  D,  H 
e  F,  estando  localizadas  muito  mais  próximas  aos  pontos 
ideais  para  diversos  respondentes. 


Esses  resultados  dão  à  HBAT  uma  visão  não  apenas 
de  suas  percepções,  mas  também  das  percepções  dos 
outros  concorrentes  importantes  no  mercado.  A  habi¬ 
lidade  de  PROFIT  neste  exemplo  para  adequadamente 
descrever  os  objetos  em  termos  do  conjunto  de  atribu¬ 
tos  reduz  as  desvantagens  da  abordagem  livre  de  atri¬ 
butos.  Lembre-se,  porém,  que  o  pesquisador  não  está 
garantido  em  termos  de  compreensão  sobre  quais  atri¬ 


butos  foram  realmente  usados  no  julgamento,  estando 
certo  apenas  que  esses  atributos  podem  ser  descritivos 
dos  objetos. 

Análise  de  correspondência:  Estágios  4  e  5 

Uma  alternativa  ao  mapeamento  perceptual  livre  de  atri¬ 
butos  é  a  análise  de  correspondência  (CA),  um  método 
composicional  baseado  em  medidas  não-métricas  (con¬ 
tagens  de  freqüência)  entre  objetos  e/ou  atributos.  Nes¬ 
te  método  baseado  em  atributos,  o  mapa  perceptual  é 
um  espaço  conjunto,  que  mostra  tanto  atributos  quanto 
empresas  em  uma  mesma  representação.  Além  disso,  as 
posições  de  empresas  são  relativas  não  apenas  às  outras 
empresas  incluídas  na  análise,  mas  também  aos  atributos 
selecionados. 

Estágio  4:  Estimação  de  uma 
análise  de  correspondência 

A  preparação  de  dados  e  o  procedimento  de  estimação 
para  a  análise  de  correspondência  são  semelhantes,  em  al¬ 
guns  aspectos,  ao  processo  de  escalonamento  multidimen¬ 
sional  discutido  anteriormente,  com  algumas  exceções 
notáveis.  Nas  próximas  seções,  discutimos  o  método  de 
coleta  de  dados  usado  no  estudo  de  HBAT  e,  em  seguida, 
as  questões  envolvidas  no  cálculo  de  similaridade  e  na  de¬ 
terminação  da  dimensionalidade  da  solução. 

Coleta  e  preparação  de  dados.  Uma  característica  única 
da  análise  de  correspondência  é  o  emprego  de  dados  não- 
métricos  para  retratar  relações  entre  categorias  (objetos 
ou  atributos).  Uma  abordagem  comum  para  apresentação 
de  dados  é  o  emprego  de  uma  matriz  de  tabulação  cruza¬ 
da  que  relaciona  os  atributos  (representados  como  linhas) 
com  as  avaliações  de  objetos/firmas  (as  colunas).  Os  va¬ 
lores  representam  o  número  de  vezes  que  cada  empresa 
é  avaliada  como  sendo  caracterizada  por  aquele  atributo. 
Assim,  freqüências  maiores  indicam  uma  associação  mais 
forte  entre  aquele  objeto  e  o  atributo  em  questão. 


No  estudo  HBAT,  avaliações  binárias  de  empresas  fo¬ 
ram  reunidas  para  cada  firma  em  cada  um  dos  oito  atri¬ 
butos  (ou  seja,  uma  avaliação  do  tipo  sim-não  de  cada 
firma  sobre  cada  atributo).  As  entradas  individuais  na 
matriz  de  tabulação  cruzada  são  o  número  de  vezes  que 
uma  firma  é  avaliada  como  possuindo  um  atributo  espe¬ 
cífico.  Respondentes  podem  escolher  qualquer  número 
de  atributos  como  caracterizando  cada  empresa.  As  fre¬ 
qüências  simples  são  fornecidas  para  cada  firma  ao  longo 
de  todo  o  conjunto  de  atributos  na  Tabela  9-9. 


Cálculo  da  medida  de  similaridade.  A  análise  de  corres¬ 
pondência  é  baseada  em  uma  transformação  do  valor  qui- 
quadrado  em  uma  medida  métrica  de  distância,  que  atua 
como  uma  medida  de  similaridade.  O  valor  qui-quadrado 
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TABELA  9-9  Dados  cruzados  de  frequência  de  descritores  de  atributos  para  HBAT  e  as  nove  firmas  concorrentes 


Variáveis 

Firma 

HBAT 

A 

B 

C 

D 

E 

F 

G 

H 

i 

Xg  Qualidade  do  produto 

6 

6 

14 

10 

22 

8 

7 

4 

14 

4 

Xg  Suporte  Técnico 

15 

18 

9 

2 

3 

15 

16 

7 

8 

8 

X,g  Anúncio 

15 

16 

15 

11 

11 

14 

16 

12 

14 

14 

X,2  Imagem  da  equipe  de  venda 

4 

3 

1 

13 

9 

6 

3 

18 

2 

10 

X,3  Preço  competitivo 

15 

14 

6 

4 

4 

15 

14 

13 

7 

13 

X,4  Garantia  e  reclamações 

7 

18 

13 

4 

9 

16 

14 

5 

4 

16 

X,g  Encomenda  e  cobrança 

14 

14 

10 

11 

11 

14 

12 

13 

10 

14 

X,8  Velocidade  de  entrega 

16 

13 

8 

13 

9 

17 

15 

16 

6 

12 

é  calculado  como  a  freqüência  real  de  ocorrência  menos  a 
frequência  esperada.  Assim,  um  valor  negativo  indica,  nesse 
caso,  que  uma  empresa  foi  avaliada  menos  freqüentemente 
do  que  o  esperado.  O  valor  esperado  para  uma  célula  (qual¬ 
quer  combinação  de  empresa-atributo  na  tabulação  cruzada) 
é  baseado  na  freqüência  com  que  a  empresa  foi  avaliada  em 
outros  atributos  e  a  freqüência  com  que  outras  empresas  fo¬ 
ram  avaliadas  naquele  atributo.  (Em  termos  estatísticos,  o 
valor  esperado  é  baseado  nas  probabilidades  marginais  de 
linha  [atributo]  e  coluna  [empresa].) 


A  Tabela  9-10  contém  as  distâncias  qui-quadrados  trans¬ 
formadas  (métricas)  para  cada  célula  da  tabulação  cru¬ 
zada  da  Tabela  9-9.  Valores  positivos  elevados  indicam 
um  alto  grau  de  correspondência  entre  o  atributo  e  a  em¬ 
presa,  e  valores  negativos  têm  uma  interpretação  opos¬ 
ta.  Por  exemplo,  os  valores  elevados  para  a  HBAT  e  as 
empresas  A  e  F  com  o  atributo  de  suporte  técnico  (Ag) 
indicam  que  elas  devem  ficar  próximas  no  mapa  percep- 
tual,  se  possível.  Do  mesmo  modo,  os  valores  negativos 
elevados  para  as  empresas  C  e  D  na  mesma  variável  in¬ 
dicariam  que  suas  posições  devem  ficar  afastadas  da  lo¬ 
calização  do  atributo. 


Determinação  da  dímensíonalídade  da  solução.  A  análi¬ 
se  de  correspondência  tenta  satisfazer  todas  essas  relações 
simultaneamente  produzindo  dimensões  que  representam 


as  distâncias  qui-quadrado.  Para  determinar  a  dimensio- 
nalidade  da  solução,  o  pesquisador  examina  o  percentual 
cumulativo  de  variação  explicada,  de  maneira  parecida 
com  o  que  se  faz  em  análise  fatorial,  e  determina  a  dimen- 
sionalidade  adequada.  O  pesquisador  equilibra  o  desejo 
por  explicação  aumentada  ao  adicionar  dimensões  extras 
versus  interpretabilidade,  pela  criação  de  maior  complexi¬ 
dade  com  cada  dimensão  somada. 


A  Tabela  9-11  contém  os  autovalores  e  percentuais  de 
variação  cumulativa  e  explicada  para  cada  dimensão  até 
o  máximo  de  sete.  Uma  solução  bidimensional  nessa  si¬ 
tuação  explica  86%  da  variação,  ao  passo  que  aumentar 
para  uma  solução  tridimensional  acrescenta  apenas  10% 
à  explicação.  Ao  comparar  a  variância  adicional  explica¬ 
da  em  relação  à  complexidade  crescente  na  interpreta¬ 
ção  dos  resultados,  uma  solução  bidimensional  é  consi¬ 
derada  adequada  para  análise  posterior. 


Estágio  5:  Interpretação  dos  resultados  da  CA 

Com  o  número  de  dimensões  definido,  o  pesquisador  deve 
prosseguir  com  uma  interpretação  do  mapa  perceptual 
obtido.  Fazendo  isso,  pelo  menos  três  questões  devem  ser 
tratadas:  posicionamento  de  categorias  linha  e/ou  coluna, 
caracterização  das  dimensões,  e  avaliação  da  adequação 
de  ajuste  de  categorias  individuais.  Cada  uma  delas  é  dis¬ 
cutida  nas  próximas  seções. 


TABELA  9-10  Medidas  de  similaridade  em  análise  de  correspondência:  distâncias  qui-quadrado 


Variáveis 

Firma 

HBAT 

A 

B 

C 

D 

E 

F 

G 

H 

i 

Xg  Qualidade  do  produto 

-1,02 

-1,28 

2,37 

1,27 

1,71 

-0,73 

-0,83 

-1,59 

2,99 

-1,66 

Xg  Suporte  Técnico 

1,24 

1,69 

-0,01 

-2,14 

-1 ,76 

0,72 

1,32 

-1,07 

0,10 

-0,85 

X,g  Anúncio 

0,02 

-0,13 

0,76 

-0,01 

0,04 

-0,73 

0,07 

-0,60 

1,07 

-0,20 

X,2  Imagem  da  equipe  de  venda 

-1 ,27 

-1,83 

-2,08 

3,19 

1,53 

-0,86 

-1,73 

4,07 

-1,42 

0,97 

X,3  Preço  competitivo 

1,08 

0,40 

-1,10 

-1,52 

-1 ,48 

0,57 

0,59 

0,65 

-0,36 

0,53 

X,4  Garantia  e  reclamações 

-1 ,32 

-1,49 

1,15 

-1,54 

0,23 

0,81 

0,55 

-1,80 

-1 ,44 

1,39 

X,g  Encomenda  e  cobrança 

0,19 

-0,19 

-0,30 

0,37 

0,42 

-0,30 

-0,54 

0,08 

0,20 

0,23 

X,g  Velocidade  de  entrega 

0,68 

-0,51 

-0,95 

0,95 

-0,27 

0,40 

0,20 

0,86 

-1,15 

-0,37 
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TABELA  9-1 1  Determinação  da  dimensionalidade  adequada  em  análise  de  correspondência 


Dimensão 

Autovalor  (Valor  singular) 

Inércia  (QuI-quadrado  normalizado) 

Percentual  explicado 

Percentual  cumulativo 

1 

0,27666 

0,07654 

53,1 

53,1 

2 

0,21866 

0,04781 

33,2 

86,3 

3 

0,12366 

0,01529 

10,6 

96,9 

4 

0,05155 

0,00266 

1,8 

98,8 

5 

0,02838 

0,00081 

0,6 

99,3 

6 

0,02400 

0,00058 

0,4 

99,7 

7 

0,01951 

0,00038 

0,3 

100,0 

Posicionamento  relativo  de  categorias.  A  primeira  ta¬ 
refa  é  avaliar  as  posições  relativas  das  categorias  para  as 
linhas  e  colunas.  Fazendo  isso,  o  pesquisador  pode  avaliar 
a  associação  entre  categorias  em  termos  de  suas  proximi¬ 
dades  no  mapa  perceptual.  Note  que  a  comparação  deve 
ser  apenas  entre  categorias  na  mesma  linha  ou  coluna. 


O  mapa  perceptual  mostra  as  proximidades  relativas 
de  empresas  e  atributos  (ver  Figura  9-17).  Se  nos  con¬ 
centrarmos  primeiramente  nas  empresas,  perceberemos 
que  o  padrão  de  agrupamentos  de  firmas  é  semelhante 
ao  encontrado  nos  resultados  MDS.  As  empresas  A,  E, 
Fel,  mais  a  HBAT,  formam  um  grupo;  as  empresas  C 
e  D  e  as  firmas  FI  e  B  formam  dois  outros  grupos  pare¬ 
cidos.  No  entanto,  as  proximidades  relativas  dos  mem¬ 
bros  em  cada  grupo  diferem  um  pouco  da  solução  MDS. 
Além  disso,  a  empresa  G  é  mais  isolada  e  distinta,  e  as 
empresas  F  e  E  agora  são  vistas  como  mais  parecidas 
com  a  HBAT. 

Em  termos  de  atributos,  surgem  diversos  padrões. 
Primeiro,  e  as  duas  variáveis  negativamente  re¬ 
lacionadas,  aparecem  em  extremos  opostos  do  mapa 
perceptual.  Além  disso,  variáveis  exibindo  elevada  as¬ 
sociação  (p.ex.,  formando  fatores)  também  recaem  em 
grande  proximidade  (A^g  e  Ajg,  Ag  e  AjJ.  Talvez  uma 
perspectiva  mais  apropriada  seja  uma  contribuição  de 
atributo  a  cada  dimensão,  como  se  discute  a  seguir. 


Interpretação  das  dimensões.  Pode  ser  útil  interpretar 
as  dimensões  se  normalizações  de  linhas  ou  colunas  são 
usadas.  Para  esses  fins,  a  inércia  (variação  explicada)  de 
cada  dimensão  pode  ser  atribuída  entre  categorias  para 
linhas  e  colunas. 


A  Tabela  9-12  fornece  as  contribuições  de  ambos  os  con¬ 
juntos  de  categorias  para  cada  dimensão.  Para  os  atribu¬ 
tos,  podemos  ver  que  Ajj  (Imagem  da  Equipe  de  venda) 
é  o  principal  contribuinte  da  dimensão  I,  e  Ag  (Suporte 
Técnico)  é  um  contribuinte  secundário.  Note  que  esses 
dois  atributos  são  extremos  em  termos  de  suas  localiza¬ 
ções  na  dimensão  I  (ou  seja,  valores  mais  altos  ou  mais 
baixos  na  dimensão  I).  Entre  esses  dois  atributos,  86% 


da  dimensão  I  é  explicada.  Um  padrão  semelhante  se  dá 
para  a  dimensão  II,  para  a  qual  Ag  (Qualidade  do  Pro¬ 
duto)  é  o  principal  contribuinte,  seguido  por  A^  (Preço 
Competitivo),  que,  quando  combinados,  explicam  83% 
da  inércia  da  dimensão  II. 

Se  desviamos  nossa  atenção  para  as  10  firmas,  perce¬ 
bemos  uma  situação  um  pouco  mais  equilibrada,  em  que 
três  firmas  (A,  C  e  G)  contribuem  acima  da  média  de 
10%.  Para  a  segunda  dimensão,  quatro  firmas  (B,  D,  G  e 
H)  têm  contribuições  acima  da  média. 


Apesar  de  as  comparações  neste  exemplo  estarem  en¬ 
tre  ambos  os  conjuntos  de  categorias  e  não  restritas  a  um 
só  conjunto  de  categorias  (linha  ou  coluna),  essas  medidas 
de  contribuição  demonstram  a  habilidade  para  interpretar 
a  dimensão  quando  assim  desejado. 

Avaliação  de  ajuste  para  categorias.  Uma  medida 
final  fornece  uma  avaliação  de  ajuste  para  cada  cate¬ 
goria.  Comparáveis  com  as  cargas  fatoriais  quadradas 
em  análise  fatorial  (ver  Capítulo  3  para  uma  discussão 
mais  detalhada),  esses  valores  representam  a  quantia  de 
variação  na  categoria  explicada  pela  dimensão.  Um  va¬ 
lor  total  representa  a  quantia  total  de  variação  ao  longo 
de  todas  as  dimensões,  com  o  máximo  possível  sendo 
100%. 


A  Tabela  9-12  contém  valores  de  ajuste  para  cada  cate¬ 
goria  em  cada  dimensão.  Como  podemos  ver,  os  valores 
de  ajuste  variam  de  um  valor  alto  de  99,1  para  Ag  (Qua¬ 
lidade  do  Produto)  e  Ajj  (Imagem  da  Equipe  de  venda) 
a  um  baixo  de  0,372  para  Aj4  (Garantia  e  Reclamações). 
Entre  os  atributos,  apenas  Aj4  tem  um  valor  abaixo  de 
50%,  e  somente  duas  empresas  (HBAT  e  I)  ficam  abai¬ 
xo  desse  valor.  Ainda  que  esses  sejam  valores  um  pouco 
baixos,  eles  ainda  representam  uma  explicação  suficien¬ 
te  para  retê-los  na  análise  e  se  considerar  a  mesma  com 
significância  prática  suficiente. 


Revisão  de  CA 

Essas  e  outras  comparações  destacam  as  diferenças  entre 
os  métodos  MDS  e  CA  e  seus  resultados.  Os  resultados 
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Dimensão  I 


Atributos 

■  HBAT  Xg  Qualidade  do  produto 

<>  Firmas  concorrentes  -^s  Suporte  técnico 
Xio  Anúncio 

Xi2  Imagem  da  equipe  de  venda 
Xi3  Preço  competitivo 
Xi4  Garantia  e  reclamações 
Xig  Encomenda  e  cobrança 
X^  3  Velocidade  de  entrega 


FIGURA  9-17  Mapeamento  perceptual  com  métodos  composicionais:  análise  de  correspondência. 


da  CA  fornecem  um  meio  para  comparar  diretamente  a 
similaridade  ou  dissimilaridade  de  empresas  e  os  atributos 
associados,  ao  passo  que  o  MDS  permite  apenas  a  com¬ 
paração  de  empresas.  Mas  a  solução  CA  é  condicionada 
ao  conjunto  de  atributos  incluídos.  Ela  assume  que  todos 
os  atributos  são  apropriados  para  todas  as  empresas  e 
que  a  mesma  dimensionalidade  se  aplica  a  cada  empresa. 
Logo,  o  mapa  perceptual  resultante  sempre  deve  ser  visto 
apenas  no  contexto  das  empresas  e  atributos  incluídos  na 
análise. 

A  análise  de  correspondência  é  uma  técnica  bastan¬ 
te  flexível  aplicável  a  uma  vasta  gama  de  questões  e  si¬ 
tuações.  As  vantagens  do  gráfico  conjunto  de  atributos  e 
objetos  devem  sempre  ser  ponderadas  em  relação  às  in¬ 
terdependências  inerentes  que  existem  e  aos  efeitos  po¬ 
tencialmente  viesados  de  um  atributo  ou  empresa  inade¬ 
quados,  ou  talvez  mais  importante,  do  atributo  omitido 
de  uma  empresa.  Não  obstante,  a  CA  ainda  fornece  uma 
ferramenta  poderosa  para  adquirir  visão  administrativa 
sobre  a  posição  relativa  de  empresas  e  dos  atributos  asso¬ 
ciados  com  tais  posições. 


Estágio  6:  Validação  dos  resultados 

Talvez  a  mais  forte  validação  interna  dessa  análise  seja 
avaliar  a  convergência  entre  os  resultados  de  técnicas  de- 
composicionais  e  composicionais  separadas.  Cada  técni¬ 
ca  emprega  diferentes  tipos  de  respostas  do  consumidor, 
mas  os  mapas  perceptuais  resultantes  são  representações 
do  mesmo  espaço  perceptual  e  devem  se  corresponder.  Se 
a  correspondência  é  alta,  o  pesquisador  pode  estar  seguro 
de  que  os  resultados  refletem  o  problema  como  descrito. 
O  pesquisador  deve  observar  que  esse  tipo  de  convergên¬ 
cia  não  trata  da  generalidade  dos  resultados  para  outros 
objetos  ou  amostras  da  população. 


A  comparação  dos  métodos  decomposicional  e  compo- 
sicional,  mostrados  nas  Figuras  9-12  e  9-17,  pode  consi¬ 
derar  duas  abordagens:  examinar  o  posicionamento  re¬ 
lativo  de  objetos  e  interpretar  os  eixos.  Comecemos  pelo 
exame  do  posicionamento  das  empresas.  Quando  as  Fi¬ 
guras  9-12  e  9-17  são  rotacionadas  para  obter-se  a  mes- 

_ {Continua) 
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TABELA  9-12  Interpretação  das  dimensões  e  sua  correspondência  com  firmas  e  atributos 


Coordenadas 

Contribuição  para  inércia^ 

Expiicação  por  dimensão" 

Objeto 

1 

II 

1 

II 

1 

II 

Total 

Atributo 

Xg  Qualidade  do  produto 

0,044 

1,235 

0,001 

0,689 

0,002 

0,989 

0,991 

Xg  Suporte  Técnico 

-0,676 

-0,285 

0,196 

0,044 

0,789 

0,111 

0,901 

X,g  Anúncio 

-0,081 

0,245 

0,004 

0,045 

0,093 

0,678 

0,772 

X,2  Imagem  da  equipe  de  venda 

1,506 

0,298 

0,665 

0,033 

0,961 

0,030 

0,991 

X,3  Preço  competitivo 

-0,202 

-0,502 

0,018 

0,142 

0,138 

0,677 

0,816 

X,4  Garantia  e  reclamações 

-0,440 

-0,099 

0,087 

0,006 

0,358 

0,014 

0,372 

X,g  Encomenda  e  cobrança 

0,115 

0,046 

0,007 

0,001 

0,469 

0,058 

0,527 

X,g  Velocidade  de  entrega 

0,204 

-0,245 

0,022 

0,040 

0,289 

0,330 

0,619 

Firma 


HBAT 

-0,247 

-0,293 

0,024 

0,042 

0,206 

0,228 

0,433 

A 

-0,537 

-0,271 

0,125 

0,040 

0,772 

0,156 

0,928 

B 

-0,444 

0,740 

0,063 

0,224 

0,294 

0,648 

0,942 

C 

1,017 

0,371 

0,299 

0,050 

0,882 

0,093 

0,975 

D 

0,510 

0,556 

0,074 

0,111 

0,445 

0,418 

0,863 

E 

-0,237 

-0,235 

0,025 

0,031 

0,456 

0,356 

0,812 

F 

-0,441 

-0,209 

0,080 

0,023 

0,810 

0,144 

0,954 

G 

0,884 

-0,511 

0,292 

0,123 

0,762 

0,201 

0,963 

H 

-0,206 

0,909 

0,012 

0,289 

0,049 

0,748 

0,797 

1 

0,123 

-0,367 

0,006 

0,066 

0,055 

0,390 

0,446 

“Proporção  da  inércia  da  dimensão  atribuívei  a  cada  categoria 
“Proporção  de  variação  de  categoria  explicada  por  dimensão 


{Continuação) 

ma  perspectiva,  elas  exibem  padrões  bem  similares  de 
empresas  que  refletem  dois  grupos:  empresas  B,  H,  D  e 
C  versus  E,  F,  G  e  I.  Embora  as  distâncias  relativas  entre 
empresas  variem  entre  os  dois  mapas  perceptuais,  ainda 
vemos  a  HBAT  fortemente  associada  às  empresas  A  e  I 
em  cada  mapa  perceptual.  A  CA  produz  maior  distinção 
entre  as  empresas,  mas  seu  objetivo  é  definir  posições  de 
empresas  como  um  resultado  de  diferenças;  logo,  ela  irá 
gerar  maior  distinção  em  seus  mapas  perceptuais. 

A  interpretação  de  eixos  e  características  de  distin¬ 
ção  também  exibe  padrões  semelhantes  nos  dois  mapas 
perceptuais.  Para  o  método  decomposicional  exibido 
na  Figura  9-12,  notamos  na  discussão  anterior  que,  pela 
rotação  dos  eixos,  obteríamos  uma  interpretação  mais 
clara.  Se  rotacionamos  os  eixos,  a  dimensão  1  se  torna 
associada  com  serviço  ao  cliente  e  valor  do  produto  {X^, 
Xj3,  Aj^e  Ajg),  ao  passo  que  a  dimensão  II  reflete  marke¬ 
ting  e  suporte  técnico  (Ag,  e  Ajj).  Os  demais  atribu¬ 
tos  não  são  fortemente  associados  a  qualquer  eixo. 

Para  fazer  uma  comparação  com  análise  de  cor¬ 
respondência  (Figura  9-17),  devemos  primeiramente 
reorientar  os  eixos.  Como  podemos  ver,  as  dimensões 
mudam  entre  as  duas  análises.  Os  agrupamentos  de  fir¬ 
mas  permanecem  essencialmente  os  mesmos,  mas  estão 
em  posições  diferentes  no  mapa  perceptual.  Em  CA,  as 
dimensões  refletem  aproximadamente  os  mesmos  ele¬ 


mentos,  com  as  cargas  maiores  sendo  X^g  (Velocidade 
de  Entrega)  na  dimensão  I  e  X^2  (Imagem  da  Equipe  de 
venda)  na  dimensão  II.  Isso  se  compara  muito  favoravel¬ 
mente  com  os  resultados  decomposicionais,  exceto  pelo 
fato  de  que  os  outros  atributos  estão  um  pouco  mais  di¬ 
fusos  nas  dimensões. 

No  geral,  apesar  de  algumas  diferenças  de  fato  existi¬ 
rem  devido  às  características  de  cada  abordagem,  a  con¬ 
vergência  dos  dois  resultados  realmente  fornece  alguma 
validade  interna  aos  mapas  perceptuais.  Diferenças  per¬ 
ceptuais  podem  existir  para  uns  poucos  atributos,  mas 
os  padrões  gerais  de  posições  de  empresas  e  dimensões 
avaliativas  são  apoiados  por  ambas  as  abordagens.  A 
disparidade  do  atributo  de  flexibilidade  de  preço  ilustra 
as  diferenças  dos  dois  métodos. 


O  pesquisador  dispõe  de  duas  ferramentas  comple¬ 
mentares  na  compreensão  de  percepções  de  clientes.  O 
método  decomposicional  determina  a  posição  baseado 
em  julgamentos  gerais,  com  os  atributos  aplicados  somen¬ 
te  como  uma  tentativa  para  explicar  as  posições.  O  mé¬ 
todo  composicional  posiciona  empresas  de  acordo  com  o 
conjunto  selecionado  de  atributos,  criando  assim  posições 
baseadas  nos  atributos.  Além  disso,  cada  atributo  é  igual¬ 
mente  ponderado,  de  modo  que  há  potenciais  distorções 
do  mapa  com  atributos  irrelevantes.  Essas  diferenças  não 
tornam  qualquer  técnica  melhor  ou  ótima,  mas,  em  vez 


532  Análise  Multivariada  de  Dados 


disso,  devem  ser  compreendidas  pelo  pesquisador  para 
garantir  a  seleção  do  método  mais  adequado  aos  objeti¬ 
vos  de  pesquisa. 

Uma  visão  gerencial  dos  resultados  do  MDS 

O  mapeamento  perceptual  é  uma  técnica  ímpar  que  for¬ 
nece  comparações  gerais  que  não  são  prontamente  possí¬ 
veis  com  qualquer  outro  método  multivariado.  Como  tal, 
seus  resultados  oferecem  várias  perspectivas  para  uso  ad¬ 
ministrativo.  A  aplicação  mais  comum  dos  mapas  percep- 
tuais  é  para  a  avaliação  de  imagem  para  qualquer  empre¬ 
sa  ou  grupo  de  empresas.  Enquanto  variável  estratégica,  a 
imagem  pode  ser  importante  como  um  indicador  geral  de 
presença  ou  posição  no  mercado. 


Neste  estudo,  descobrimos  que  a  HBAT  está  mais  pro¬ 
ximamente  associada  às  empresas  A  e  I  e  mais  distante 
das  empresas  C,  E  e  G.  Assim,  quando  servem  os  mes¬ 
mos  mercados,  a  HBAT  pode  identificar  as  empresas 
consideradas  semelhantes  ou  distintas  de  sua  imagem. 
Com  os  resultados  baseados  não  em  qualquer  conjun¬ 
to  de  atributos  específicos,  mas  em  julgamentos  gerais 
de  respondentes,  as  imagens  apresentam  o  benefício  de 
não  estarem  sujeitas  a  julgamentos  subjetivos  de  um 
pesquisador,  como  atributos  a  serem  incluídos  ou  a  for¬ 
ma  de  ponderar  os  atributos  individuais,  mantendo  o 
verdadeiro  espírito  de  avaliação  de  imagem.  No  entan¬ 
to,  as  tecnologias  MDS  são  menos  úteis  para  guiar  es¬ 
tratégias  por  serem  menos  úteis  para  prescrever  como 
mudar  a  imagem.  As  respostas  globais  que  são  vantajo¬ 
sas  para  a  comparação  agora  funcionam  contra  nós  na 
explicação. 


Apesar  de  as  técnicas  MDS  poderem  aumentar  a  ex¬ 
plicação  dos  mapas  perceptuais,  elas  devem  ser  vistas 
como  suplementares  e  provavelmente  com  maiores  incon¬ 
sistências  do  que  se  fossem  integradas  ao  processo.  Logo, 
uma  pesquisa  adicional  pode  ajudar  a  explicar  as  posições 
relativas. 

Para  este  fim,  os  resultados  da  CA  são  uma  abordagem 
conciliadora,  na  tentativa  de  retratar  mapas  perceptuais 
sob  uma  perspectiva  composicional.  A  comparação  de  re¬ 
sultados  da  CA  com  os  da  solução  MDS  clássica  revela  di¬ 
versas  consistências,  mas  também  algumas  discrepâncias. 


A  comparação  das  duas  soluções  identifica  alguns 
padrões  gerais  de  associações  entre  firmas  (como  A 
HBAT  e  as  firmas  A  e  I)  e  entre  grupos  de  atributos.  A 
administração  da  HBAT  pode  usar  tais  resultados  não 
apenas  como  um  guia  para  a  política  geral,  mas  tam¬ 
bém  como  referencial  para  futura  investigação  com  ou¬ 
tras  técnicas  multivariadas  sobre  questões  de  pesquisa 
mais  específicas. 


O  pesquisador  deve  observar  que  nenhuma  técnica 
tem  a  resposta  absoluta,  mas  que  cada  uma  pode  ser  usada 
para  capitalizar  sobre  seus  benefícios  relativos.  Quando 
empregadas  dessa  maneira,  as  diferenças  esperadas  nas 
duas  técnicas  podem,  realmente,  fornecer  visões  únicas  e 
complementares  sobre  a  questão  de  pesquisa. 

Resumo 

Escalonamento  multidimensional  é  um  conjunto  de  pro¬ 
cedimentos  que  pode  ser  usado  para  representar  grafica¬ 
mente  as  relações  descobertas  por  dados  que  representam 
similaridade  ou  preferência.  Essa  técnica  tem  sido  usada 
com  sucesso  (1)  para  ilustrar  segmentos  de  mercado  com 
base  em  julgamentos  de  preferência,  (2)  para  determi¬ 
nar  quais  produtos  são  mais  competitivos  entre  si  (isto 
é,  são  mais  similares),  e  (3)  para  deduzir  quais  critérios 
as  pessoas  usam  quando  julgam  objetos  (p.ex.,  produtos, 
companhias,  anúncios).  Este  capítulo  ajuda  você  a  fazer 
o  seguinte: 

Definir  escalonamento  mnitidimensional  e  descrever 
como  ele  é  execntado.  Escalonamento  multidimensional 
(MDS),  também  conhecido  como  mapeamento  perceptu¬ 
al,  é  um  procedimento  que  permite  que  um  pesquisador 
determine  a  imagem  relativa  percebida  de  um  conjunto 
de  objetos  (firmas,  produtos,  idéias  ou  outros  itens  asso¬ 
ciados  com  percepções  comumente  mantidas).  O  propósi¬ 
to  do  MDS  é  transformar  julgamentos  de  clientes,  quanto 
a  similaridade  ou  preferência  geral  (p.ex.,  preferência  por 
lojas  ou  marcas),  em  distâncias  representadas  em  um  es¬ 
paço  multidimensional.  Para  executar  uma  análise  de  es¬ 
calonamento  multidimensional,  o  pesquisador  realiza  três 
passos  básicos:  (1)  reúne  medidas  de  similaridade  ou  de 
preferência  no  conjunto  inteiro  de  objetos  a  serem  ana¬ 
lisados,  (2)  usa  técnicas  MDS  para  estimar  a  posição  re¬ 
lativa  de  cada  objeto  no  espaço  multidimensional,  e  (3) 
identifica  e  interpreta  os  eixos  do  espaço  dimensional  em 
termos  de  atributos  perceptuais  e/ou  objetivos.  O  mapa 
perceptual,  também  chamado  de  mapa  espacial,  exibe  o 
posicionamento  relativo  de  todos  os  objetos. 

Entender  as  diferenças  entre  dados  de  similaridade  e  de 
preferência.  Depois  de  escolher  objetos  para  o  estudo, 
o  pesquisador  deve  a  seguir  escolher  a  base  de  avaliação: 
similaridade  ou  preferência.  Ao  fornecerem  dados  de  si¬ 
milaridade,  os  respondentes  não  aplicam  quaisquer  aspec¬ 
tos  do  tipo  “bom-ruim”  de  avaliação  na  comparação,  mas 
com  dados  de  preferência  avaliações  desse  tipo  são  feitas. 
Em  resumo,  dados  de  preferência  assumem  que  diferentes 
combinações  de  atributos  percebidos  são  melhor  valora¬ 
das  do  que  outras.  Ambas  as  bases  de  comparação  podem 
ser  usadas  para  desenvolver  mapas  perceptuais,  mas  com 
diferentes  interpretações:  (1)  mapas  perceptuais  baseados 
em  similaridade  representam  semelhanças  de  atributos  e 
dimensões  perceptuais  de  comparação,  mas  não  refletem 
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qualquer  visão  direta  sobre  os  determinantes  de  escolha;  e 
(2)  mapas  perceptuais  baseados  em  preferências  refletem 
escolhas  preferidas,  mas  podem  não  corresponder  de  for¬ 
ma  alguma  às  posições  baseadas  em  semelhança,  pois  res- 
pondentes  podem  sustentar  suas  escolhas  sobre  dimensões 
ou  critérios  inteiramente  diferentes  daqueles  nos  quais 
eles  baseiam  comparações.  Sem  qualquer  base  ótima  para 
avaliação,  a  decisão  entre  dados  de  similaridades  e  de  pre¬ 
ferência  deve  ser  feita  com  a  mais  importante  questão  de 
pesquisa  em  mente,  pois  eles  são  fundamentalmente  dis¬ 
tintos  em  termos  do  que  representam. 

Selecionar  entre  nma  abordagem  decomposícíonal  e  nma 
composicional.  Técnicas  de  mapeamento  perceptual  po¬ 
dem  ser  classificadas  em  um  entre  dois  tipos,  com  base  na 
natureza  das  respostas  obtidas  a  partir  de  indivíduos,  refe¬ 
rentes  a  objetos:  (1)  o  método  decomposicional,  que  mede 
somente  a  impressão  ou  avaliação  geral  de  um  objeto  e 
então  tenta  derivar  posições  espaciais  em  espaço  multi¬ 
dimensional  que  reflitam  essas  percepções  (ele  emprega 
dados  de  similaridade  ou  de  preferência  e  é  a  abordagem 
tipicamente  associada  ao  MDS),  e  (2)  o  método  compo¬ 
sicional,  que  emprega  diversas  técnicas  multivariadas  já 
discutidas  que  são  usadas  para  formar  uma  impressão  ou 
avaliação  com  base  em  uma  combinação  de  atributos  es¬ 
pecíficos.  Mapeamentos  perceptuais  podem  ser  realizados 
com  técnicas  tanto  decomposicionais  quanto  composicio- 
nais,  mas  cada  técnica  apresenta  vantagens  e  desvantagens 
específicas  que  devem  ser  consideradas  do  ponto  de  vista 
dos  objetivos  da  pesquisa.  Se  o  mapeamento  perceptual  é 
levado  a  cabo  como  técnica  exploratória  para  identificar 
dimensões  não-reconhecidas  ou  como  meio  de  se  obter 
avaliações  comparativas  de  objetos  quando  as  bases  espe¬ 
cíficas  de  comparação  são  desconhecidas  ou  não-definidas, 
as  abordagens  decomposicionais  (livres  de  atributos)  são 
as  mais  adequadas.  Em  contrapartida,  se  as  metas  da  pes¬ 
quisa  incluem  a  representação  gráfica  entre  objetos  em  um 
conjunto  definido  de  atributos,  então  as  técnicas  composi- 
cionais  são  a  alternativa  preferível. 

Determinar  a  comparabílídade  e  o  número  de  obje¬ 
tos.  Antes  de  se  executar  qualquer  estudo  de  mapea¬ 
mento  perceptual,  o  pesquisador  deve  tratar  de  duas 
questões-chave  em  relação  aos  objetos  sendo  avaliados. 
Essas  questões  lidam  com  a  garantia  de  comparabilida- 
de  dos  objetos  e  com  a  seleção  do  número  de  objetos  a 
serem  avaliados.  A  primeira  questão  ao  se  selecionar  ob¬ 
jetos  é:  eles  são  realmente  comparáveis?  Eima  suposição 
implícita  em  mapeamento  perceptual  é  aquela  sobre  ca¬ 
racterísticas  em  comum,  sejam  objetivas  ou  percebidas, 
usadas  pelo  respondente  no  processo  de  avaliação.  Logo, 
é  essencial  que  os  objetos  sob  comparação  tenham  um 
conjunto  de  atributos  inerentes  que  caracterizam  cada 
um  deles  e  formam  a  base  de  comparação  feita  pelo 
respondente.  Não  é  possível  que  o  pesquisador  force  o 
respondente  a  fazer  comparações  criando  pares  de  ob¬ 


jetos  não  comparáveis.  Eima  segunda  questão  se  refere 
ao  número  de  objetos  a  serem  avaliados.  Ao  se  decidir 
quantos  objetos  devem  ser  incluídos,  o  pesquisador  deve 
equilibrar  dois  desejos:  por  um  número  menor  de  objetos 
para  facilitar  o  esforço  por  parte  do  respondente,  e  por 
uma  quantia  exigida  de  objetos  para  se  obter  uma  solu¬ 
ção  multidimensional  estável.  Geralmente  deve  ser  feita 
uma  negociação  entre  o  número  de  dimensões  inerentes 
que  podem  ser  identificadas  e  o  esforço  exigido  por  parte 
do  respondente  para  avaliá-las. 

Entender  como  criar  nm  mapa  perceptnal.  Três  passos 
estão  envolvidos  na  criação  de  um  mapa  perceptual  com 
base  nas  posições  ótimas  dos  objetos.  O  primeiro  é  esco¬ 
lher  uma  configuração  inicial  de  estímulos  em  uma  dimen- 
sionalidade  inicial  desejada.  As  duas  abordagens  mais 
amplamente  utilizadas  para  obter  a  configuração  inicial 
são  aquela  que  se  sustenta  em  dados  prévios  e  aquela  que 
gera  uma  através  da  seleção  de  pontos  pseudo-aleatórios  a 
partir  de  uma  distribuição  multivariada  aproximadamente 
normal.  O  segundo  passo  é  computar  as  distâncias  entre 
os  pontos  de  estímulos  e  comparar  as  relações  (observa¬ 
das  versus  derivadas)  com  uma  medida  de  ajuste.  Eima 
vez  que  a  configuração  é  encontrada,  as  distâncias  entre 
estímulos  nas  configurações  iniciais  são  comparadas  com 
as  medidas  de  distância  obtidas  a  partir  de  julgamentos 
de  similaridade.  As  duas  medidas  de  distância  são  então 
comparadas  por  uma  medida  de  ajuste,  geralmente  sendo 
uma  medida  de  desajuste.  O  terceiro  passo  é  necessário 
se  a  medida  de  ajuste  não  alcançar  um  valor  de  parada 
previamente  escolhido.  Em  tais  casos,  você  encontra  uma 
nova  configuração  para  a  qual  a  medida  de  ajuste  é  mini¬ 
mizada.  O  programa  de  computador  determina  as  dire¬ 
ções  nas  quais  o  melhor  ajuste  pode  ser  obtido  e  então 
move  os  pontos  na  configuração  naquelas  direções  em  pe¬ 
quenos  incrementos. 

Explicar  análise  de  correspondência  como  nm  método 
de  mapeamento  perceptnal.  Análise  de  correspondên¬ 
cia  (CA)  é  uma  técnica  de  interdependência  que  tem  se 
tornado  cada  vez  mais  popular  para  redução  dimensional 
e  mapeamento  perceptual.  A  análise  de  correspondên¬ 
cia  tem  três  características  marcantes:  (f)  é  uma  técnica 
composicional,  e  não  decomposicional,  porque  o  mapa 
perceptual  se  baseia  na  associação  entre  objetos  e  um 
conjunto  de  características  ou  atributos  descritivos  espe¬ 
cificados  pelo  pesquisador;  (2)  é  a  aplicação  mais  direta  na 
representação  gráfica  da  correspondência  de  categorias 
de  variáveis,  particularmente  aquelas  medidas  em  escalas 
nominais,  que  é  então  usada  como  a  base  para  o  desen¬ 
volvimento  de  mapas  perceptuais;  e  (3)  os  benefícios  ex¬ 
clusivos  da  CA  repousam  em  suas  habilidades  para  repre¬ 
sentar  linhas  e  colunas,  por  exemplo,  marcas  e  atributos, 
em  um  espaço  conjunto.  Resumidamente,  a  análise  de 
correspondência  oferece  uma  valiosa  ferramenta  analítica 
para  um  tipo  de  dado  (não-métrico)  que  freqüentemente 
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não  é  o  ponto  focal  de  técnicas  multivariadas.  A  análise 
de  correspondência  também  oferece  ao  pesquisador  uma 
técnica  composicional  complementar  a  MDS  para  tratar 
de  questões  nas  quais  a  comparação  direta  de  objetos  e 
atributos  é  preferível. 

O  MDS  pode  revelar  relações  que  parecem  estar  obs¬ 
curas  quando  se  examinam  somente  os  números  resultan¬ 
tes  de  um  estudo.  Um  mapa  perceptual  com  apelo  visual 
enfatiza  as  relações  entre  os  estímulos  sob  estudo.  Deve¬ 
mos  tomar  muito  cuidado  quando  utilizamos  essa  técnica. 
O  seu  uso  de  forma  incorreta  é  comum.  O  pesquisador 
deve  se  familiarizar  com  o  método  antes  de  usá-lo  e  ver  os 
resultados  apenas  como  o  primeiro  passo  para  a  determi¬ 
nação  de  informações  perceptuais. 

Questões 

1.  Como  o  MDS  difere  de  outras  técnicas  de  interdependência 
(análise  de  agrupamentos  e  análise  fatorial)? 

2.  Qual  é  a  diferença  entre  dados  de  preferência  e  dados  de 
similaridade,  e  que  impacto  eles  têm  sobre  os  resultados  de 
procedimentos  MDS? 

3.  Como  os  pontos  ideais  são  empregados  em  procedimentos 
MDS? 

4.  Quais  são  as  diferenças  entre  procedimentos  MDS  métricos 
e  não-métricos? 

5.  Como  o  pesquisador  pode  determinar  quando  a  solução 
MDS  ótima  foi  obtida? 

6.  Como  o  pesquisador  identifica  as  dimensões  em  MDS? 
Compare  esse  método  com  o  procedimento  para  a  análise 
fatorial. 

7.  Compare  e  contraste  as  técnicas  CA  e  MDS. 

8.  Descreva  como  é  obtida  correspondência  ou  associação  a 
partir  de  uma  tabela  de  contingência. 

9.  Descreva  os  métodos  para  interpretação  de  categorias  (li¬ 
nha  ou  coluna)  em  CA.  As  categorias  sempre  podem  ser  di¬ 
retamente  comparadas  com  base  em  proximidade  no  mapa 
perceptual? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustram  problemas  e 
aplicações  de  técuicas  multivariadas  em  geral  está  dispo- 
uível  ua  Web  em  www.preuhall.coru/hair  (em  iuglês). 

Referêucias 

1.  Carroll,  J.  Douglas,  Paul  E.  Green,  and  Catherine 
M.-Schaffer.  1986.  Interpoint  Distance  Comparisons  in 
Correspondence  Analysis.  Journal  of  Marketing  Research 
23  (August):  271-80. 

2.  Carroll,  J.  Douglas,  Paul  E.  Green,  and  Catherine 
M.-Schaffer.  1987.  Comparing  Interpoint  Distances  in 
Correspondence  Analysis:  A  Clarification.  Journal  of 
Marketing  Research  24  (November):  445-50. 

3.  Chang,  J.  J.,  and  J.  Douglas  Carroll.  1968.  How  to  Use 
PRQFIT,  a  Computer  Program  for  Property  Fitting-by 


Qptimizing  Nonlinear  and  Linear  Correlation.  Unpublished 
paper,  Bell  Laboratories,  Murray  Hill,  NJ. 

4.  Chang,  J.  J.,  and  J.  Douglas  Carroll.  1969.  How  to 
Use  INDSCAL,  a  Computer  Program  for  Canonical 
Decomposition  of  n-Way  Tables  and  Individual  Differences 
in  Multidimensional  Scaling.  Unpublished  paper,  Bell 
Laboratories,  Murray  Hill,  NJ. 

5.  Chang,  J.  J.,  and  J.  Douglas  Carroll.  1969.  How  to  Use 
MDPREF,  a  Computer  Program  for  Multidimensional 
Analysis  of  Preference  Data.  Unpublished  paper,  Bell 
Laboratories,  Murray  Hill,  NJ. 

6.  Chang,  J.  J.,  and  J.  Douglas  Carroll.  1972.  How  to  Use 
PREFMAP  and  PREFMAP2 — Programs  Which  Relate 
Preference  Data  to  Multidimensional  Scaling  Solution. 
Unpublished  paper,  Bell  Laboratories,  Murray  Hill,  NJ. 

7.  Green,  P.  E.  1975.  Qn  the  Robustness  of  Multidimensional 
Scaling  Techniques.  Journal  of  Marketing  Research  12 
(February):  73-81. 

8.  Green,  P.  E.,  and  F.  Carmone.  1969.  Multidimensional 
Scaling:  An  Introduction  and  Comparison  of  Nonmetric 
Unfolding  Techniques.  Journal  of  Marketing  Research  1 
(August):  33-41. 

9.  Green,  P.  E.,  F.  Carmone,  and  Scott  M.  Smith.  1989. 
Multidimensional  Scaling:  Concept  and  Applications. 
Boston:  Allyn  &  Bacon. 

10.  Green,  P.  E.,  and  Vithala  Rao.  1972.  Applied 
Multidimensional  Scaling.  New  York:  Holt,  Rinehart  and 
Winston. 

11.  Greenacre,  Michael  J.  1984.  Theory  and  Applications  of 
Correspondence  Analyses.  London:  Academic  Press. 

12.  Greenacre,  Michael  J.  1989.  The  Carroll-Green-Schaffer 
Scaling  in  Correspondence  Analysis:  A-Theoretical  and 
Empirical  Appraisal.  Journal  of  Marketing  Research  26 
(August):  358-65. 

13.  Hoffman,  Donna  L.,  and  George  R.  Franke.  1986. 
Correspondence  Analysis:  Graphical  Representation 
of  Categorical  Data  in  Marketing  Research.  Journal  of 
Marketing  Research  23  (August):  213-27. 

14.  Holbrook,  Morris  B.,  Wihiam  L.  Moore,  and  Russell  S. 
Winer.  1982.  Constructing  Joint  Spaces  from  Pick-Any 
Data:  A  New  Tool  for  Consumer  Analysis.  Journal  of 
Consumer  Research  9  (June):  99-105. 

15.  Levine,  Joel  H.  1979.  Joint-Space  Analysis  of  “Pick-Any” 
Data:  Analysis  of  Choices  from  an  Unconstrained  Set  of 
Alternatives.  Psychometrika  44  (March):  85-92. 

16.  Lingoes,  James  C.  1972.  Geometric  Representations  of 
Relational  Data.  Ann  Arbor,  MI:  Mathesis  Press. 

17.  Kruskal,  Joseph  B.,  and  Frank  J.  Carmone.  1967.  How  to 
Use  MDSCAL.  Version  5-M,  and  Qther  Useful  Information. 
Unpublished  paper,  Bell  Laboratories,  Murray  Hill,  NJ. 

18.  Kruskal,  Joseph  B.,  and  Myron  Wish.  1978. 
Multidimensional  Scaling.  Sage  University  Paper  Series  on 
Quantitative  Applications  in  the  Social  Sciences,  07-011, 
Beverly  Hills,  CA:  Sage. 

19.  Lebart,  Ludovic,  Alain  Morineau,  and  Kenneth  M.-Warwick. 
1984.  Multivariate  Descriptive  Statistical-Analysis: 
Correspondence  Analysis  and-Related  Techniques  for  Large 
Matrices.  New  York:-Wiley. 


CAPÍTULO  9  Escalonamento  Multidimensional  e  Análise  de  Correspondência  535 


20.  Maholtra,  Naresh.  1987.  Validity  and  Structural  Reliability 
of  Multidimensional  Scaling.  Journal  of  Marketing 
Research  24  (May):  164-73. 

21.  Market  ACTION  Research  Software,  Inc.  1989. 
MAPWISE:  Perceptual  Mapping  Software.  Peoria,-lL: 
Business  Technology  Center,  Bradley-University. 

22.  Raymond,  Charles.  1974.  The  Art  of  Using  Science  in 
Marketing.  New  York:  Harper  &  Row. 


23.  Schiffman,  Susan  S.,  M.  Lance  Reynolds,  and  Forrest  W. 
Young.  1981.  Introduction  to  Multidimensional  Scaling. 
New  York:  Academic  Press. 

24.  Smith,  Scott  M.  1989.  PC-MDS:  A  Multidimensional 
Statistics  Package.  Provo,  UT:  Brigham  Young  University. 

25.  Srinivasan,  V.,  and  A.  D.  Schocker.  1973.  Linear 
Programming  Techniques  for  Multidimensional  Analysis 
of  Preferences.  Psychometrika  38  (September):  337-69. 


S  E  Ç  A  o 


Para  Além  das  Técnicas  Básicas 


VISÃO  GERAL 

Esta  seção  oferece  uma  introdução  simples  e  concisa  a  algu¬ 
mas  das  técnicas  de  vanguarda  que  estão  agora  emergindo 
na  análise  multivariada.  Muito  freqüentemente  a  adoção  de 
uma  nova  técnica  é  retardada  pela  mistificação  de  especialis¬ 
tas  que  não  passam  ou  não  podem  passar  seu  conhecimento 
para  outros.  Além  disso,  os  pesquisadores  de  hoje  estão  dian¬ 
te  de  diversas  técnicas  novas  e  animadoras  que  se  proliferam 
mais  do  que  nunca  e  que  podem  estender  suas  capacidades 
para  lidar  com  problemas  que  eram  difíceis  ou  até  impossíveis 
de  resolver  antes.  Assim,  esta  seção  oferece  uma  introdução 
estendida  de  algumas  dessas  técnicas  para  fornecer  ao  lei¬ 
tor  uma  compreensão  geral  dos  procedimentos,  o  conheci¬ 
mento  de  quando  elas  podem  ser  aplicadas,  e  um  conheci¬ 
mento  de  seu  funcionamento  que  deve  viabilizar  ao  usuário  a 
aplicação  dessas  técnicas  em  problemas  básicos.  De  forma 
alguma  seremos  capazes  de  cobrir  tudo  o  que  há  de  novo 
em  análise  multivariada.  Selecionamos,  então,  um  importante 
avanço  para  se  lidar  com  múltiplas  relações  de  dependência 
(modelagem  de  equações  estruturais).  Ela  representa  a  técni¬ 
ca  multivariada  que  mais  tem  crescido  em  popularidade  nos 
últimos  20  anos. 


CAPÍTULOS  NA  SEÇÃO  IV 

A  Seção  IV  contém  três  capítulos.  O  Capítulo  10  fornece  uma 
visão  geral  da  modelagem  de  equações  estruturais  (SEM),  um 
procedimento  para  acomodar  erro  de  mensuração  (ou  erro  de 
medida)  diretamente  na  estimação  de  uma  série  de  relações 
de  dependência.  É  o  melhor  procedimento  multivariado  para 
testar  a  validade  de  construto  e  as  relações  teóricas  entre 
conceitos  representados  por  múltiplas  variáveis  medidas. 
Antes  da  introdução  da  SEM,  este  processo  iria  requerer  a 
aplicação  de  diversas  ferramentas  estatísticas  e  o  resultado 


seria  um  exame  menos  satisfatório.  A  modelagem  de  equa¬ 
ções  estruturais  tem  sido  amplamente  aceita  na  comunidade 
acadêmica,  mas  tem  conquistado  pouco  uso  em  outras  áreas 
devido,  em  parte,  á  curva  de  aprendizagem  percebida  asso¬ 
ciada  com  tal  método.  Não  queremos  subestimar  os  esforços 
envolvidos,  mas  nenhum  pesquisador  deveria  evitar  a  SEM 
apenas  por  esse  motivo,  pois  os  princípios  da  análise  fatorial 
e  da  regressão  múltipla  formam  a  fundamentação  para  a  com¬ 
preensão  da  SEM. 

Seguindo  a  visão  geral  básica,  o  Capítulo  11  é  devotado 
à  análise  fatorial  confirmatória,  a  qual  estende  as  idéias  ante¬ 
riormente  apresentadas  quando  discutimos  a  análise  fatorial 
exploratória.  Agora,  porém,  o  pesquisador  deve  desempenhar 
um  papel  mais  ativo  ao  desenvolver  e  especificar  uma  teoria 
que  determinará  quantos  fatores  devem  existir  em  um  conjun¬ 
to  de  variáveis  e  como  elas  se  relacionam  ou  se  apresentam 
em  termos  de  cargas  sobre  um  número  menor  de  fatores.  É 
fornecido  um  teste  sobre  o  quão  bem  esta  teoria  se  ajusta  aos 
dados  que  permite  ao  leitor  examinar  diretamente  a  validade 
de  construto  neste  conjunto  de  medidas. 

O  Capítulo  12  é  dedicado  ao  teste  de  relações  teóricas  en¬ 
tre  os  fatores  representados  por  múltiplas  variáveis.  O  objetivo 
aqui  é  testar  a  estrutura  de  relações  entre  os  fatores.  Portanto, 
é  conceitualmente  semelhante  à  condução  de  análise  de  re¬ 
gressão  usando-se  um  conjunto  de  escalas  múltiplas  de  ava¬ 
liação,  sendo  que  cada  uma  delas  representa  um  fator  que 
pode  ser  recuperado  com  análise  fatorial.  Usando  SEM,  o  pes¬ 
quisador  pode  avaliar  a  força  de  relações  entre  dois  fatores 
quaisquer  com  maior  precisão,  pois  a  SEM  corrige  a  relação 
quanto  a  erro  de  medida.  Além  disso,  um  teste  geral  de  ajuste 
é  fornecido  para  viabilizar  ao  pesquisador  uma  avaliação  da 
validade  de  um  conjunto  pré-especificado  de  hipóteses,  com 
cada  uma  delas  representando  uma  relação  de  regressão  en¬ 
tre  fatores.  Uma  vez  que  o  Capítulo  1 1  permite  um  exame  di¬ 
reto  da  validade  de  uma  teoria  de  mensuração,  o  Capítulo  12 
descreve  técnicas  que  culminam  em  um  exame  detalhado  da 
teoria  estrutural  que  descreve  como  fatores-chave  de  resulta¬ 
dos  são  afetados  por  outros  fatores-chave  de  entrada. 


CAPITULO 


Modelagem  de  Equações  Estruturais: 
Uma  Introdução 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Entender  as  características  distintivas  da  SEM. 

■  Diferenciar  variáveis  de  construtos. 

■  Entender  a  modelagem  de  equações  estruturais  e  como  ela  pode  ser  vista  eomo  uma 
combinação  de  técnicas  multivariadas  conhecidas. 

■  Conhecer  as  condições  básicas  para  causalidade  e  como  SEM  pode  ajudar  a  estabelecer 
uma  relação  de  causa  e  efeito. 

■  Explicar  os  tipos  de  relações  envolvidas  na  SEM. 

■  Entender  que  o  objetivo  da  SEM  é  explicar  covariância  e  como  isso  se  traduz  no  ajuste  de  um 
modelo. 

■  Saber  como  representar  visualmente  um  modelo  SEM  com  um  diagrama  de  caminhos. 

■  Listar  os  seis  estágios  de  modelagem  de  equações  estruturais  e  compreender  o  papel  da 
teoria  no  processo. 


Apresentação  do  capítulo 

Um  dos  principais  objetivos  de  técnicas  multivariadas  é  expandir  a  habilidade  explanatória  do  pesqui¬ 
sador  e  a  eficiência  estatística.  Regressão  múltipla,  análise  fatorial,  análise  multivariada  de  variância, 
análise  discriminante  e  as  outras  técnicas  discutidas  em  capítulos  anteriores  fornecem  ao  pesquisador 
ferramentas  poderosas  para  resolver  uma  vasta  gama  de  questões  administrativas  e  teóricas.  Todas 
elas  também  compartilham  de  uma  limitação  em  comum:  cada  técnica  pode  examinar  somente  uma 
relação  por  vez.  Mesmo  as  técnicas  que  permitem  múltiplas  variáveis  dependentes,  como  a  análise 
multivariada  de  variância  e  a  análise  canônica,  ainda  representam  apenas  uma  relação  entre  as  variá¬ 
veis  dependentes  e  independentes. 

Muito  comumente,  porém,  o  pesquisador  se  defronta  com  um  conjunto  de  questões  inter-relaciona¬ 
das.  Por  exemplo,  quais  variáveis  determinam  a  imagem  de  uma  loja?  Como  essa  imagem  se  combina 
com  outras  variáveis  para  afetar  decisões  de  compra  e  satisfação  com  a  loja?  Como  satisfação  com 
a  loja  resulta  em  lealdade  a  longo  prazo  com  a  mesma?  Essa  série  de  questões  tem  importância  ad¬ 
ministrativa  e  teórica.  No  entanto,  nenhuma  das  técnicas  multivariadas  que  examinamos  nos  permite 
tratar  de  todas  essas  questões  com  um  só  método  abrangente.  Em  outras  palavras,  esses  métodos  não 
nos  permitem  testar  a  teoria  inteira  do  pesquisador  com  uma  técnica  que  considere  toda  a  informação 
possível .  Por  essa  razão,  examinamos  agora  a  técnica  de  modelagem  de  equações  estruturais  (SEM), 
uma  extensão  de  diversas  técnicas  multivariadas  que  já  estudamos,  mais  precisamente  da  regressão 
múltipla  e  da  análise  fatorial. 

Como  brevemente  descrito  no  Capítulo  1,  a  modelagem  de  equações  estruturais  pode  examinar 
uma  série  de  relações  de  dependência  simultaneamente.  Ela  é  particularmente  útil  para  testar  teorias 
que  contêm  múltiplas  equações  envolvendo  relações  de  dependência.  Em  outras  palavras,  se  acredi¬ 
tamos  que  uma  imagem  cria  satisfação,  e  satisfação  cria  lealdade,  então  satisfação  é  uma  variável  de- 
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pendente  e  independente  na  mesma  teoria.  Assim,  uma  variável  presumivelmente  dependente  se  torna 
independente  em  uma  relação  subseqüente  de  dependência.  Nenhuma  dessas  técnicas  anteriores  nos 
permite  avaliar  ambas  as  propriedades  de  medida  e  testar  as  relações  teóricas  importantes  em  uma  só 
abordagem.  A  SEM  ajuda  a  tratar  desses  tipos  de  questões. 


Termos-chave 

Antes  de  começar  o  capítulo,  leia  os  termos-chave  para  com¬ 
preender  os  conceitos  e  a  terminologia  empregados.  Ao  longo 
do  capítulo,  os  termos-chave  aparecem  em  negrito.  Outros 
pontos  que  merecem  destaque,  além  das  referências  cruza¬ 
das  nos  termos-chave,  estão  em  itálico.  Exemplos  ilustrativos 
estão  em  quadros. 

Abordagem  baseada  em  modelos  Método  de  substituição 
para  dados  perdidos  no  qual  valores  são  estimados  para 
dados  perdidos  com  base  em  todos  os  dados  não-perdidos 
para  um  dado  respondente.  Os  métodos  mais  usados  são  a 
estimação  de  máxima  verossimilhança  (ML)  de  valores  perdi¬ 
dos  e  EM,  que  envolve  estimação  de  máxima  verossimilhança 
das  médias  e  covariãncias,  tendo-se  os  dados  perdidos. 
Abordagem  de  caso  completo  Método  para  lidar  com  dados 
perdidos  que  computa  valores  com  base  em  dados  de  so¬ 
mente  casos  completos,  ou  seja,  casos  sem  dados  perdidos. 
Também  conhecido  como  eliminação  listwise. 

Abordagem  de  disponibilidade  Método  para  lidar  com  dados 
perdidos  que  computa  valores  com  base  em  todas  as  obser¬ 
vações  válidas  disponíveis.  Também  conhecido  como  elimi¬ 
nação  aos  pares. 

Ajuste  Ver  qualidade  de  ajuste. 

Análise  confirmatória  Uso  de  uma  técnica  multivariada  para 
testar  (confirmar)  uma  relação  pré-especificada.  Por  exemplo, 
suponha  que  teorizemos  que  apenas  duas  variáveis  deveriam 
ser  preditoras  de  uma  variável  dependente.  Se  testarmos 
empiricamente  a  significãncia  desses  dois  preditores  e  a  não 
significância  de  todos  os  outros,  esse  teste  será  uma  análise 
confirmatória.  É  o  oposto  de  análise  exploratória. 

Análise  de  caminhos  Termo  geral  para  um  método  que  empre¬ 
ga  correlações  bivariadas  simples  para  estimar  as  relações 
em  um  modelo  SEM.  A  análise  de  caminhos  busca  determinar 
os  pontos  fortes  dos  caminhos  mostrados  em  diagramas  de 
caminhos. 

Análise  exploratória  Análise  que  define  possíveis  relações 
apenas  na  forma  mais  geral  e  então  permite  que  a  técnica 
multivariada  estime  relações.  O  oposto  da  análise  confirma¬ 
tória,  0  pesquisador  não  busca  confirmar  quaisquer  relações 
especificadas  anteriormente  à  análise,  mas,  ao  invés  disso, 
deixa  0  método  e  os  dados  definirem  a  natureza  das  relações. 
Um  exemplo  é  a  regressão  múltipla  stepwise,  na  qual  o  méto¬ 
do  acrescenta  variáveis  preditoras  até  que  algum  critério  seja 
satisfeito. 

Atribuição  Processo  de  estimação  dos  dados  perdidos  de  uma 
observação  baseado  em  valores  válidos  das  outras  variáveis. 
O  objetivo  é  empregar  relações  conhecidas  que  possam  ser 
identificadas  nos  valores  válidos  da  amostra  para  auxiliar  na 
representação  ou  mesmo  na  estimação  das  substituições 


para  valores  perdidos.  Ver  também  abordagem  totalmente 
disponível,  de  caso  completo,  e  baseada  em  modelo  para 
dados  perdidos. 

Causalidade  Princípio  pelo  qual  causa  e  efeito  são  estabeleci¬ 
dos  entre  duas  variáveis.  Ele  requer  que  exista  um  grau  sufi¬ 
ciente  de  associação  (covariância)  entre  as  duas  variáveis, 
que  uma  variável  ocorra  antes  da  outra  (que  uma  variável  seja 
claramente  o  resultado  da  outra),  e  que  não  existam  outras 
causas  razoáveis  para  o  resultado.  Apesar  de  causalidade 
ser  raramente  encontrada  em  seu  sentido  estrito,  na  prática, 
forte  apoio  teórico  pode  tornar  possível  a  estimação  empírica 
de  causalidade. 

Completamente  perdidos  ao  acaso  (MCAR)  Classificação  de 
dados  perdidos  aplicável  quando  valores  perdidos  de  Y  não 
dependem  de  X.  Quando  os  dados  perdidos  são  MCAR,  os 
valores  observados  de  Y  são  uma  amostra  verdadeiramente 
aleatória  de  todos  os  valores  de  Y,  sem  um  processo  inerente 
que  acrescente  viés  aos  dados  observados. 

Comunalidade  Quantia  total  de  variância  que  uma  variável  me¬ 
dida  tem  em  comum  com  os  construtos  sobre  os  quais  ela 
tem  carga.  A  prática  da  boa  medição  sugere  que  cada  variá¬ 
vel  medida  deve  carregar  sobre  apenas  um  construto.  Logo, 
ela  pode  ser  imaginada  como  a  variância  explicada  em  uma 
variável  medida  pelo  construto.  Em  CEA,  ela  é  chamada  de 
correlação  múltipla  quadrada  para  uma  variável  medida.  Ver 
também  variância  extraída  no  próximo  capítulo. 

Confiabilidade  Medida  do  grau  em  que  um  conjunto  de  indica¬ 
dores  de  um  construto  latente  é  internamente  consistente  em 
suas  mensurações.  Os  indicadores  de  construtos  altamente 
confiáveis  são  altamente  intercorrelacionados,  indicando  que 
eles  todos  parecem  medir  a  mesma  coisa.  A  confiabilidade 
de  item  individual  pode  ser  computada  como  f  ,0  menos  o 
erro  de  mensuração.  Note  que  elevada  confiabilidade  não 
garante  que  um  construto  está  representando  aquilo  que  de¬ 
veria.  É  uma  condição  necessária,  porém  não  suficiente  para 
validade. 

Construto  Conceito  inobservável  ou  latente  que  o  pesquisador 
pode  definir  em  termos  teóricos  mas  que  não  pode  ser  di¬ 
retamente  medido  (p.ex.,  o  respondente  não  pode  articular 
uma  única  resposta  que  fornecerá  total  e  perfeitamente  uma 
medida  do  conceito)  ou  medido  sem  erro  (ver  erro  de  men¬ 
suração).  Um  construto  pode  ser  definido  em  diversos  graus 
de  especificidade,  variando  de  conceitos  muito  limitados  até 
aqueles  mais  complexos  ou  abstratos,  como  inteligência  ou 
emoções.  Não  importa  qual  o  seu  nível  de  especificidade,  po¬ 
rém,  um  construto  não  pode  ser  medido  direta  e  perfeitamen¬ 
te,  mas  deve  ser  medido  aproximadamente  por  indicadores 
múltiplos. 

Construto  latente  Operacionalização  de  um  construto  em 
modelagem  de  equações  estruturais.  Um  construto  latente 
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não  pode  ser  diretamente  medido,  mas  pode  ser  represen¬ 
tado  ou  medido  por  uma  ou  mais  variáveis  {indicadores).  Por 
exemplo,  a  atitude  de  uma  pessoa  em  relação  a  um  produto 
jamais  pode  ser  medida  precisamente  a  ponto  de  não  haver 
incerteza,  mas  fazendo-se  várias  perguntas  podemos  avaliar 
muitos  aspectos  da  atitude  dessa  pessoa.  Em  combinação, 
as  respostas  a  tais  questões  fornecem  uma  medida  razoa- 
velmenfe  precisa  do  construto  lafente  (atitude)  para  um  in¬ 
divíduo. 

Construtos  endógenos  Latente,  equivalente  multi-item  a  variá¬ 
veis  dependentes.  Um  construto  endógeno  é  representado 
por  uma  variável  estatística  de  variáveis  dependentes.  Em 
termos  de  um  diagrama  de  caminhos,  uma  ou  mais  setas  (in¬ 
dicações)  conduzem  até  o  construto  endógeno. 

Construtos  exógenos  Latente,  equivalente  multl-ltem  de  va¬ 
riáveis  Independentes.  Eles  são  construtos  determinados  por 
fatores  fora  do  modelo. 

Diagrama  de  caminhos  Representação  visual  de  um  modelo  e 
do  conjunto  completo  de  relações  entre  os  construtos  do  mo¬ 
delo.  Relações  de  dependência  são  representadas  por  setas 
retilíneas,  apontando  da  variável  preditora  para  a  variável  ou 
construto  dependente.  Setas  curvas  correspondem  a  correla¬ 
ções  entre  construtos  ou  indicadores,  mas  nenhuma  causali¬ 
dade  élmpWcada. 

Erro  de  mensuração  Grau  em  que  as  variáveis  que  pode¬ 
mos  medir  não  descrevem  perfeitamente  o(s)  construto(s) 
latente(s)  de  interesse.  Fontes  de  erro  de  mensuração  podem 
variar  de  simples  erros  de  entrada  de  dados  a  definição  de 
construtos  (p.ex.,  conceitos  abstratos  como  patriotismo  ou  le¬ 
aldade,  que  significam  muitas  coisas  para  diferentes  pessoas) 
que  não  são  perfeitamente  caracterizados  por  um  conjunto 
de  variáveis  medidas.  Para  fins  práticos,  todos  os  construtos 
têm  algum  erro  de  mensuração,  mesmo  com  as  melhores  va¬ 
riáveis  indicadoras.  No  entanto,  o  objetivo  do  pesquisador  é 
minimizar  a  quantia  de  erro  de  mensuração.  SEM  pode  levar 
em  conta  erro  de  mensuração  a  fim  de  fornecer  estimativas 
mais  precisas  das  relações  entre  construtos. 

Estatística  de  diferença  (Ax^)  de  qui-quadrado  (x^)  Mode¬ 
los  SEM  concorrentes  aninhados  podem  ser  comparados 
usando-se  esta  estatística,  que  é  a  diferença  simples  entre 
as  estatísticas  (x^)  de  cada  modelo  e  tem  número  de  graus 
de  liberdade  igual  á  diferença  nos  graus  de  liberdade  dos 
modelos. 

Estimação  de  máxima  verossimiihança  (MLE)  Método  de  es¬ 
timação  comumente  empregado  em  modelos  de  equações 
estruturais.  Uma  alternativa  aos  usuais  mínimos  quadrados 
usados  em  regressão  múltipla,  MLE  é  um  procedimento  que 
melhora  por  iterações  as  estimativas  de  parâmetros  para  mi¬ 
nimizar  uma  função  de  ajuste  especificada. 

Estratégia  de  desenvoivimento  de  modeio  Estratégia  de  mo¬ 
delagem  estrutural  que  incorpora  reespecifioação  de  modelo 
como  um  método  teoricamente  orientado  de  melhoria  de  um 
modelo  especificado  empiricamente.  Isso  permite  explora¬ 
ção  de  formulações  alternativas  de  modelos  que  podem  ser 
apoiadas  por  teoria.  Uma  estrutura  básica  de  modelo  é  pro¬ 
posta,  e  a  meta  do  esforço  de  modelagem  é  melhorar  esta 


estrutura  através  de  modificações  dos  modelos  estrutural  el 
ou  de  mensuração.  O  modelo  modificado  seria  validado  com 
novos  dados.  Não  corresponde  a  uma  abordagem  explo¬ 
ratória  na  qual  reespeoificações  de  modelo  são  feitas  sem 
base  teórica. 

Estratégia  de  modeiagem  confirmatória  Estratégia  que  avalia 
estatisticamente  um  único  modelo  quanto  ao  seu  ajuste  aos 
dados  observados.  Essa  abordagem  é  realmente  menos  ri¬ 
gorosa  do  que  a  estratégia  de  modelos  concorrentes,  pois  ela 
não  considera  modelos  alternativos  que  possam  se  ajustar 
melhor  ou  tão  bem  como  o  modelo  proposto. 

Estratégia  de  modeios  concorrentes  Estratégia  de  modela¬ 
gem  que  compara  o  modelo  proposto  com  vários  modelos 
alternativos  em  uma  tentativa  de  demonstrar  que  não  existe 
modelo  de  melhor  ajuste.  Isso  é  particularmente  relevante  em 
modelagem  de  equações  estruturais  porque  um  modelo  pode 
ter  ajuste  apenas  aceitável,  mas  ajuste  somente  aceitável  não 
garante  que  um  outro  modelo  não  se  ajustará  de  melhor  forma 
ou  tão  bem  quanto. 

Fator  iatente  Ver  construto  latente. 

Graus  de  iiberdade  (df)  O  número  de  bits  de  informação  dispo¬ 
nível  para  estimar  a  distribuição  amostrai  dos  dados  depois 
que  todos  os  parâmetros  do  modelo  tenham  sido  estimados. 
Em  modelos  SEM,  graus  de  liberdade  são  o  número  de  corre¬ 
lações  ou  covariãncias  não  redundantes  na  matriz  de  entrada 
menos  o  número  de  coeficientes  estimados.  O  pesquisador 
tenta  maximizar  os  graus  de  liberdade  disponíveis  enquanto 
ainda  obtém  o  modelo  de  melhor  ajuste.  Cada  coeficiente  es¬ 
timado  “consome  completamente”  um  grau  de  liberdade.  Um 
modelo  jamais  pode  estimar  mais  coeficientes  do  que  o  nú¬ 
mero  de  correlações  ou  covariãncias  não  redundantes,  o  que 
significa  que  zero  é  o  limite  inferior  para  os  graus  de  liberdade 
de  qualquer  modelo. 

Indicador  Valor  observado  (também  chamado  de  variável  me¬ 
dida  ou  manifesta)  usado  como  uma  medida  de  um  construto 
latente  que  não  pode  ser  medido  diretamente.  O  pesquisador 
deve  especificar  quais  indicadores  são  associados  com  cada 
construto  latente. 

índices  de  ajuste  de  parcimônia  Medidas  de  qualidade  de 
ajuste  geral  representando  o  grau  de  ajuste  de  modelo  por 
coeficiente  estimado.  Esta  medida  tenta  corrigir  qualquer 
superajuste  do  modelo  e  avalia  a  proporção  de  parcimô¬ 
nia  do  modelo  em  comparação  com  a  qualidade  de  ajuste. 
Essas  medidas  complementam  os  outros  dois  tipos  de  me¬ 
didas  de  qualidade  de  ajuste,  o  ajuste  absoluto  e  o  ajuste 
incremental. 

índices  de  ajuste  incremental  Grupo  de  índices  de  qualidade 
do  ajuste  que  avaliam  o  quão  bem  um  modelo  especificado 
se  ajusta  relativamente  a  algum  modelo  de  referência  alterna¬ 
tivo.  Mais  comumente,  o  modelo  de  referência  é  um  modelo 
nulo  especificando  que  todas  as  variáveis  medidas  são  não 
relacionadas  entre  si.  Complementa  os  outros  dois  tipos  de 
medidas  de  qualidade  de  ajuste,  as  de  ajuste  absoluto  e  de 
ajuste  parcimonioso. 

Inferência  causai  Relação  de  dependência  de  duas  ou  mais 
variáveis  na  qual  o  pesquisador  claramente  especifica  que 
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uma  ou  mais  variáveis  causam  ou  criam  um  resuitado  repre¬ 
sentado  por  peio  menos  uma  outra  variável.  Deve  atender  às 
exigências  de  causalidade. 

LISREL  O  programa  SEM  mais  amplamente  usado.  O  nome  é 
derivado  de  Linear  Structural  RELations  (relações  estruturais 
lineares). 

Matriz  de  covariância  amostrai  observada  Matriz  típica  de  en¬ 
trada  para  estimação  de  SEM  composta  das  variâncias  e  co- 
variâncias  observadas  para  cada  variável  medida.  É  normal¬ 
mente  abreviada  com  uma  letra  S  maiúscula  em  negrito  (S) 

Matriz  de  covariância  estimada  Matriz  de  covariância  com¬ 
posta  das  covariâncias  previstas  entre  todas  as  variáveis  in¬ 
dicadoras  envolvidas  em  uma  SEM  baseada  nas  equações 
que  representam  o  modelo  teorizado.  Tipicamente  abreviada 
como  Sfc. 

Medida  de  ajuste  absoluto  Medida  de  qualidade  de  ajuste  ge¬ 
ral  para  os  modelos  estrutural  e  de  mensuração  coletivamen¬ 
te.  Esse  tipo  de  medida  não  faz  qualquer  comparação  com 
um  modelo  nulo  especificado  {medida  de  ajuste  inoremental) 
ou  ajuste  para  o  número  de  parâmetros  no  modelo  estimado 
{medida  de  ajuste  parcimonioso). 

Modelagem  de  equações  estruturais  (SEM)  Técnica  multi¬ 
variada  que  combina  aspectos  de  análise  fatorial  e  de  re¬ 
gressão  múltipla  que  permite  ao  pesquisador  examinar 
simultaneamente  uma  série  de  relações  de  dependência 
inter-relacionadas  entre  as  variáveis  medidas  e  construtos 
iatentes  {variáveis  estatísticas),  bem  como  entre  diversos 
construtos  latentes. 

Modelo  Representação  e  operacionalização  de  uma  teoria.  Um 
modelo  convencional  em  terminologia  SEM  consiste  de  duas 
partes.  A  primeira  parte  é  o  modeio  de  mensuração.  Ele  re¬ 
presenta  a  teoria  que  mostra  como  variáveis  medidas  se  jun¬ 
tam  para  representar  oonstrutos.  A  segunda  parte  é  o  modeio 
estrutural,  que  mostra  como  os  construtos  são  associados 
uns  com  os  outros,  geralmente  com  múltiplas  relações  de  de¬ 
pendência.  O  modelo  pode  ser  formalizado  em  um  diagrama 
de  caminhos. 

Modelo  aninhado  Um  modelo  é  aninhado  dentro  de  outro  se 
tem  0  mesmo  número  de  construtos  e  pode  ser  formado  a 
partir  de  outro  modelo  alterando-se  as  relações.  A  forma  mais 
comum  de  modelo  aninhado  ocorre  quando  uma  única  rela¬ 
ção  é  acrescentada  ou  eliminada  de  um  outro  modelo.  Logo, 
0  modelo  com  menos  relações  estimadas  está  aninhado  den¬ 
tro  do  modelo  mais  geral. 

Modelo  de  mensuração  Uma  SEM  que  (1 )  especifica  os  indica¬ 
dores  para  cada  construto,  e  (2)  viabiliza  a  avaliação  de  va¬ 
lidade  de  construto.  É  o  primeiro  de  dois  passos  importantes 
em  uma  análise  completa  de  modelo  estrutural,  e  é  discutido 
com  mais  detalhes  no  Capítulo  1 1 . 

Modelo  estrutural  Conjunto  de  uma  ou  mais  relações  de  de¬ 
pendência  conectando  os  construtos  hipoteticamente  previs¬ 
tos  do  modelo.  O  modelo  estrutural  é  mais  útil  para  represen¬ 
tar  as  inter-relações  de  variáveis  entre  construtos. 

Modelo  nulo  Ponto  de  referência  ou  padrão  de  comparação 
usado  em  índices  de  ajuste  incremental.  O  modelo  nulo  é  con¬ 


siderado,  por  hipótese,  como  o  mais  simples  que  pode  ser 
teoricamente  justificado. 

Modelos  equivalentes  Modelos  SEM  envolvendo  a  mesma 
matriz  de  covariância  observada  com  o  mesmo  ajuste  e  com 
0  mesmo  número  de  graus  de  liberdade  {modelos  aninha¬ 
dos),  mas  que  diferem  em  um  ou  mais  caminhos.  O  número 
de  modelos  equivalentes  se  expande  rapidamente  conforme 
a  complexidade  do  modelo  aumenta,  e  demonstra  explica¬ 
ções  alternativas  que  se  ajustam  tão  bem  quanto  o  modelo 
proposto. 

Multicolinearidade  Extensão  em  que  um  construto  pode  ser 
explicado  pelos  demais  na  anãlise.  Quando  a  multicolineari¬ 
dade  aumenta,  ela  complica  a  interpretação  de  relações,  pois 
é  mais  difícil  averiguar  o  efeito  de  qualquer  construto  em  es¬ 
pecial  devido  a  suas  inter-relações. 

Operacionalização  de  um  construto  Processo-chave  no  mo¬ 
delo  de  mensuração  que  envolve  a  determinação  das  variá¬ 
veis  medidas  que  representarão  um  construto  e  a  maneira  na 
qual  elas  serão  medidas. 

Parâmetro  fixado  Parâmetro  que  tem  um  valor  especificado 
pelo  pesquisador.  Geralmente  o  valor  é  especificado  como 
zero,  indicando  ausência  de  relação,  apesar  de  que  em  al¬ 
guns  casos  um  valor  não  nulo  (como  1,0  ou  algo  assim)  pode 
ser  especificado. 

Parâmetro  livre  Parâmetro  estimado  pelo  programa  de  equa¬ 
ção  estrutural  para  representar  a  força  de  uma  relação  es¬ 
pecificada.  Esses  parâmetros  podem  ocorrer  no  modelo  de 
mensuração  (mais  freqüentemente  denotando  cargas  de  in- 
dioadores  para  construtos)  bem  como  no  modelo  estrutural 
(relações  entre  construtos). 

Perdidos  ao  acaso  (MAR)  Classificação  de  dados  perdidos 
aplicável  quando  valores  perdidos  de  Y  dependem  de  X, 
mas  não  de  Y.  Quando  dados  perdidos  são  MAR,  dados 
observados  para  Y são  uma  amostra  verdadeiramente  alea¬ 
tória  para  os  valores  de  X  na  amostra,  mas  não  uma  amostra 
aleatória  de  todos  os  valores  de  Y devido  a  valores  perdidos 
de  X. 

Proporção  de  parcimônia  Comparação  dos  graus  de  liberdade 
(df)  entre  um  modelo  especificado  e  o  número  total  de  graus 
de  liberdade  disponíveis.  Representa  a  extensão  em  que  o 
modelo  utiliza  o  número  total  de  graus  de  liberdade  disponí¬ 
vel.  Permite  a  avaliação  do  superajuste  do  modelo  com  rela¬ 
ções  adicionais  que  conquistam  apenas  pequenos  ganhos  no 
ajuste  do  modelo. 

Qualidade  de  ajuste  (GOF)  Medida  indicando  o  quão  bem  um 
modelo  especificado  reproduz  a  matriz  de  covariância  entre 
as  variáveis  indicadoras. 

Qualidade  de  desajuste  Uma  perspectiva  alternativa  de  qua¬ 
lidade  de  ajuste  na  qual  valores  maiores  representam  ajuste 
pior.  Exemplos  incluem  a  raiz  do  erro  quadrático  médio  de 
aproximação  ou  a  raiz  padronizada  do  resíduo  quadrático 
médio. 

Qui-quadrado  (x^)  Medida  estatística  de  diferença  usada  para 
comparar  as  matrizes  de  covariância  observada  e  estimada. 
É  a  única  medida  que  tem  um  teste  estatístico  direto  quanto  ã 
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sua  significância,  e  forma  a  base  para  muitas  outras  medidas 
de  qualidade  de  ajuste. 

Reespecificação  de  modelo  Modificação  de  um  modelo  exis¬ 
tente  com  parâmetros  estimados  para  corrigir  parâmetros 
inadequados  encontrados  no  prooesso  de  estimação  ou  para 
criar  um  modelo  concorrente  para  comparação. 

Relação  de  dependência  Uma  relação  do  tipo  regressão  re¬ 
presentada  por  uma  seta  de  um  só  sentido  que  aponta  de 
uma  variável  independente  ou  construto*  para  uma  variávei 
dependente  ou  construto.  Relações  típicas  de  dependência 
em  SEM  conectam  construtos  a  variáveis  medidas  e  constru- 
tos  preditores  a  construtos  resuitantes. 

Relação  estrutural  Relação  de  dependência  (do  tipo  regres¬ 
são)  especificada  entre  dois  construtos  latentes  quaisquer. 
Reiações  estruturais  são  representadas  com  uma  seta  em  um 
só  sentido  e  sugerem  que  um  construto  é  dependente  do  ou¬ 
tro.  Construtos  exógenos  não  podem  ser  dependentes  de  ou¬ 
tro  construto.  Construtos  endógenos  podem  ser  dependentes 
de  construtos  exógenos  ou  endógenos  (ver  Capítulo  12  para 
mais  detaihes). 

Relação  ilegítima  Uma  reiação  que  é  faisa  ou  enganosa.  Uma 
ocorrência  comum  na  qual  uma  relação  pode  ser  espúria  é 
quando  uma  variável  construto  omitida  explica  causa  e  efeito 
(ou  seja,  a  relação  entre  construtos  originais  se  torna  não-sig- 
nificante  diante  do  acréscimo  do  construto  omitido). 

Resíduo  A  diferença  entre  o  valor  real  e  o  estimado  para  qual¬ 
quer  relação.  Em  análises  SEM,  resíduos  são  as  diferenças 
entre  as  matrizes  de  covariância  observadas  e  estimadas  por 
ajuste. 

Teoria  Um  conjunto  sistemático  de  relações  que  fornece  uma 
explicação  consistente  e  abrangente  de  fenômenos.  Na  práti¬ 
ca,  uma  teoria  é  a  tentativa  de  um  pesquisador  em  especificar 
0  conjunto  inteiro  de  relações  de  dependência  que  explicam 
um  conjunto  particular  de  resultados.  Uma  teoria  pode  ser  ba¬ 
seada  em  idéias  geradas  a  partir  de  uma  ou  mais  de  três  fon¬ 
tes  principais:  (1)  pesquisa  empírica  prévia;  (2)  experiências 
passadas  e  observações  de  comportamento  real,  atitudes, 
ou  outros  fenômenos;  e  (3)  outras  teorias  que  fornecem  uma 
perspectiva  para  análise. 

Validade  de  construto  Extensão  em  que  um  conjunto  de  variá¬ 
veis  medidas  realmente  representa  o  construto  latente  teórico 
que  elas  são  projetadas  para  medir.  Detalhes  são  discutidos 
no  Capítulo  11. 

Variável  estatística  Uma  combinação  linear  de  variáveis  medi¬ 
das  que  representa  um  construto  latente. 

Variável  latente  Ver  construto  latente. 

Variável  manifesta  Ver  variável  medida. 

Variável  medida  Valor  observado  (medido)  de  um  item  ou  ques¬ 
tão  específica,  obtido  de  respondentes  em  resposta  a  ques¬ 
tões  (como  em  um  questionário)  ou  a  partir  de  algum  tipo  de 
observação.  Variáveis  medidas  são  usadas  como  indicadores 
de  construtos  latentes.  O  mesmo  que  variável  manifesta. 


*  N.  de  R.  T:  A  relação  de  dependência  pode  ocorrer  entre  construtos 
(em  um  sentido  estrutural)  ou  entre  construtos  e  variáveis  (em  um  sen¬ 
tido  de  mensuração). 


O  QUE  É  MODELAGEM  DE 
EQUAÇÕES  ESTRUTURAIS? 

Modelagem  de  equações  estruturais  (SEM)  é  uma  fa¬ 
mília  de  modelos  estatísticos  que  buscam  explicar  as 
relações  entre  múltiplas  variáveis.  Fazendo  isso,  ela 
examina  a  estrutura  de  inter-relações  expressas  em  uma 
série  de  equações,  semelhante  a  uma  série  de  equações 
de  regressão  múltipla.  Tais  equações  descrevem  todas 
as  relações  entre  construtos  (as  variáveis  dependentes 
e  independentes)  envolvidos  na  análise.  Construtos  são 
inobserváveis  ou  fatores  latentes  representados  por  múl¬ 
tiplas  variáveis  (como  variáveis  representando  um  fator 
em  análise  fatorial).  Até  aqui,  cada  técnica  multivaria- 
da  foi  classificada  como  uma  técnica  de  dependência 
ou  interdependência.  A  SEM  pode  ser  vista  como  uma 
combinação  única  de  ambos  os  tipos  de  técnicas,  pois 
a  fundamentação  da  SEM  encontrada  em  dois  métodos 
multivariados  conhecidos:  análise  fatorial  e  análise  de 
regressão  múltipla. 

A  SEM  é  conhecida  por  muitos  nomes:  análise  estrutu¬ 
ral  de  covariância,  análise  de  variável  latente,  e,  às  vezes, 
simplesmente  pelo  nome  do  pacote  computacional  espe¬ 
cializado  usado  (p.ex.,  um  modelo  LISREL  ou  AMOS). 
Apesar  de  diferentes  caminhos  poderem  ser  usados  para 
testar  modelos  SEM,  todos  os  modelos  de  equações  estru¬ 
turais  são  distinguidos  por  três  características: 

1.  Estimação  de  relações  de  dependência  múltiplas  e  inter- 
relacionadas 

2.  Uma  habilidade  para  representar  conceitos  não  observados 
nessas  relações  e  corrigir  erro  de  mensuração  no  processo 
de  estimação. 

3.  Definição  de  um  modelo  para  explicar  o  conjunto  inteiro  de 
relações 

Estimação  de  múltiplas  relações  de 
dependência  inter-relacionadas 

A  diferença  mais  óbvia  entre  SEM  e  outras  técnicas  mul- 
tivariadas  é  o  uso  de  relações  separadas  para  cada  con¬ 
junto  de  variáveis  dependentes.  Em  termos  simples,  SEM 
estima  uma  série  de  equações  de  regressão  múltipla  se¬ 
paradas,  mas  interdependentes,  simultaneamente,  pela 
especificação  do  modelo  estrutural  usado  pelo  programa 
estatístico.  Primeiro,  o  pesquisador  baseia-se  em  teoria, 
experiência  prévia  e  nos  objetivos  da  pesquisa  para  dis¬ 
tinguir  quais  variáveis  independentes  prevêem  cada  va¬ 
riável  dependente.  Em  nosso  exemplo  anterior,  primeiro 
queríamos  prever  imagem  da  loja.  Em  seguida  queríamos 
usar  imagem  da  loja  para  prever  satisfação,  sendo  que 
ambas  foram  usadas  para  prever  lealdade  à  loja.  Assim, 
algumas  variáveis  dependentes  se  tornam  independentes 
em  relações  subseqüentes,  dando  origem  à  natureza  inter¬ 
dependente  do  modelo  estrutural.  Além  disso,  muitas  das 
mesmas  variáveis  afetam  cada  uma  das  variáveis  depen- 
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dentes,  mas  com  diferentes  efeitos.  O  modelo  estrutural 
expressa  essas  relações  entre  variáveis  independentes  e 
dependentes,  mesmo  quando  uma  variável  dependente  se 
torna  independente  em  outras  relações. 

As  relações  propostas  são  então  traduzidas  em  uma 
série  de  equações  estruturais  (semelhantes  a  equações 
de  regressão)  para  cada  variável  dependente.  Essa  carac¬ 
terística  coloca  SEM  como  um  caso  à  parte  das  técnicas 
discutidas  anteriormente  que  acomodam  múltiplas  variá¬ 
veis  dependentes  -  análise  multivariada  de  variância  e 
correlação  canônica  -  no  sentido  de  que  elas  permitem 
apenas  uma  relação  entre  variáveis  dependentes  e  inde¬ 
pendentes. 

Incorporação  de  variáveis  latentes 
qne  não  medimos  diretamente 

A  SEM  também  tem  a  habilidade  de  incorporar  variáveis 
latentes  na  análise.  Um  construto  latente  (também  cha¬ 
mado  de  variável  latente)  é  um  conceito  teorizado  e  não 
observado  que  pode  ser  representado  por  variáveis  obser¬ 
váveis  ou  mensuráveis.  Ele  é  medido  indiretamente  pelo 
exame  de  consistência  entre  múltiplas  variáveis  medidas, 
algumas  vezes  chamadas  de  variáveis  manifestas,  ou  indi¬ 
cadores,  os  quais  são  reunidos  através  de  vários  métodos 
de  coleta  de  dados  (como  levantamentos,  testes  e  méto¬ 
dos  observacionais). 

Os  benefícios  do  emprego  de  construtos  latentes 

Porém,  por  que  iríamos  querer  usar  uma  variável  latente 
que  não  podemos  medir  diretamente,  em  vez  de  medidas 
exatas  que  os  respondentes  forneceram?  Apesar  de  isso 
poder  soar  como  uma  abordagem  absurda  ou  de  “caixa- 
preta”,  esse  procedimento  tem  justificativa  prática  e  teó¬ 
rica.  Ou  seja,  ele  melhora  a  estimação  estatística,  repre¬ 
senta  melhor  conceitos  teóricos  e  explica  diretamente  o 
erro  de  mensuração. 

Melhoramento  da  estimação  estatística  A  teoria  es¬ 
tatística  nos  diz  que  um  coeficiente  de  regressão  é  na 
realidade  composto  de  dois  elementos:  o  coeficiente 
estrutural  verdadeiro  entre  a  variável  dependente  e  a 
independente,  e  a  confiabilidade  da  variável  preditora. 
Confiabilidade  é  um  indicador  do  grau  em  que  um  con¬ 
junto  de  indicadores  de  um  construto  latente  é  interna¬ 
mente  consistente  com  base  em  quão  altamente  inter- 
relacionados  são  os  indicadores.  Em  outras  palavras,  ela 
representa  a  extensão  em  que  todos  eles  medem  a  mes¬ 
ma  coisa.  Erro  resulta  no  grau  em  que  eles  não  medem  a 
mesma  coisa.  E  importante  observar,  porém,  que  mesmo 
elevada  confiabilidade  não  garante  que  algum  constru¬ 
to  é  medido  com  precisão.  Esta  conclusão  envolve  uma 
avaliação  de  validade,  que  será  discutida  no  próximo  ca¬ 
pítulo.  Confiabilidade  é  uma  condição  necessária,  porém 
não  suficiente  para  validade. 


Em  todas  as  técnicas  multivariadas  até  aqui  abordadas, 
consideramos  que  não  tínhamos  erro  em  nossas  variáveis. 
Sabemos  de  perspectivas  práticas  e  teóricas  que  não  po¬ 
demos  medir  com  perfeição  um  conceito  e  que  sempre 
existe  algum  grau  de  erro  de  mensuração.  Por  exemplo, 
quando  questionadas  sobre  algo  tão  direto  quanto  renda 
familiar,  sabemos  que  algumas  pessoas  responderão  incor¬ 
retamente,  seja  para  exagerar  ou  para  reduzir  a  quantia, 
ou  simplesmente  por  não  saberem  o  valor  precisamente. 
As  respostas  dadas  têm  algum  erro  de  mensuração,  afe¬ 
tando  desse  modo  a  estimação  do  verdadeiro  coeficiente 
estrutural. 

O  impacto  do  erro  de  mensuração  (e  a  correspon¬ 
dente  confiabilidade  diminuída)  pode  ser  mostrado 
a  partir  de  uma  expressão  do  coeficiente  de  regressão 
como  sendo 

P  =  P  *  P 

onde  é  o  coeficiente  de  regressão  observado,  é  o 
verdadeiro  coeficiente  estrutural,  e  é  a  confiabilida¬ 
de  da  variável  preditora.  A  menos  que  a  confiabilidade 
seja  de  100%,  a  correlação  observada  (e  o  coeficiente 
de  regressão  resultante)  sempre  subestimará  a  verda¬ 
deira  relação.  Esperamos  fortalecer  os  coeficientes  em 
nossos  modelos  de  dependência  e  torná-los  estimativas 
mais  precisas  dos  coeficientes  estruturais,  de  modo  que  a 
diminuição  das  correlações  observadas  seja  atribuível  a 
qualquer  número  de  problemas  de  mensuração. 

Representação  de  conceitos  teóricos.  Erro  de  mensura¬ 
ção  não  é  causado  apenas  por  respostas  imprecisas.  Acon¬ 
tece  também  quando  usamos  conceitos  mais  abstratos  ou 
teóricos,  como  motivações  para  comportamento  ou  cren¬ 
ças  em  geral  (p.  ex.,  patriotismo).  Com  conceitos  como 
esses,  o  pesquisador  tenta  delinear  as  melhores  questões 
para  medir  o  conceito,  sabendo  que  os  indivíduos  podem 
interpretar  qualquer  questão  de  maneira  diferente,  mas 
que  o  coletivo  representará  melhor  o  conceito  do  que 
qualquer  item  em  especial  [11].  Os  respondentes  também 
podem  estar  de  algum  modo  inseguros  sobre  como  res¬ 
ponder,  ou  podem  interpretar  as  questões  de  um  modo 
diferente  daquele  que  o  pesquisador  pretendia  transmitir. 
Ambas  as  situações  podem  originar  erros  de  mensuração. 
Se  conhecemos  a  magnitude  do  problema,  podemos  in¬ 
corporar  a  confiabilidade  à  estimação  estatística  e  melho¬ 
rar  nosso  modelo  de  dependência. 

Especificação  de  erro  de  mensuração.  Como  explicamos 
erro  de  mensuração?  A  SEM  fornece  o  modelo  de  mensu¬ 
ração,  o  qual  especifica  as  regras  de  correspondência  en¬ 
tre  variáveis  medidas  e  latentes.  O  modelo  de  mensuração 
permite  ao  pesquisador  utilizar  qualquer  quantia  de  variá¬ 
veis  para  um  só  conceito  independente  ou  dependente  e 
então  estimar  (ou  especificar)  a  confiabilidade. 
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Em  nosso  exemplo  de  imagem  de  loja,  satisfação  e  leal¬ 
dade,  cada  um  desses  itens  poderia  ser  definido  como  um 
construto  latente  que  seria  representado  por  um  conjun¬ 
to  de  questões  (como  a  escala  múltipla  introduzida  no 
Capítulo  3).  No  modelo  de  mensuração,  o  pesquisador 
determina  as  questões  específicas  que  são  associadas 
com  cada  construto  (p.ex.,  questões  sobre  qualidade  es¬ 
tética  são  associadas  com  imagem,  mas  não  com  satis¬ 
fação  ou  lealdade).  Em  seguida,  a  SEM  pode  avaliar  a 
contribuição  de  cada  item  na  representação  de  seu  cons¬ 
truto  associado,  medir  quão  bem  um  conjunto  de  medi¬ 
das  representa  o  conceito  (sua  confiabilidade),  e  então 
incorporar  tal  informação  à  estimação  das  relações  entre 
os  construtos. 


Esse  procedimento  é  semelhante  a  executar  uma  aná¬ 
lise  fatorial  dos  itens  de  escala  e  usar  os  escores  fatoriais 
na  regressão.  Essas  semelhanças  são  discutidas  em  uma 
seção  adiante  deste  capítulo. 

Distinção  entre  construtos  latentes 
exógenos  e  endógenos 

Lembre-se  que  em  regressão  múltipla,  análise  discri¬ 
minante  múltipla  (MDA)  e  MANOVA  era  importante 
diferenciar  variáveis  independentes  de  dependentes. 
Analogamente,  em  SEM  deve  ser  feita  uma  distinção 
assemelhada.  Contudo,  como  agora  estamos  geralmente 
prevendo  construtos  latentes  com  outros  construtos  la¬ 
tentes,  uma  terminologia  diferente  é  empregada. 

Construtos  exógenos  são  os  equivalentes  latentes, 
multi-itens  de  variáveis  independentes.  Como  tais,  eles 
usam  uma  variável  estatística  de  medidas  para  repre¬ 
sentar  o  construto,  o  qual  atua  como  uma  variável  inde¬ 
pendente  no  modelo.  Eles  são  determinados  por  fatores 
externos  ao  modelo  (ou  seja,  não  são  explicados  por 
qualquer  outro  construto  ou  variável  no  modelo),  o  que 
explica  o  termo  independente.  Modelos  SEM  são  fre- 
qüentemente  descritos  por  um  diagrama  visual,  tornando 
útil  saber  como  descrever  um  construto  exógeno.  Elma 
vez  que  ele  é  independente  de  qualquer  outro  construto 
no  modelo,  visualmente  um  construto  exógeno  não  apre¬ 
senta  caminhos  (setas  em  um  só  sentido)  que  cheguem  ao 
mesmo  a  partir  de  outro  construto  ou  variável.  Discuti¬ 
mos  as  questões  sobre  construção  de  diagrama  visual  na 
próxima  seção. 

Construtos  endógenos  são  os  equivalentes  latentes, 
multi-itens  de  variáveis  dependentes  (ou  seja,  uma  variá¬ 
vel  estatística  de  variáveis  dependentes  individuais).  Tais 
construtos  são  teoricamente  determinados  por  fatores 
dentro  do  modelo.  Assim,  eles  são  dependentes  de  outros 
construtos,  e  esta  dependência  é  visualmente  representa¬ 
da  por  um  caminho  que  chega  em  um  construto  endóge¬ 
no  a  partir  de  um  exógeno  (ou  a  partir  de  outro  construto 
endógeno,  como  vemos  adiante). 


Definição  de  um  modelo 

Um  modelo  é  uma  representação  de  uma  teoria.  Uma 
teoria  pode  ser  imaginada  como  um  conjunto  sistemá¬ 
tico  de  relações  que  fornecem  uma  explicação  consis¬ 
tente  e  abrangente  de  fenômenos.  A  partir  dessa  defini¬ 
ção,  percebemos  que  teoria  não  é  domínio  exclusivo  da 
vida  acadêmica,  mas  pode  ser  radicada  na  experiência  e 
prática,  pela  observação  do  comportamento  do  mundo 
real. 

Um  modelo  convencional  em  terminologia  SEM 
consiste,  na  verdade,  de  dois  modelos,  o  de  mensuração 
(representando  como  variáveis  medidas  se  unem  para 
representar  construtos)  e  o  modelo  estrutural  (que  mos¬ 
tra  como  construtos  são  associados  entre  si).  O  Capítulo 
11  é  dedicado  à  primeira  parte  da  SEM,  ou  o  modelo  de 
mensuração,  enquanto  o  Capítulo  12  trata  de  questões  da 
segunda  parte  da  SEM,  que  é  o  modelo  estrutural. 

Importância  da  teoria 

Um  modelo  não  deve  ser  desenvolvido  sem  alguma  teoria 
inerente.  Teoria,  com  freqüência,  é  um  objetivo  básico  da 
pesquisa  acadêmica,  mas  praticantes  podem  desenvolver 
ou  propor  um  conjunto  de  relações  que  são  complexas 
e  inter-relacionadas  como  qualquer  teoria  de  origem 
acadêmica.  Logo,  pesquisadores  de  universidades  e  da 
indústria  podem  se  beneficiar  das  ferramentas  analíticas 
exclusivas  fornecidas  pela  SEM.  Discutimos  em  uma  se¬ 
ção  posterior  questões  específicas  para  o  estabelecimento 
de  uma  base  teórica  para  seu  modelo  SEM,  particular¬ 
mente  no  que  se  refere  à  definição  de  causalidade.  Em 
todos  os  casos,  a  análise  SEM  deve  ser  ditada  por  uma 
forte  base  teórica. 

Um  retrato  visual  do  modelo 

Um  modelo  SEM  completo  que  consista  de  modelos  de 
mensuração  e  estrutural  pode  ser  bastante  complexo. 
Existem  muitas  maneiras  para  especificar  todas  as  rela¬ 
ções  em  uma  notação  matemática  (ver  Apêndice  lOA 
para  mais  detalhes),  mas  muitos  pesquisadores  acham 
mais  conveniente  retratar  um  modelo  de  uma  forma  vi¬ 
sual  conhecida  como  diagrama  de  caminhos.  Este  retrato 
visual  das  relações  emprega  convenções  específicas  tanto 
para  construtos  quanto  para  variáveis  medidas  e  as  rela¬ 
ções  entre  elas. 

Descrição  dos  construtos  envolvidos  em  um  modelo  de 
equações  estruturais.  Construtos  latentes  podem  ser  re¬ 
lacionados  com  variáveis  medidas  via  uma  relação  de  de¬ 
pendência.  Não  se  trata  de  uma  relação  de  dependência 
entre  construtos.  Ao  invés  disso,  variáveis  medidas  são 
consideradas  como  dependentes  dos  construtos.  Assim, 
em  uma  SEM  típica,  a  seta  é  desenhada  dos  construtos  la¬ 
tentes  para  as  variáveis  que  são  indicadoras  de  construtos. 
Essas  variáveis  são  chamadas  de  indicadores  porque  ne¬ 
nhuma  variável  isolada  pode  representar  completamente 
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um  construto,  mas  pode  ser  usada  como  indicadora  do 
mesmo.  O  pesquisador  deve  justificar  a  base  teórica  dos 
indicadores,  pois  a  SEM  examina  apenas  as  característi¬ 
cas  empíricas  das  variáveis.  O  Capítulo  11  discute  como 
avaliar  a  qualidade  das  mensurações  resolvendo  uma 
SEM.  Aqui  nos  concentramos  em  como  são  descritas  as 
relações  de  medidas. 

Os  princípios  básicos  na  construção  de  um  diagra¬ 
ma  de  caminhos  de  um  modelo  de  mensuração  são  os 
seguintes: 

•  Auxiliar  a  distinguir  os  indicadores  para  construtos  endó¬ 
genos  versus  exógenos;  variáveis  medidas  (indicadores) 
para  construtos  exógenos  são  geralmente  chamadas  de 
variáveis  X,  enquanto  indicadores  de  construtos  endóge¬ 
nos  são  denotados  por  variáveis  Y. 

•  Comumente,  construtos  são  representados  por  elipses  ou 
círculos,  enquanto  variáveis  medidas  são  representadas 
por  quadrados. 

•  As  variáveis  medidas  X  e/ou  Y  são  associadas  com  seus 
respectivos  construtos  por  uma  seta  que  parte  dos  cons¬ 
trutos  para  a  variável  medida. 

A  Figura  10-la  ilustra  a  maneira  de  descrever  a  rela¬ 
ção  entre  um  construto  e  uma  de  suas  variáveis  medidas. 
Observe  que  possivelmente  o  construto  será  indicado  por 
múltiplas  variáveis  medidas,  e,  assim,  a  descrição  mais  co¬ 
mum  é  aquela  apresentada  na  Figura  10-lb. 


Descrição  de  relações  estruturais.  Um  modelo  estrutu¬ 
ral  envolve  a  especificação  de  relações  estruturais  entre 
construtos  latentes.  A  especificação  de  uma  relação  geral¬ 
mente  significa  que  especificamos  a  existência  ou  não  de 
uma  relação.  Se  existe,  uma  seta  é  esboçada;  se  nenhuma 
relação  é  esperada,  então  nenhuma  seta  é  desenhada.  Em 
algumas  ocasiões,  a  especificação  também  pode  significar 
que  um  certo  valor  é  especificado  para  uma  relação.  Dois 
tipos  de  relações  são  possíveis  entre  construtos:  de  depen¬ 
dência  e  correlacionais  (covariância). 

Relações  de  dependência.  Setas  retas  descrevem 
uma  relação  de  dependência  -  o  impacto  de  um  constru¬ 
to  sobre  outro  ou  sobre  uma  variável.  Em  um  sentido  de 
mensuração,  relações  de  dependência  ocorrem  de  constru¬ 
tos  para  variáveis.  Em  um  sentido  estrutural,  relações  de 
dependência  ocorrem  entre  construtos.  As  setas  apontam 
do  efeito  antecedente  (variável  independente)  para  o  sub- 
seqüente  ou  resultado  (variável  dependente).  Esta  relação 
é  descrita  na  Figura  10-lb.  Em  uma  seção  posterior,  discu¬ 
timos  questões  envolvidas  na  especifica  ção  de  causalida¬ 
de,  que  é  uma  forma  especial  de  relação  de  dependência. 

A  especificação  de  relações  de  dependência  também 
determina  se  um  construto  é  considerado  exógeno  ou 
endógeno.  Lembre-se  que  um  construto  endógeno  atua 
como  uma  variável  dependente,  e  qualquer  construto 
com  um  caminho  de  dependência  (seta)  apontando  para 
o  mesmo  é  considerado  endógeno.  Um  construto  exóge- 


(a)  Relação  entre  um 
construto  e  uma 
variável  medida 


(b)  Relação  entre  um 
construto  e  múltiplas 
variáveis  medidas 


(c)  Relação  de  dependência 
entre  dois  construtos 
(uma  relação  estrutural) 


(d)  Relação  via  correlações 
entre  construtos 


FIGURA  10-1 


Tipos  comuns  de  relações  teóricas  em  um  modelo  SEM. 
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no  tem  apenas  relações  correlacionais  com  outros  cons- 
trutos  (ou  seja,  nenhum  caminho  de  dependência  che¬ 
gando  ao  construto). 


A  Figura  10-2a  ilustra  visualmente  um  modelo  SEM  sim¬ 
ples  via  descrição  de  um  único  construto  exógeno  e  um 
único  endógeno.  Primeiro,  cada  construto  tem  quatro  in¬ 
dicadores  denotados  por  a  X^  para  os  exógenos  e  Fj  a 
para  os  endógenos.  Segundo,  a  relação  de  dependên¬ 
cia  entre  os  construtos  exógeno  e  endógeno  é  descrita 
pela  seta  retilínea  entre  eles. 


geno.  Assim,  as  mesmas  variáveis  rotuladas  a  Y^  no 
primeiro  modelo  são  agora  X^  a  X^.  As  variáveis  medi¬ 
das  em  si  não  mudaram  nada,  apenas  suas  designações 
no  modelo.  Finalmente,  a  seta  reta  é  substituída  por  uma 
seta  curva  representando  a  relação  por  correlação. 


Relações  correlacionais  (covariância).  Em  alguns 
casos,  o  pesquisador  deseja  especificar  uma  correlação 
simples  entre  construtos  exógenos.  O  pesquisador  acredi¬ 
ta  que  os  construtos  são  correlacionados,  mas  não  assume 
que  um  é  dependente  do  outro.  Tal  relação  é  descrita  por 
uma  conexão  via  seta  de  dois  sentidos,  como  se  mostra 
na  Figura  10-ld.  Um  construto  exógeno  não  pode  com¬ 
partilhar  este  tipo  de  relação  com  um  endógeno.  Apenas 
uma  relação  de  dependência  pode  existir  entre  construtos 
exógenos  e  endógenos. 


O  pesquisador  determina  se  construtos  são  exógenos 
ou  endógenos  com  base  na  teoria  sob  teste.  Cada  cons¬ 
truto  retém  os  mesmos  indicadores.  A  única  distinção  é 
que  o  papel  deles  no  modelo  mudou.  Um  único  modelo 
SEM  pode  conter  relações  tanto  de  dependência  quanto 
correlacionais. 

Combínção  de  relações  de  dependência  e  correlacionais.  A 

descrição  de  um  conjunto  de  relações  em  um  diagrama 
de  caminhos  tipicamente  envolve  uma  combinação  de  re¬ 
lações  de  dependência  e  correlacionais  entre  construtos 
exógenos  e  endógenos.  O  pesquisador  pode  especificar 
qualquer  combinação  de  relações  que  têm  suporte  teóri¬ 
co  para  as  questões  de  pesquisa  em  mãos.  Os  exemplos  a 
seguir  ilustram  como  relações  podem  envolver  elementos 
de  dependência  e  correlacionais  e  ainda  acomodar  rela- 


FIGURA  10-2  Representação  visual  de  relações  em  modelos  de  mensuração  e  estrutural  em  um  modelo  SEM  simples. 
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Relações  causais 

Variáveis  Variáveis 

independentes  dependentes 


Xi  X2  ► 

(a) 

Xi  X2  .  y, 

X2  y^  ►  y2 

(b) 

Xi  X2  ►  y^ 

Xg  X3  y^  yg - -  y2 

y^  y2  ►  yg 

(c) 


Diagrama  de  caminhos 


Xi  X2 


Xi  X2 


yi  — ^  yg 


/ 


Y,  — ►  yg 

\  / 


>^3 


FIGURA  10-3  Representação  de  relações  de  dependência  e  correlacionais  por  meio  de  diagramas  de  caminhos. 


(Continuação) 

lação  com  uma  só  equação,  de  forma  parecida  com  o  que 
fizemos  em  nossa  discussão  sobre  regressão  múltipla. 

Na  Figura  10-3b,  acrescentamos  um  segundo  constru- 
to  endógeno,  Yj.  Agora,  além  do  modelo  e  da  equação 
mostrada  na  Figura  10-3b,  acrescentamos  uma  segun¬ 
da  equação  que  mostra  a  relação  entre  X2  e  Yj  com  Yj. 
Aqui  podemos  perceber  pela  primeira  vez  o  papel  único 
desempenhado  pela  SEM  quando  mais  de  uma  relação 
compartilha  construtos.  Queremos  saber  os  efeitos  de 
sobre  Yj,  os  efeitos  de  Aj  sobre  Yj  e  simultaneamente 
os  efeitos  de  Aj  e  Yj  sobre  Yj.  Se  não  os  estimássemos 
de  uma  forma  consistente,  não  estaríamos  seguros  para 
representar  seus  efeitos  separados  e  verdadeiros.  Por 
exemplo,  tal  técnica  é  necessária  para  mostrar  os  efeitos 
de  Aj  sobre  Y^  e  Yj. 

As  relações  se  tornam  ainda  mais  entrelaçadas  na  Fi¬ 
gura  10-3c,  com  três  construtos  dependentes,  cada  um 
relacionado  aos  demais,  bem  como  com  os  independen¬ 
tes.  Uma  relação  recíproca  (seta  retilínea  de  dois  sen¬ 
tidos)  ocorre  até  mesmo  entre  Yj  e  Y3.  Esta  relação  é 
exibida  nas  equações  a  partir  do  momento  em  que  Yj 
aparece  como  preditor  de  Yj,  e  Y3  como  preditor  de  Yj. 
Não  é  possível  expressar  todas  as  relações  nas  Figuras 
10-3b  ou  10-3c  em  uma  única  equação.  Equações  sepa¬ 
radas  são  exigidas  para  cada  construto  dependente.  A 
necessidade  de  um  método  que  possa  estimar  todas  as 
equações  simultaneamente  é  atendida  pela  SEM. 


Estes  exemplos  são  apenas  uma  prévia  quanto  aos  ti¬ 
pos  de  relações  que  podem  ser  retratadas  e  então  empiri¬ 
camente  examinadas  através  da  SEM.  Dada  a  habilidade 
dos  modelos  de  se  tornarem  complexos  muito  facilmente. 


é  até  mais  importante  usar  teoria  como  um  fator  guia  para 
especificação  dos  modelos  de  mensuração  e  estrutural. 
Posteriormente,  neste  capítulo  e  nos  Capítulos  11  e  12, 
discutimos  os  critérios  pelos  quais  o  pesquisador  pode  es¬ 
pecificar  modelos  SEM  com  mais  detalhes. 

Quão  bem  o  modelo  se  ajusta? 

E  importante  também  lembrar  que  em  contraste  à  análise 
de  regressão  ou  outras  técnicas  de  dependência,  as  quais 
buscam  explicar  relações  em  uma  só  equação,  o  objetivo 
estatístico  da  SEM  é  testar  um  conjunto  de  relações  que 
representam  múltiplas  equações.  Portanto,  medidas  de 
ajuste  ou  de  precisão  preditiva  para  outras  técnicas  (ou 
seja,  para  regressão  múltipla,  precisão  de  classificação 
em  análise  discriminante,  ou  significância  estatística  em 
MANOVA)  não  são  adequadas  para  SEM.  O  que  se  faz 
necessário  é  uma  medida  de  ajuste  ou  precisão  preditiva 
que  reflita  o  modelo  geral  e  não  qualquer  relação  em  es¬ 
pecial.  Além  disso,  a  maioria  das  demais  técnicas  multi- 
variadas  decompõe  a  variância  estatisticamente.  A  SEM 
analisa  covariância,  no  lugar  disso.  Tal  distinção  é  uma 
diferença  importante  em  termos  da  teoria  analítica  e  esta¬ 
tística  inerente  à  SEM. 

A  SEM  usa  uma  série  de  medidas  que  descrevem  quão 
bem  a  teoria  de  um  pesquisador  explica  a  matriz  de  cova¬ 
riância  observada  entre  variáveis  medidas.  Se  o  modelo 
proposto  estima  propriamente  todas  as  relações  substan¬ 
tivas  entre  construtos,  e  o  modelo  de  mensuração  define 
adequadamente  os  construtos,  então  deveria  ser  possível 
a  estimação  de  uma  matriz  de  covariância  entre  variáveis 
medidas  que  se  aproxime  bastante  da  matriz  de  covari¬ 
ância  observada.  Discutimos  com  mais  detalhes  o  pro¬ 
cesso  de  estimação  de  uma  matriz  de  covariância  a  partir 
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do  modelo  proposto,  juntamente  com  várias  medidas  de 
ajuste,  em  seções  que  se  seguem  neste  capítulo,  bem  como 
nos  Capítulos  11  e  12. 

Resumo 

A  modelagem  de  equações  estruturais  examina  uma  série 
de  relações  de  dependência  simultaneamente.  Ela  é  parti¬ 
cularmente  útil  quando  uma  variável  dependente  se  torna 
independente  em  relações  subseqüentes  de  dependência. 
Este  conjunto  de  relações,  cada  uma  com  variáveis  depen¬ 
dentes  e  independentes,  é  a  base  da  SEM.  Como  vimos, 
uma  fundamentação  teórica  válida  para  delinear  uma  aná¬ 
lise  SEM  é  uma  necessidade,  pois  a  definição  de  modelos 
de  mensuração  e  estruturais  é  completamente  controlada 
pelo  pesquisador.  Distinções  como  aquela  entre  relações 
de  dependência  e  as  correlacionais  ou  as  medidas  associa¬ 
das  com  cada  construto  têm  um  profundo  impacto  sobre  o 
modelo  resultante.  No  entanto,  com  suporte  teórico  ade¬ 
quado,  a  SEM  se  torna  uma  poderosa  ferramenta  analítica 
para  acadêmicos  e  profissionais  que  estudam  relações  com¬ 
plexas  em  muitas  áreas. 


SEM  E  OUTRAS  TÉCNICAS 
MULTIVARIADAS 

Todo  construto  de  múltiplos  itens  em  um  modelo  SEM 
pode  ser  imaginado  como  uma  variável  estatística.  Logo,  é 
claro  que  a  SEM  é  uma  técnica  multivariada.  A  SEM  é  mais 
apropriada  quando  o  pesquisador  tem  múltiplos  constru- 
tos,  cada  um  representado  por  diversas  variáveis  medidas, 
e  estes  construtos  são  distinguidos  com  base  na  informação 
de  serem  exógenos  ou  endógenos.  Construtos  exógenos  são 
usados  para  prever  e  explicar  os  endógenos.  Neste  sentido, 
a  SEM  mostra  semelhança  com  outras  técnicas  multivaria- 
das  de  dependência,  como  MANOVA  e  análise  de  regres¬ 
são  múltipla.  Além  disso,  o  modelo  de  mensuração  parece 
similar  em  forma  e  função  com  a  análise  fatorial.  Discuti¬ 
mos  as  semelhanças  de  SEM  com  técnicas  de  dependência 
e  de  interdependência  nas  próximas  seções. 

Similaridade  com  técnicas  de  dependência 

Uma  semelhança  óbvia  da  SEM  é  com  regressão  múltipla, 
uma  das  técnicas  de  dependência  mais  utilizadas.  Relações 
para  cada  construto  endógeno  podem  ser  escritas  em  uma 
forma  semelhante  a  uma  equação  de  regressão.  O  constru¬ 
to  endógeno  é  a  variável  dependente,  e  as  independentes 
são  os  construtos  com  setas  apontando  para  o  construto 
endógeno.  Uma  diferença  importante  em  SEM  é  que  um 
construto  que  atua  como  variável  independente  em  uma 
relação  pode  ser  a  variável  dependente  em  outra.  Assim, 
SEM  permite  que  todas  as  relações/equações  sejam  simul¬ 
taneamente  estimadas. 


A  SEM  também  pode  ser  usada  para  representar 
outras  técnicas  de  dependência.  Ainda  que  as  variáveis 
medidas  em  SEM  sejam  pelo  menos  ordinais  e  freqüen- 
temente  contínuas,  variações  dos  modelos  padrão  SEM 
podem  ser  usadas  para  representarem  variáveis  categó¬ 
ricas  não-métricas,  e  um  modelo  MANOVA  pode,  des¬ 
sa  maneira,  ser  examinado  usando-se  SEM.  Isso  permi¬ 
te  ao  pesquisador  tirar  proveito  da  habilidade  de  SEM 
para  acomodar  erro  de  mensuração,  por  exemplo,  em 
um  contexto  de  MANOVA. 

Similaridade  com  técnicas  de  interdependência 

À  primeira  vista,  o  modelo  de  mensuração,  associando 
variáveis  medidas  com  construtos,  parece  idêntico  à  aná¬ 
lise  fatorial,  onde  variáveis  têm  cargas  sobre  fatores  (ver 
Capítulo  3  para  uma  discussão  mais  detalhada).  Apesar 
dessa  grande  semelhança,  como  a  interpretação  da  força 
da  relação  de  cada  variável  com  o  construto  (conhecida 
como  uma  carga  em  análise  fatorial),  uma  diferença  é 
crítica.  A  análise  fatorial  deste  tipo  é  basicamente  uma 
técnica  de  análise  exploratória  que  busca  por  estrutura 
entre  variáveis  definindo  fatores  em  termos  de  conjuntos 
de  variáveis.  Como  tal,  cada  variável  tem  uma  carga  sobre 
cada  fator. 

A  SEM  é  o  oposto  de  uma  técnica  exploratória.  Ela  re¬ 
quer  que  o  pesquisador  especifique  quais  variáveis  são  as¬ 
sociadas  com  cada  construto,  e  então  cargas  são  estimadas 
somente  onde  variáveis  são  associadas  com  construtos.  A 
distinção  não  é  tanto  de  interpretação  quanto  de  modo 
de  implementação.  Análise  fatorial  exploratória  não  exi¬ 
ge  qualquer  especificação  por  parte  do  pesquisador.  Em 
contrapartida,  a  SEM  demanda  especificação  completa  do 
modelo  de  mensuração. 

As  vantagens  do  uso  de  medidas  múltiplas  para  um 
construto,  discutidas  anteriormente  e  no  Capítulo  3,  são 
percebidas  por  meio  do  modelo  de  mensuração  em  SEM. 
Desse  modo,  os  procedimentos  de  estimação  para  o  mo¬ 
delo  estrutural  incluem  uma  correção  direta  para  erro  de 
medição.  Fazendo  isso,  as  relações  entre  construtos  são 
estimadas  com  maior  precisão. 

Resumo 

A  SEM  é  a  única  técnica  multivariada  que  permite  a 
estimação  simultânea  de  múltiplas  equações.  Essas 
equações  representam  a  maneira  como  construtos  se  re¬ 
lacionam  com  itens  de  indicadores  medidos,  bem  como 
o  modo  como  construtos  se  relacionam  entre  si.  Logo, 
quando  técnicas  SEM  são  empregadas  para  testar  uma 
teoria  estrutural,  elas  são  equivalentes  à  execução  de 
análise  fatorial  e  análise  de  regressão  em  um  passo.  A 
SEM  tem  se  tornado  um  método  extremamente  popu¬ 
lar  nas  ciências  sociais  por  conta  dessas  vantagens  es¬ 
tratégicas. 
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O  PAPEL  DA  TEORIA  EM  MODELAGEM 
DE  EQUAÇÕES  ESTRUTURAIS 

A  SEM  jamais  deve  ser  tentada  sem  uma  forte  base  teórica 
para  especificação  dos  modelos  de  mensuração  e  estrutural. 
As  seções  a  seguir  tratam  de  alguns  papéis  fundamentais  de¬ 
sempenhados  pela  teoria  em  SEM:  especificação  de  relações 
que  definem  o  modelo  e  estabelecimento  de  causalidade, 
particularmente  quando  se  usam  dados  de  cross-section*. 

Especificação  de  relações 

Apesar  de  teoria  poder  ser  importante  em  todos  os  proce¬ 
dimentos  multivariados,  ela  é  particularmente  importante 
para  a  SEM,  pois  esta  é  considerada  uma  análise  confir- 
matóría;  ou  seja,  ela  é  útil  para  testar  e  potencialmente 
confirmar  uma  teoria.  Teoria  é  necessária  para  especificar 
relações  em  modelos  estrutural  e  de  mensuração,  modi¬ 
ficações  nas  relações  propostas,  e  muitos  outros  aspectos 
da  estimação  de  um  modelo. 

De  um  ponto  de  vista  prático,  uma  abordagem  teórica 
para  SEM  é  necessária  porque  todas  as  relações  devem 
ser  especificadas  pelo  pesquisador  antes  que  o  modelo 
SEM  possa  ser  estimado.  Com  outras  técnicas  multivaria- 
das,  o  pesquisador  pode  ser  capaz  de  especificar  um  mo¬ 
delo  básico  e  permitir  valores  pré -definidos  (referenciais) 
nos  programas  estatísticos  para  “preencher”  os  demais 
aspectos  de  estimação.  Esta  opção  de  usar  valores  refe¬ 
renciais  não  é  possível  com  SEM.  Além  disso,  quaisquer 
modificações  do  modelo  devem  ser  feitas  mediante  ações 
específicas  do  pesquisador.  Assim,  quando  enfatizamos 
a  necessidade  de  justificação  teórica,  salientamos  que  a 
SEM  é  um  método  confirmatório  guiado  mais  por  teoria 
do  que  por  resultados  empíricos. 

Estabelecimento  de  causalidade 

Talvez  o  tipo  mais  forte  de  inferência  teórica  que  um  pes¬ 
quisador  pode  esboçar  é  uma  de  natureza  causal,  a  qual 
envolve  a  proposta  de  que  uma  relação  de  dependência  é, 
na  verdade,  baseada  em  causalidade.  Uma  inferência  cau¬ 
sal  envolve  uma  relação  presumida  de  causa  e  efeito.  Se 
compreendemos  a  seqüência  causal  entre  variáveis,  então 
podemos  explicar  como  alguma  causa  determina  um  dado 
efeito.  Em  termos  práticos,  o  efeito  pode  ser  pelo  menos 
parcialmente  administrado  com  algum  grau  de  certeza. 
Logo,  relações  de  dependência  podem,  às  vezes,  ser  teori¬ 
camente  assumidas  como  causais.  Contudo,  simplesmente 
imaginar  que  uma  relação  de  dependência  é  causal  não  a 
torna  de  fato  causal.  Por  isso  usamos  o  termo  causa  com 
grande  cuidado  em  SEM. 


*  N.  de  R.  T.:  A  expressão  “cross-section”  refere-se  à  seleção  de  um 
grupo  de  observações  que  é  representativo  da  população  ou  univer¬ 
so  do  qual  foi  extraído,  em  um  período  de  tempo  específico. 


Por  exemplo,  se  o  gasto  em  compras  do  cliente  pode  ser 
demonstrado  como  causa  do  compromisso  dele,  então 
sabemos  que  compromisso  pode  ser  estabelecido  pelo 
aumento  do  gasto  do  cliente.  Assim,  políticas  de  marke¬ 
ting  podem  se  focar  no  aumento  do  número  de  locações 
para  um  varejista,  como  um  esforço  para  aumentar  a  fre- 
qüência  relativa  com  a  qual  clientes  as  visitam,  criando, 
portanto,  os  gastos  dos  mesmos.  Se  gastos  e  compromis¬ 
so  estão  causalmente  relacionados  como  teorizado,  esta 
mudança  aumentará  o  compromisso  da  clientela. 


Planejamentos  de  pesquisa  causal  tradicionalmente 
envolvem  um  experimento  com  alguma  manipulação  con¬ 
trolada,  o  que  significa  uma  variável  independente  cate¬ 
górica  como  encontrada  em  MANOVA  ou  ANOVA.  Po¬ 
rém,  modelos  SEM  são  geralmente  usados  em  situações 
não-experimentais  nas  quais  os  construtos  exógenos  são 
representados  por  variáveis  indicadoras,  e  não  variáveis 
experimentalmente  controladas,  o  que  limita  a  habilidade 
do  pesquisador  para  esboçar  inferências  causais.  Em  últi¬ 
ma  instância,  a  SEM  por  si  só  não  pode  estabelecer  cau¬ 
salidade,  mas  pode  fornecer  alguma  evidência  necessária 
para  embasar  uma  inferência  causal.  Nas  seções  a  seguir, 
é  feita  uma  breve  discussão  dos  quatro  tipos  de  evidência 
(covariação,  seqüência,  covariação  legítima  e  suporte  te¬ 
órico)  necessários  para  se  estabelecer  causalidade  através 
de  SEM  [20, 37]. 

Covariação 

Como  causalidade  significa  que  uma  variação  em  uma  cau¬ 
sa  provoca  uma  variação  correspondente  em  um  efeito, 
covariância  sistemática  (correlação)  entre  causa  e  efeito  é 
necessária,  mas  não  suficiente,  para  estabelecer  causalida¬ 
de.  Como  se  faz  em  regressão  múltipla  estimando-se  a  sig- 
nificância  estatística  de  coeficientes  de  variáveis  indepen¬ 
dentes  que  afetem  a  dependente,  a  SEM  pode  determinar 
covariação  sistemática  e  estatisticamente  significante  en¬ 
tre  construtos.  Assim,  caminhos  estatisticamente  signifi- 
cantes  estimados  no  modelo  estrutural  (ou  seja,  relações 
entre  construtos)  fornecem  evidência  de  que  covariação 
está  presente.  Relações  de  dependência  entre  construtos 
são  tipicamente  os  caminhos  para  os  quais  inferências 
causais  são  mais  freqüentemente  teorizadas. 

Seqüência 

Uma  segunda  exigência  para  causalidade  é  a  seqüência 
temporal  de  eventos.  Usemos  nosso  exemplo  anterior 
como  ilustração. 


Se  uma  variação  em  gastos  de  cliente  conduz  a  uma  va¬ 
riação  no  compromisso  do  mesmo,  então  a  mudança  no 
gasto  do  cliente  não  pode  acontecer  após  a  mudança  em 
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seu  compromisso.  Se  imaginamos  muitas  peças  de  domi¬ 
nó  enfileiradas  e  a  primeira  é  derrubada  por  uma  peque¬ 
na  bola,  isso  pode  provocar  a  queda  de  todas  as  demais 
peças.  Em  outras  palavras,  a  batida  da  bola  na  primeira 
peça  de  dominó  é  a  causa  da  queda  das  outras.  Se  a  bola 
é  a  causa  deste  efeito,  ela  deve  atingir  o  primeiro  do¬ 
minó  antes  que  os  outros  caiam.  Se  as  demais  peças  de 
dominó  caírem  antes  de  a  bola  acertar  a  primeira,  então 
a  bola  não  pode  ser  a  causa  da  queda  delas. 


A  SEM  não  pode  fornecer  este  tipo  de  evidência  sem 
um  delineamento  de  pesquisa  que  envolva  um  experimen¬ 
to  ou  dados  longitudinais.  Um  experimento  pode  fornecer 
este  tipo  de  evidência  a  partir  do  momento  que  o  pesqui¬ 
sador  mantenha  controle  da  variável  causal  por  meio  de 
manipulações.  Assim,  a  pesquisa  primeiramente  mani¬ 
pula  uma  variável  e  então  observa  o  efeito.  Dados  lon¬ 
gitudinais  podem  fornecer  tal  evidência  porque  eles  nos 
permitem  explicar  o  período  de  tempo  em  que  eventos 
acontecem.  Grande  parte  da  pesquisa  em  ciências  sociais 
depende  de  levantamentos  em  cross-section.  Medir  todas 
as  variáveis  no  mesmo  instante  não  fornece  uma  maneira 
para  explicar  a  seqüência  temporal.  Logo,  teoria  deve  ser 
usada  para  argumentar  que  a  seqüência  de  efeitos  é  de  um 
construto  para  outro.  Em  nosso  exemplo,  teoria  deveria 
estabelecer  que  se  é  descoberta  covariância  entre  os  dois 
construtos,  a  mudança  no  gasto  de  clientes  ocorre  antes 
da  mudança  na  compromisso. 

Covariância  legitima 

Uma  relação  ilegítima  é  aquela  que  é  falsa  ou  enganosa. 
Uma  forma  comum  em  que  uma  relação  pode  ser  ilegíti¬ 
ma  é  quando  outro  evento  não  incluído  na  análise  explica, 
na  realidade,  tanto  causa  quanto  efeito.  Muitas  anedotas 
descrevem  o  que  acontece  com  correlação  ilegítima. 


Por  exemplo,  uma  correlação  significante  entre  consumo 
de  sorvete  e  a  possibilidade  de  afogamento  pode  ser  em¬ 
piricamente  verificada.  No  entanto,  é  seguro  dizer  que 
tomar  sorvete  provoca  afogamento?  Se  procurássemos 
por  outra  causa  em  potencial  (p.ex.,  temperatura  é  asso¬ 
ciada  com  aumento  no  consumo  de  sorvete  e  mais  ativi¬ 
dades  de  natação),  não  encontraríamos  qualquer  relação 
real  entre  consumo  de  sorvete  e  afogamentos. 

Em  nosso  exemplo  anterior,  pode-se  argumentar 
que  gastos  de  clientela  não  provocam,  na  verdade,  com¬ 
promisso.  Uma  explicação  alternativa,  por  exemplo,  é  a 
crença  de  que  preços  baixos  causam  tanto  gastos  quanto 
compromisso.  Se  o  construto  de  preço  baixo  é  medido 
com  os  outros  construtos  e  uma  relação  é  especificada 
entre  preço  e  gastos  e  compromisso  de  clientela,  então 
um  modelo  SEM  pode  determinar  se  uma  relação  obser¬ 
vada  é  ilegítima. 


Condições  sem  colinearidade.  Uma  inferência  causal 
se  torna  mais  forte  na  medida  em  que  podemos  mostrar 
que  um  terceiro  construto  não  afeta  a  relação  entre  causa 
e  efeito.  Covariância  legítima  tem  recebido  considerável 
atenção  filosófica  e  analítica.  Evidência  apoiando  a  exis¬ 
tência  de  uma  relação  de  dependência  causal  legítima 
entre  dois  construtos  (ou  variáveis)  quaisquer  deve  ser 
flexível  quando  outros  construtos  são  levados  em  conta. 
Em  termos  simples,  o  tamanho  e  a  natureza  da  relação 
entre  uma  causa  e  o  efeito  relevante  não  devem  ser  afeta¬ 
dos  pela  inclusão  de  outros  construtos  (ou  variáveis)  em 
um  modelo.  Portanto,  evidência  causal  é  mais  facilmente 
apresentada  quando  o  conjunto  de  preditores  para  algum 
efeito  é  não  relacionado  com  outro  (ver  Capítulo  4  sobre 
multicolinearidade).  Quando  colinearidade  não  está  pre¬ 
sente,  o  pesquisador  fica  mais  próximo  de  reproduzir  as 
condições  que  estão  presentes  em  um  delineamento  ex¬ 
perimental.  Essas  condições  incluem  variáveis  preditoras 
experimentais  ortogonais  ou  não-correlacionadas. 

Condições  com  multicolinearidade.  Infelizmente,  a 
maioria  dos  modelos  estruturais  envolve  múltiplos  cons¬ 
trutos  preditores.  Freqüentemente,  os  construtos  predi¬ 
tores  exibem  alguma  relação  (multicolinearidade)  com 
os  outros  preditores  e  o  construto  efeito,  tornando  uma 
inferência  causal  menos  evidente.  Pode  ser  argumenta¬ 
do  também  que  o  erro  observado  de  previsão  deve  ser 
não-relacionado  com  o  construto  causal,  a  fim  de  que  evi¬ 
dência  causal  esteja  presente.  Logo,  nos  modelos  SEM 
envolvendo  pesquisa  cross-section,  evidência  causal  é  su¬ 
portada  em  um  âmbito  maior  quando  a  relação  entre  uma 
causa  e  um  efeito  permanece  constante,  mesmo  quando 
outros  construtos  preditores  são  incluídos  no  modelo, 
e  quando  o  erro  do  construto  efeito  é  independente  do 
construto  causal  [37,  42]. 

Teste  de  relações  ilegítimas.  A  Figura  10-4  mostra  um 
exemplo  de  teste  para  uma  relação  legítima.  Um  modelo 
SEM  pode  ser  usado  para  testar  se  a  verdadeira  causa  está 
relacionada  com  o  efeito  por  meio  de  um  teste  de  dois 
modelos  SEM.  Um  deles  especifica  uma  relação  simples, 
e  o  segundo  inclui  outras  causas  potenciais  como  variá¬ 
veis  preditoras  também.  Se  a  relação  estimada  entre  cons¬ 
trutos  permanece  inalterada  quando  os  preditores  extras 
são  adicionados,  então  a  relação  é  considerada  legítima. 
No  entanto,  se  a  relação  se  torna  não-signiflcante  com  o 
acréscimo  dos  demais  preditores,  então  a  relação  deve  ser 
considerada  ilegítima. 


Neste  exemplo,  assuma  que  a  SEM  estima  uma  relação 
de  0,50  entre  os  construtos  (Figura  10-4a).  Para  testar 
a  legitimidade  de  uma  relação,  é  proposto  um  modelo 
alternativo  que  sugere  duas  causas  alternativas  (Causa 
Alternativa  I  e  Causa  Alternativa  II)  que  podem  tornar 
ilegítima  a  relação  entre  a  verdadeira  causa  e  o  efeito.  O 
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FIGURA  10-4  Teste  de  legitimidade  para  uma  relação  entre  construtos. 
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modelo  na  Figura  10-4b  descreve  o  modelo  SEM  alter¬ 
nativo  que  é  estimado,  incluindo  os  construtos  originais, 
bem  como  duas  causas  alternativas  como  preditores  adi¬ 
cionais  tanto  de  causa  quanto  de  efeito.  Se  os  resultados 
são  como  os  indicados  na  Figura  10-4b  (ou  seja,  o  coefi¬ 
ciente  estimado  de  causa  e  efeito  permanece  inalterado), 
então  a  inferência  causal  é  fortalecida.  As  causas  alter¬ 
nativas  não  modificaram  o  resultado  original,  e  assim 
esta  análise  comprova  a  legitimidade  da  relação  original 
de  causa  e  efeito. 


Suporte  teórico 

A  condição  final  para  causalidade  é  suporte  teórico,  ou 
uma  argumentação  convincente  para  apoiar  uma  rela¬ 
ção  de  causa-e-efeito.  Tal  condição  enfatiza  o  fato  de 
que  simplesmente  testar  um  modelo  SEM  e  analisar 
seus  resultados  não  pode  estabelecer  causalidade.  Su¬ 
porte  teórico  se  torna  especialmente  importante  com 
dados  cross-section.  Um  modelo  SEM  pode  demonstrar 
relações  entre  quaisquer  construtos  que  são  correlacio¬ 
nados  com  outro  (p.ex.,  consumo  de  sorvete  e  estatísti¬ 
cas  de  afogamento). 


O  gasto  do  cliente  é  causa  de  compromisso?  Uma  ar¬ 
gumentação  teórica  pode  existir  no  fato  de  que  quando 
clientes  gastam  mais  recursos  com  uma  firma  (elevado 
gasto),  eles  se  tornam  mais  familiarizados  com  a  mesma, 
o  que  aumenta  a  satisfação  e  sua  habilidade  para  iden¬ 
tificação  com  a  loja  ou  a  marca,  e  eles  se  tornam  mais 


resistentes  a  mudanças.  Logo,  pode-se  defender  a  idéia 
de  que  gastos  maiores  provocam  maior  compromisso. 


A  menos  que  teoria  possa  ser  usada  para  estabelecer 
uma  ordem  causal  e  uma  argumentação  para  a  covari- 
ância  observada,  as  relações  permanecem  como  simples 
associação  e  não  devem  ser  atribuídas  a  qualquer  poder 
causal  adicional. 

Resumo 

Apesar  de  SEM  ser  freqüentemente  referida  como  uma 
modelagem  causal,  inferências  causais  somente  são  possí¬ 
veis  quando  evidência  é  consistente  com  as  quatro  condi¬ 
ções  para  causalidade  já  mencionadas.  A  SEM  pode  for¬ 
necer  evidência  de  covariação  sistemática  e  pode  ajudar 
na  demonstração  de  que  uma  relação  não  é  ilegítima.  Se 
os  dados  são  longitudinais,  a  SEM  também  pode  ajudar  a 
estabelecer  a  seqüência  de  relações.  Contudo,  depende  do 
pesquisador  o  estabelecimento  de  suporte  teórico.  Assim, 
a  SEM  é  útil  para  definir  uma  inferência  causal,  mas  ela 
não  pode  fazer  isso  sozinha. 


A  HISTÓRIA  DA  SEM 

A  SEM  é  uma  ferramenta  analítica  relativamente  nova, 
mas  suas  raízes  se  remontam  à  primeira  metade  do  século 
XX.  O  desenvolvimento  da  SEM  se  originou  com  a  vonta¬ 
de  de  geneticistas  e  economistas  de  conseguir  estabelecer 
relações  causais  entre  variáveis  [6, 15, 47].  Não  obstante,  a 
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complexidade  matemática  da  SEM  limitou  sua  aplicação 
até  que  computadores  e  programas  se  tornaram  ampla¬ 
mente  disponíveis. 

Como  discutido,  a  SEM  combina  os  princípios  de  aná¬ 
lise  fatorial  e  regressão  múltipla  em  um  só  procedimento. 
O  trabalho  de  pesquisa  e  desenvolvimento  inerente  a  es¬ 
sas  duas  técnicas  revela  a  linhagem  da  SEM.  Os  avanços 
importantes  vieram  com  o  desenvolvimento  de  procedi¬ 
mentos  estatísticos  e  de  pacotes  computacionais  que  via¬ 
bilizaram  a  combinação  desses  dois  procedimentos  multi- 
variados  em  um  só.  Durante  o  final  da  década  de  1960  e 
início  da  de  1970,  o  trabalho  de  Jõreskog  e  Sõrbom  con¬ 
duziu  à  estimação  simultânea  de  máxima  verossimilhança 
das  relações  entre  construtos  e  variáveis  indicadoras  me¬ 
didas,  bem  como  entre  construtos  latentes.  Este  trabalho 
culminou  no  programa  SEM  chamado  LISREL  [22,  23, 
24,  25].  Não  foi  o  primeiro  programa  a  executar  SEM  ou 
análise  de  caminhos,  mas  foi  o  primeiro  a  conquistar  am¬ 
plo  uso. 

O  crescimento  de  SEM  se  manteve  relativamente  len¬ 
to  durante  os  anos  1970  e  1980,  em  grande  parte  devido  à 
sua  complexidade  percebida.  No  entanto,  em  1994,  mais 
de  150  artigos  sobre  SEM  foram  publicados  na  literatu¬ 
ra  acadêmica  de  ciências  sociais.  Este  número  subiu  para 
mais  de  300  em  2000,  e  hoje  em  dia,  a  SEM  é  a  “técnica 
multivariada  dominante”,  seguida  por  análise  de  agrupa¬ 
mentos  e  MANOVA  [17]. 


UM  EXEMPLO  SIMPLES  DE  SEM 

O  exemplo  a  seguir  ilustra  como  a  SEM  funciona  com 
múltiplas  relações,  estimando  muitas  equações  de  uma 
só  vez,  mesmo  quando  elas  estão  inter-relacionadas  e  a 
variável  dependente  de  uma  equação  é  independente  em 
outra(s).  Tal  capacidade  permite  ao  pesquisador  modelar 
relações  complexas  de  uma  maneira  que  não  é  viável  com 
qualquer  uma  das  outras  técnicas  multivariadas  discutidas 
neste  texto. 

Devemos  observar,  porém,  que  o  nosso  exemplo  não 
ilustrará  uma  das  outras  vantagens  da  SEM,  a  habilida¬ 
de  de  empregar  múltiplas  medidas  (o  modelo  de  mensu- 
ração)  para  representar  um  construto  de  uma  maneira 
semelhante  à  análise  fatorial.  Para  fins  de  simplicidade, 
cada  construto  no  exemplo  a  seguir  é  tratado  como  uma 
só  variável.  O  Capítulo  11  discute  teoria  da  mensuração 
e  análise  fatorial  confirmatória  e  ilustra  detalhadamente 
a  mensuração  de  múltiplos  itens.  Por  enquanto,  nos  con¬ 
centramos  somente  nos  princípios  básicos  de  construção 
de  modelo  e  na  estimação  de  múltiplas  relações. 

A  questão  de  pesquisa 

Teoria  deve  ser  a  fundamentação  mesmo  dos  modelos 
mais  simples,  pois  variáveis  sempre  podem  ser  conecta¬ 


das  entre  si  de  várias  maneiras.  A  maioria  dessas  cone¬ 
xões  não  faz  sentido.  A  teoria  deve  fazer  do  modelo  algo 
plausível.  A  ênfase  na  representação  de  relações  de  de¬ 
pendência  demanda  que  o  pesquisador  detalhe  cuidado¬ 
samente  não  apenas  o  número  de  construtos  envolvidos, 
mas  as  relações  esperadas  entre  eles.  Com  esses  constru¬ 
tos  em  mãos,  modelos  e  a  estimação  de  relações  podem 
ter  prosseguimento. 


Administradores  do  varejo  estão  interessados  em  como 
indivíduos  se  tornam  clientes  leais,  comprometidos.  As¬ 
sim,  a  questão-chave  de  pesquisa  é:  como  percepções 
de  clientela  sobre  três  elementos  estratégicos  -  preço, 
serviço  e  atmosfera  -  determinam  a  aceitação  da  loja, 
medida  por  gastos  e  compromisso?  Mais  especificamen¬ 
te,  os  varejistas  acreditam  que  percepções  favoráveis 
de  preço,  serviço  e  atmosfera  encorajam  um  cliente  a 
retornar  e  gastar  mais  dinheiro  (aumentando  gastos),  e 
que  através  deste  processo,  clientes  se  tornam  cada  vez 
mais  leais. 

A  partir  de  suas  experiências,  eles  desenvolveram 
uma  série  de  relações  que  julgam  explicar  o  processo: 

•  Melhores  percepções  de  preços  aumentam  os  gastos  de 
clientes. 

•  Melhores  percepções  de  serviços  aumentam  os  gastos 
de  clientes. 

•  Melhores  percepções  de  atmosfera  da  loja  aumentam 
os  gastos  de  clientes. 

•  Maior  gasto  da  clientela  aumenta  o  compromisso  dela. 

Essas  quatro  relações  formam  a  base  de  como  os  ad¬ 
ministradores  sentem  que  as  componentes  importantes 
de  sua  estratégia  de  venda  (preço,  serviço  e  atmosfera 
da  loja)  influenciam  gastos  e  compromisso  de  cliente¬ 
la.  Eles  agora  desejam  compreender  se  suas  estratégias 
são  efetivas  e,  quem  sabe,  sua  importância  relativa.  No 
entanto,  a  natureza  inter-relacionada  de  suas  relações 
(ou  seja,  gastos  e  compromisso  de  clientes)  torna  van¬ 
tajosa  uma  técnica  com  capacidades  além  da  regressão 
múltipla. 


Preparação  do  modelo  de  equações 
estruturais  para  análise  de  caminhos 

Eíma  vez  que  uma  série  de  relações  é  especificada,  o 
pesquisador  é  capaz  de  identificar  o  modelo  de  uma  for¬ 
ma  adequada  para  análise.  Construtos  são  identificados 
como  sendo  exógenos  ou  endógenos.  Em  seguida,  para 
facilmente  demonstrar  as  relações,  elas  são  visualmen¬ 
te  retratadas  em  um  diagrama  de  caminhos,  onde  setas 
retas  descrevem  o  impacto  de  um  construto  sobre  outro. 
Se  hipóteses  causais  são  inferidas,  as  setas  representando 
relações  de  dependência  apontam  da  causa  para  o  efeito 
subseqüente. 
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As  relações  identificadas  pelos  administradores  de  vare¬ 
jo  incluem  cinco  construtos:  percepções  de  preço,  serviço 
e  atmosfera  da  loja,  bem  como  gastos  e  compromisso  de 
clientela.  O  primeiro  passo  é  identificar  quais  construtos 
podem  ser  considerados  exógenos  ou  endógenos.  A  par¬ 
tir  de  nossas  relações  podemos  identificar  três  construtos 
exógenos  e  dois  endógenos: 


Construtos  exógenos 

Construtos  endógenos 

Preço 

Gastos  de  clientes 

Serviço 

Compromisso  de  clientes 

Atmosfera 

Com  os  construtos  especificados,  as  relações  podem 
ser  representadas  em  um  diagrama  de  caminhos.  A  Figu¬ 
ra  10-5  retrata  as  quatro  relações  sugeridas  pelos  admi¬ 
nistradores  de  varejo. 


Note  que  um  tipo  de  relação  também  apresentada  na 
Figura  10-5  não  foi  expresso  pelos  administradores:  as 
correlações  entre  os  construtos  exógenos.  Essas  relações 
são  tipicamente  adicionadas  em  SEM  quando  o  pesquisa¬ 
dor  sente  que  os  construtos  exógenos  têm  algum  grau  de 
associação  que  faz  surgir  suas  inter-relações.  No  caso  de 
variáveis  exógenas,  isso  é  diretamente  comparável  à  re¬ 
presentação  de  multicolinearidade  discutida  em  regressão 
múltipla  (ver  Capítulo  4  para  mais  detalhes).  Discutimos 
as  várias  razões  para  se  adicionar  este  tipo  de  relação  nos 
capítulos  seguintes. 


Espera-se  que  os  elementos  separados  da  estratégia  de 
vendas  sejam  coordenados  e  sigam  planejamento  e  exe¬ 
cução  consistentes,  de  forma  que  se  permita  correlação 
entre  os  três  elementos  estratégicos.  Permitir  relações 
entre  construtos  pode  tornar  as  estimativas  das  relações 
de  dependência  mais  confiáveis. 


Os  pesquisadores  agora  podem  reunir  dados  sobre 
percepções  de  clientes,  seus  gastos  e  lealdade,  como  a 
base  para  avaliação  do  modelo  proposto. 

O  básico  da  estimação  e  avaliação  SEM 

Uma  vez  especificados  relações  e  diagrama  de  caminhos, 
os  pesquisadores  podem  agora  reunir  dados,  colocá-los 
em  um  formato  adequado  para  análise  em  SEM,  estimar  a 
força  das  relações,  e  avaliar  o  quão  bem  os  dados  se  ajus¬ 
tam  ao  modelo.  No  exemplo,  ilustramos  os  procedimentos 
básicos  em  cada  um  desses  passos  à  medida  que  investiga¬ 
mos  as  questões  levantadas  por  administradores  que  afe¬ 
tam  compromisso  de  clientes. 

Matriz  de  covariância  observada 

A  SEM  difere  de  outras  técnicas  multivariadas  porque  é 
um  método  de  análise  de  estrutura  de  covariância  e  não 
uma  técnica  de  análise  de  variância.  Como  resultado,  a 
SEM  foca  a  covariação  entre  as  variáveis  medidas,  ou  a 
matriz  de  covariância  da  amostra  observada.  Apesar  de 
nem  sempre  parecer  óbvio  para  o  usuário,  programas 
SEM  podem  usar  como  entrada  a  matriz  de  covariância 
ou  uma  matriz  de  correlação  de  variáveis  observadas. 

O  leitor  pode  indagar  se  faz  alguma  diferença  se 
usarmos  uma  matriz  de  covariância  no  lugar  de  uma  ma¬ 
triz  de  correlações,  como  se  faz  em  regressão  múltipla. 
Discutimos  as  vantagens  de  uma  matriz  de  covariância 
posteriormente  neste  capítulo  (estágio  3  do  processo  de 
decisão),  mas  devemos  lembrar  que  correlação  é  apenas 
um  caso  especial  de  covariância.  Uma  matriz  de  correla¬ 
ção  é  simplesmente  a  matriz  de  covariância  quando  va¬ 
riáveis  padronizadas  são  empregadas  (ou  seja,  a  matriz 
de  covariância  padronizada).  Somente  valores  abaixo 
da  diagonal  são  únicos  e  de  interesse  particular  quando 
o  foco  é  sobre  correlações.  O  ponto-chave  até  este  mo¬ 
mento  é  perceber  que  a  matriz  de  covariância  observada 
pode  simplesmente  ser  computada  a  partir  de  observa- 


FIGURA  10-5  Diagrama  de  caminhos  de  um  modelo  estrutural  simples. 
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ções  amostrais,  como  fizemos  na  computação  de  uma 
matriz  de  correlação.  Ela  não  é  estimada  e  nem  depende 
de  modelo  imposto  por  um  pesquisador. 


Examinemos  novamente  nosso  exemplo  com  estraté 
gia  de  vendas  e  vejamos  como  os  pesquisadores  prosse 
guiriam  depois  que  o  modelo  é  definido. 


Para  entender  como  dados  entram  em  SEM,  pense  na  ma¬ 
triz  de  covariância  entre  as  cinco  variáveis.  Assim,  a  ma¬ 
triz  de  covariância  observada  conteria  25  valores.  Os  cinco 
valores  da  diagonal  representam  a  variância  de  cada  variá¬ 
vel,  resultando  em  10  termos  de  covariância  únicos.  Pelo 
fato  de  a  matriz  de  covariância  ser  simétrica,  os  10  termos 
únicos  são  repetidos  acima  e  abaixo  da  diagonal. 


Por  exemplo,  suponha  que  a  amostra  envolve  clientes 
entrevistados  usando  uma  técnica  de  abordagem  em  pon¬ 
to  de  fluxo.  Assim,  a  matriz  de  covariância  resultante  é 
composta  dos  seguintes  valores,  com  cada  construto  sim¬ 
plesmente  abreviado  como  P  para  Preço,  S  para  Serviço, 
A  para  Atmosfera,  CS  para  Gastos  de  Cliente  e  CC  para 
Compromisso  de  Cliente  (como  na  Figura  10-5): 


Covariância 

observada 


var(P) 

cov(P,S) 

cov(P,A) 

cov(PCS) 

cov(P,CC) 


cov(P,S) 

var(S) 

cov(S,A) 

cov(S,CS) 

cov(S,CC) 


cov(P,A) 

cov(S,A) 

var(A) 

cov(A,CS) 

cov(A,CC) 


cov(P,CS) 

cov(S,CS) 

cov(A,CS) 

var(CS) 

cov(CS,CC) 


cov(P,CC) 

cov(S,CC) 

cov(A,CC) 

cov(CS,CC) 

var(CC) 


Os  valores  que  não  estão  em  negrito  acima  da  diagonal 
representam  os  10  termos  únicos  que  são  os  mesmos  que 
estão  abaixo  da  diagonal.  Dada  essa  duplicação,  matrizes 
de  covariância  ou  de  correlação  são  geralmente  expressas 


como  uma  matriz  simétrica,  com  os  termos  únicos  mostra¬ 
dos  somente  abaixo  da  diagonal. 

A  matriz  completa  de  covariância  para  os  cinco  cons- 
trutos  é  expressa  como  se  segue  em  uma  matriz  simétrica: 


var(P) 

Covariância 

cov(P,S)  var(S) 

observada  (S)  “ 

cov(P,A)  cov(S,A)  var(A) 

cov(PCS)  cov(S,CS)  cov(A,CS)  var(CS) 

cov(P,CC)  cov(S,CC)  cov(A,CC)  cov(CS,CC)  var(CC) 

Suponha  em  nosso  exemplo  que  os  termos  de  cova-  Compromisso  foram  registrados  como  indicado  aqui: 
riância  únicos  para  Preço,  Serviço,  Atmosfera,  Gastos  e 


Gastos  de 

Compromisso 

Preço 

Serviço 

Atmosfera 

Clientes 

de  Clientes 

var  (P) 

_ 

_ 

_ 

_ 

Covariância 

0,20 

var  (S) 

observada  (S) 

0,20 

0,15 

var  (A) 

- 

- 

0,20 

0,30 

0,50 

var  (CS) 

- 

-0,05 

0,25 

0,40 

0,50 

var  (CC) 

Valores  para  os  itens  de  variância  não  são  mostrados, 
mas  esta  é  uma  simples  questão  de  se  computar  tais  valo¬ 
res  e  incluí-los  na  matriz  de  covariância.  Se  os  dados  são 
padronizados,  resultaria  uma  matriz  de  correlação  e  cada 


termo  de  variância  se  tornaria  igual  a  um.  Valores  acima 
da  diagonal  também  não  são  repetidos  para  manter  a  ma¬ 
triz  de  covariância  tão  simples  quanto  possível  para  fins  de 
ilustração. 
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Estimação  e  interpretação  de  relações 

Antes  do  amplo  emprego  de  programas  SEM,  pesqui¬ 
sadores  achavam  soluções  para  modelos  de  múltiplas 
equações  usando  um  processo  conhecido  como  análise  de 
caminhos.  Análise  de  caminhos  utiliza  correlações  biva- 
riadas  simples  para  estimar  as  relações  em  um  sistema  de 
equações  estruturais.  Este  processo  estima  a  força  de  cada 
relação  retratada  como  uma  seta  reta  ou  curvilínea  em  um 
diagrama  de  caminhos.  O  procedimento  matemático  real 
é  brevemente  descrito  no  Apêndice  lOA. 


Procedimentos  de  análise  de  caminhos  (Apêndice  lOA) 
podem  fornecer  estimativas  para  cada  relação  (seta)  no 
modelo  mostrado  na  Figura  10-6.  Essas  estimativas  são 
comparáveis  com  coeficientes  de  regressão,  onde  duas 
equações  separadas  seriam  usadas  (uma  para  prever 
Gastos  de  Cliente,  e  a  segunda  para  prever  Compro¬ 
misso  de  Clientes),  e  portanto  uma  equação  não  contém 
a  informação  representada  pela  outra  equação.  Com 
técnicas  SEM,  contudo,  todas  as  estimativas  podem  ser 
computadas  usando-se  toda  a  informação  de  todas  as 
equações  que  compõem  um  modelo. 

Além  disso,  a  SEM  fornece  estimativas  diretas  das 
relações  entre  os  construtos  exógenos,  o  que  pode  ter 
implicações  em  nossa  interpretação  dos  resultados  e 
também  influenciar  diretamente  nossa  avaliação  da  va¬ 
lidade  dos  construtos  exógenos. 


Com  estimativas  para  cada  caminho,  uma  interpreta¬ 
ção  pode  ser  feita  de  cada  relação  representada  no  mode¬ 
lo.  Quando  testes  de  inferência  estatística  são  aplicados, 
o  pesquisador  pode  avaliar  a  probabilidade  de  que  as  es¬ 
timativas  sejam  significantes  (ou  seja,  não  iguais  a  zero). 


Além  disso,  as  estimativas  podem  ser  usadas  como  coefi¬ 
cientes  de  regressão  para  fazer  estimativas  dos  valores  de 
qualquer  construto  no  modelo. 


Caminhos  no  modelo  mostrados  na  Figura  10-6  repre¬ 
sentam  as  questões  de  pesquisa  colocadas  pelo  pesqui¬ 
sador.  Quando  olhamos  as  primeiras  três  relações  (ou 
seja,  impacto  de  Preço,  Serviço  e  Atmosfera  sobre  Gas¬ 
tos  de  Clientes)  podemos  perceber  que  os  coeficientes 
estimados  são  0,065, 0,219  e  0,454,  respectivamente.  Sem 
fazer  um  julgamento  estatístico,  podemos  averiguar  que 
Atmosfera  tem  o  maior  impacto,  enquanto  Serviço  tem 
um  pouco  menos  e  Preço  tem  o  menor  impacto.  Além 
disso,  podemos  ver  que  Gastos  de  Cliente  tem  um  im¬ 
pacto  substancial  sobre  Compromisso  de  Clientes  (0,50) 
e  fornece  evidência  daquela  relação  também. 


Agora  lembre  do  Capítulo  4  que  coeficientes  de  re¬ 
gressão  podem  ser  usados  para  computar  valores  previstos 
para  variáveis  dependentes.  Tais  valores  foram  chamados 
de  y.  Logo,  para  quaisquer  valores  particulares  das  variá¬ 
veis  preditoras,  um  valor  estimado  para  o  resultado  po¬ 
deria  ser  obtido.  Neste  caso  no  qual  tratamos  construtos 
como  variáveis,  eles  representariam  valores  previstos  para 
construtos  endógenos,  que  é  o  resultado.  A  diferença  entre 
o  valor  observado  real  para  o  resultado  e>’  é  erro.  A  SEM 
pode  também  fornecer  valores  estimados  para  construtos 
exógenos  quando  múltiplas  variáveis  são  usadas  para  indi¬ 
car  o  construto.  Tal  processo  fica  mais  claro  nos  próximos 
capítulos.  Perceba  que  diversas  relações  potenciais  entre 
construtos  não  têm  caminhos  desenhados,  o  que  significa 
que  o  pesquisador  não  espera  uma  relação  direta  entre 
esses  construtos.  Por  exemplo,  nenhuma  seta  é  esboçada 


FIGURA  10-6  Modelo  estimado  de  equações  estruturais  para  compromisso  de  cliente. 
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entre  Preço  e  Compromisso  de  Cliente,  Serviço  e  Compro¬ 
misso  de  Cliente,  ou  Atmosfera  e  Compromisso  de  Clien¬ 
te,  o  que  afeta  as  equações  para  os  valores  previstos. 


Em  nosso  modelo,  se  tomamos  quaisquer  valores  para 
Preço,  Serviço  e  Atmosfera,  podemos  estimar  um  valor 
para  Gastos  de  Cliente  usando  esta  equação: 
y^=  0,065(Preço)  +  0,219(Serviço)  -i-  0,454(Atmosfera) 

Analogamente,  valores  previstos  para  Compromisso 
de  Cliente  podem  ser  obtidos: 

7^^  =  0,50(C5) 

Isso  representaria  uma  previsão  de  equação  múltipla, 
pois  CS  é  também  endógeno.  Substituindo  a  equação 
para  CS  na  equação  para  CC,  obtemos: 

=  0,50[0,065(Preço)  +  0,219(Serviço) 

+  0,454(  Atmosfera)] 

Portanto,  é  fácil  perceber  como  estimativas  de  cami¬ 
nhos  na  Figura  10-6  podem  ser  usadas  para  calcular  va¬ 
lores  estimados  para  Gastos  de  Cliente  e  Compromisso 
de  Cliente. 


Avaliação  do  ajuste  de  modelo  com  a 
matriz  de  covariância  estimada 

O  último  passo  em  uma  análise  SEM  envolve  o  cál¬ 
culo  de  uma  matriz  de  covariância  estimada  e  então  a 
avaliação  do  grau  de  ajuste  do  modelo  de  covariância 
observada.  A  matriz  de  covariância  estimada  é  obtida 
a  partir  das  estimativas  de  caminhos  do  modelo.  Com 
essas  estimativas,  podemos  calcular  todas  as  covariân- 
cias  que  estavam  na  matriz  de  covariância  observada 
usando  os  princípios  de  análise  de  caminhos  no  sentido 
“contrário”.  Em  seguida,  comparando  as  duas  matrizes, 
a  SEM  pode  testar  um  modelo.  Modelos  que  produzem 
uma  matriz  de  covariância  estimada  que  está  dentro  da 
variação  amostrai  da  matriz  de  covariância  observada 
são  geralmente  considerados  como  bons  modelos  e  que 
se  ajustam  bem. 

O  processo  de  calcular  uma  covariância  estimada  pri¬ 
meiramente  identifica  todos  os  caminhos  diretos  e  indire¬ 
tos  que  se  relacionam  com  uma  covariância  ou  correlação 
específica.  Então,  os  coeficientes  são  usados  para  calcular 
o  valor  de  cada  caminho,  os  quais  são  em  seguida  totaliza¬ 
dos  para  se  conseguir  o  valor  estimado  para  cada  covariân- 
ci  a/correlação. 


Examinemos  uma  relação  (Serviço  e  Gastos  de  Cliente)  nhos  diretos  e  indiretos: 
para  ilustrarmos  o  que  acontece.  Eles  envolvem  cami- 

Caminho  direto: 

Serviço  ->  Gastos  de  Cliente  =  0,2Í9 
Caminhos  indiretos: 

Serviço  ->  Preço  ->  Gastos  de  Cliente  =  0,200  X  0,065  =  0,013 
Serviço  ->  Atmosfera  ->  Gastos  de  Cliente  =  0,150  X  0,454  =  0,068 

Total:  Direto  -r  Indireto  =  0,219  +  0,013  -r  0,068  =  0,300 

Assim,  a  covariância  estimada  entre  Serviço  e  Gas-  Analogamente,  podemos  imaginar  a  matriz  de  covariân- 
tos  de  Cliente  é  0,300,  a  soma  de  caminhos  diretos  e  in-  cia  estimada  como  as  covariâncias  obtidas  das  estimativas 
diretos.  de  todas  as  variáveis y.  A  matriz  completa  de  covariância 

estimada  é  dada  por: 


Gastos  de 

Compromisso 

Preço 

Serviço 

Atmosfera 

Clientes 

de  Clientes 

Covariância 
Estimada  (S^) 

0,20 

0,15 

- 

- 

- 

0,20 

- 

- 

- 

0,20 

0,30 

0,50 

- 

- 

0,10 

0,15 

0,25 

0,50 

- 
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A  diferença  entre  as  matrizes  de  covariância  observada 
e  estimada,  IS  —  2^.1,  se  torna  o  guia  principal  na  avaliação 
do  ajuste  de  um  modelo  SEM.  Se  a  matriz  de  covariância 
estimada  é  suficientemente  próxima  da  matriz  de  covari¬ 
ância  observada  (a  diferença  é  pequena),  então  o  modelo 
e  suas  relações  são  corroborados.  Se  o  leitor  está  familia¬ 
rizado  com  tabulação  cruzada,  não  deve  ser  surpresa  que 
uma  estatística  x  possa  ser  computada  com  base  na  dife¬ 
rença  entre  as  duas  matrizes.  Posteriormente,  usaremos 
esta  estatística  como  o  indicador  básico  da  qualidade  do 
ajuste  de  um  modelo  teórico. 

A  última  questão  na  avaliação  de  ajuste  é  o  conceito 
de  resíduo  em  SEM.  Aqui,  um  resíduo  é  a  diferença  en¬ 
tre  qualquer  covariância  observada  e  estimada.  Assim, 
quando  comparamos  as  matrizes  de  covariância  obser¬ 
vada  e  reais*,  quaisquer  diferenças  que  detectamos  são 
os  resíduos.  A  distinção  em  relação  a  outras  técnicas 
multivariadas,  especialmente  regressão  múltipla,  é  im¬ 
portante.  Em  tais  técnicas,  resíduos  refletem  os  erros  na 
previsão  de  observações  individuais.  Em  SEM,  observa¬ 
ções  individuais  não  são  o  foco  da  análise,  a  despeito  de 
valores  previstos  para  observações  individuais  poderem 
ser  computados.  Quando  um  programa  SEM  se  refere  a 
resíduos,  isso  significa  o  quão  distante  um  termo  de  co¬ 
variância  estimada  está  da  covariância  observada  para 
as  mesmas  duas  variáveis. 


Ao  se  comparar  nossas  matrizes  de  covariância  obser¬ 
vada  e  estimada,  algumas  covariâncias  são  previstas 
com  precisão  e  algumas  diferenças  são  descobertas.  Por 
exemplo,  a  relação  entre  Serviço  e  Gastos  de  Cliente  é 
prevista  com  precisão.  Em  outros  casos,  como  o  da  rela¬ 
ção  Atmosfera  ^  Compromisso  de  Cliente,  a  covariân¬ 
cia  estimada  (0,25)  é  claramente  distinta  da  observada 
(0,40).  Quando  examinamos  os  resultados,  percebemos 
resíduos  para  cada  relação  de  construto  exógeno  com 
Compromisso  de  Cliente  (-0,15,  0,10  e  0,15).  Portanto,  o 
modelo  descrito  não  explica  com  perfeição  a  covariância 
entre  esses  itens  e  pode  sugerir  que  a  teoria  do  pesquisa¬ 
dor  é  inadequada. 


Com  essas  regras  simples,  o  modelo  como  um  todo 
pode  agora  ser  construído  simultaneamente.  Qbserve 
que  variáveis  dependentes  em  uma  relação  podem  fa¬ 
cilmente  ser  independentes  em  outra  (como  ocorre  com 
Gastos  de  Cliente).  Não  importa  quão  grande  o  diagra¬ 
ma  de  caminhos  fique  ou  quantas  relações  sejam  incluí¬ 
das,  a  análise  de  caminhos  fornece  uma  maneira  de  ana¬ 
lisar  o  conjunto  de  relações. 


*  N.  de  R.  T.:  A  frase  correta  seria  “quando  comparamos  as  ma¬ 
trizes  de  covariância  observada  e  estimada”. 


Devemos  observar  que  o  pesquisador  não  tem  que 
fazer  todos  os  cálculos  na  análise  de  caminhos,  pois  eles 
podem  ser  realizados  pelo  programa  computacional.  Q 
pesquisador  precisa  compreender  os  princípios  inerentes 
a  SEM,  de  forma  que  as  implicações  do  acréscimo  ou  eli¬ 
minação  de  caminhos  ou  outras  modificações  do  modelo 
sejam  entendidas.  Qs  próximos  dois  capítulos  explicam 
como  tais  procedimentos  são  implementados  no  teste  de 
teorias  de  mensuração  e  estrutural,  respectivamente. 

Resumo 

A  SEM  provê  um  referencial  abrangente  para  estimar 
conjuntos  complexos  de  relações  e  incorporar  proprieda¬ 
des  específicas  de  mensuração  de  construtos  latentes  tam¬ 
bém.  Neste  exemplo,  ilustramos  os  processos  básicos  de 
especificação  de  um  modelo,  entrando  com  dados  em  um 
formato  para  SEM,  estimando  relações  e  avaliando  ajuste 
de  modelo.  Mesmo  neste  modelo  simples,  fica  evidente  a 
importância  da  teoria  na  orientação  da  especificação  do 
modelo.  As  seções  a  seguir  e  os  Capítulos  11  e  12  tratam 
de  questões  que  surgem  quando  modelos  ficam  mais  com¬ 
plexos,  envolvendo  múltiplas  medidas.  Não  obstante,  os 
procedimentos  básicos  ainda  são  comparáveis  com  aque¬ 
les  descritos  neste  exemplo. 


DESENVOLVIMENTO  DE  UMA 
ESTRATÉGIA  DE  MODELAGEM 

Um  dos  conceitos  mais  importantes  que  um  pesquisador 
deve  aprender  no  tocante  a  técnicas  multivariadas  é  que 
não  existe  um  só  caminho  correto  para  aplicá-las.  Ao  invés 
disso,  o  pesquisador  deve  formular  os  objetivos  da  pesqui¬ 
sa  e  aplicar  técnicas  apropriadas  da  maneira  mais  adequa¬ 
da  para  atingir  os  objetivos  desejados.  Em  alguns  casos,  as 
relações  são  estritamente  especificadas  e  o  objetivo  é  uma 
confirmação  da  relação.  Em  outras  vezes,  as  relações  são 
vagamente  reconhecidas  e  a  meta  é  a  descoberta  das  rela¬ 
ções.  Em  cada  caso  extremo  e  em  pontos  intermediários, 
o  pesquisador  deve  formular  o  uso  da  técnica  de  acordo 
com  os  objetivos  da  pesquisa. 

A  aplicação  da  SEM  segue  essa  mesma  doutrina.  Sua 
flexibilidade  fornece  ao  pesquisador  uma  poderosa  ferra¬ 
menta  analítica  adequada  para  muitos  objetivos  de  pes¬ 
quisa.  Pesquisadores  devem  definir  esses  objetivos  como 
orientações  em  uma  estratégia  de  modelagem.  Q  empre¬ 
go  do  termo  estratégia  é  projetado  para  denotar  um  plano 
de  ação  para  um  resultado  específico.  No  caso  da  SEM,  o 
resultado  fundamental  é  sempre  a  avaliação  de  uma  sé¬ 
rie  de  relações.  No  entanto,  isso  pode  ser  conseguido  por 
muitos  caminhos.  Para  nossos  propósitos,  definimos  três 
estratégias  distintas  na  aplicação  de  SEM:  estratégia  de 
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modelagem  confirmatória,  modelos  concorrentes,  e  de-  igualdade  de  modelos  fatoriais  ao  longo  de  grupos.  Este 
senvolvimento  de  modelos.  processo  é  ilustrado  nos  capítulos  subseqüentes. 


Estratégia  de  modelagem  confirmatória 

A  aplicação  mais  direta  de  modelagem  de  equações  es¬ 
truturais  é  uma  estratégia  de  modelagem  confirmatória. 
O  pesquisador  especifica  um  só  modelo  (conjunto  de  re¬ 
lações),  e  a  SEM  é  usada  para  avaliar  quão  bem  o  modelo 
se  ajusta  aos  dados.  Aqui  o  pesquisador  está  dizendo  “Isto 
ou  funciona,  ou  não  funciona”.  Se  o  modelo  proposto  tem 
ajuste  aceitável  por  quaisquer  critérios  aplicados,  o  pes¬ 
quisador  não  demonstrou  o  modelo  proposto,  mas  apenas 
confirmou  que  ele  é  um  entre  diversos  possíveis  modelos 
aceitáveis.  Trata-se  do  oposto  de  técnicas  exploratórias 
como  a  regressão  stepwise.  Diversos  modelos  diferentes 
podem  ter  ajustes  igualmente  aceitáveis.  Talvez  um  tes¬ 
te  mais  esclarecedor  seja  conseguido  pela  comparação  de 
modelos  alternativos. 

Estratégia  de  modelos  concorrentes 

Como  um  meio  de  comparar  o  modelo  estimado  com  al¬ 
ternativos,  comparações  gerais  podem  ser  feitas  em  uma 
estratégia  de  modelos  concorrentes.  O  teste  mais  forte  de 
um  modelo  proposto  é  identificar  e  testar  modelos  con¬ 
correntes  que  representam  relações  estruturais  hipotéticas 
verdadeiramente  diferentes.  Quando  compara  esses  mo¬ 
delos,  o  pesquisador  se  aproxima  muito  mais  de  um  teste 
de  teorias  que  competem,  o  que  é  muito  mais  forte  do  que 
apenas  uma  pequena  modificação  de  uma  só  teoria. 


Como  o  pesquisador  gera  esse  conjunto  de  modelos  con¬ 
correntes?  Uma  possível  fonte  de  modelos  concorrentes 
consiste  em  formulações  alternativas  da  teoria  subjacen¬ 
te.  Por  exemplo,  em  nosso  modelo  original.  Compromis¬ 
so  de  Cliente  foi  determinado  diretamente  apenas  por 
Gastos  de  Cliente  (Figura  10-5).  No  entanto,  um  modelo 
alternativo  poderia  propor  que  Compromisso  de  Cliente 
poderia  também  ser  diretamente  determinado  por  At¬ 
mosfera  (adicionando  uma  seta  retilínea  de  Atmosfera 
para  Compromisso  de  Cliente).  Este  seria,  então,  o  mo¬ 
delo  concorrente  em  relação  ao  original. 


Modelos  equivalentes  fornecem  uma  segunda  pers¬ 
pectiva  no  desenvolvimento  de  um  conjunto  de  modelos 
concorrentes.  Foi  mostrado  que  para  qualquer  modelo  de 
equações  estruturais,  existe  pelo  menos  um  outro  modelo 
com  o  mesmo  número  de  parâmetros  e  o  mesmo  nível  de 
ajuste  que  varia  nas  relações  retratadas.  Como  uma  nor¬ 
ma  prática  geral,  quanto  mais  complexo  o  modelo,  mais 
modelos  equivalentes  existem. 

Um  terceiro  exemplo  de  estratégia  de  modelos  con¬ 
correntes  é  o  processo  de  avaliar  invariância  fatorial,  a 


Estratégia  de  desenvolvimento  de  modelos 

A  estratégia  de  desenvolvimento  de  modelos  difere  das 
duas  anteriores  no  sentido  de  que,  apesar  de  uma  estru¬ 
tura  de  modelo  básico  ser  proposta,  o  propósito  do  esfor¬ 
ço  de  modelagem  é  melhorar  esta  estrutura  por  meio  de 
modificações  dos  modelos  estrutural  ou  de  mensuração. 
Em  muitas  aplicações,  a  teoria  pode  fornecer  apenas  um 
ponto  de  partida  para  o  desenvolvimento  de  um  mode¬ 
lo  teoricamente  justificado  que  pode  ser  empiricamente 
apoiado.  Assim,  o  pesquisador  deve  empregar  SEM  não 
apenas  para  testar  o  modelo  empiricamente,  mas  também 
para  fornecer  idéias  sobre  sua  reespecificação. 

Uma  nota  de  cuidado  deve  ser  feita.  O  pesquisador 
deve  ser  cuidadoso  para  não  empregar  essa  estratégia  ao 
ponto  em  que  o  modelo  final  tenha  ajuste  aceitável  mas 
que  não  possa  ser  generalizado  para  outras  amostras  ou 
populações.  Além  disso,  a  reespecificação  de  modelo  sem¬ 
pre  deve  ser  feita  com  suporte  teórico  e  não  apenas  com 
justificativa  empírica.  Modelos  desenvolvidos  dessa  ma¬ 
neira  devem  ser  verificados  com  uma  amostra  indepen¬ 
dente.  Discutimos  isso  nos  próximos  capítulos. 


-  REGRAS  PRÁTICAS  10-1  - 

Introdução  à  modelagem  de  equações  estruturais 

•  Nenhum  modelo  deve  ser  desenvolvido  para  uso  com 
SEM  se  não  houver  alguma  teoria  subjacente,  a  qual  é 
necessária  para  desenvolver: 

•  Especificação  de  modelo  de  mensuração 

•  Especificação  de  modelo  estrutural 

•  Modelos  podem  ser  visualmente  representados  com  um 
diagrama  de  caminhos 

•  Relações  de  dependência  são  retratadas  por  setas 
em  um  só  sentido 

•  Relações  correlacionais  (covariância)  são 
representadas  por  setas  em  dois  sentidos 

•  Relações  de  dependência  são,  às  vezes,  mas  nem 
sempre,  teorizadas  como  sendo  causais  por  natureza; 
relações  causais  são  o  mais  forte  tipo  de  inferência  feita 
na  aplicação  de  estatísticas  multivariadas;  logo,  elas 

só  podem  ser  embasadas  quando  existirem  condições 
precisas  para  causalidade: 

•  Covariância  entre  causa  e  efeito 

•  A  causa  deve  ocorrer  antes  do  efeito 

•  Deve  existir  associação  legítima  entre  causa  e  efeito 

•  Há  suporte  teórico  para  a  relação  entre  causa  e  efeito 

•  Modelos  desenvolvidos  com  uma  estratégia  de 
desenvolvimento  devem  passar  por  validação  cruzada 
com  uma  amostra  independente 


560  Análise  Multivariada  de  Dados 


SEIS  ESTÁGIOS  NA  MODELAGEM 
DE  EQUAÇÕES  ESTRUTURAIS 

A  SEM  se  tornou  uma  abordagem  multivariada  popular 
em  um  intervalo  de  tempo  relativamente  curto.  Pesqui¬ 
sadores  são  atraídos  para  a  SEM  porque  ela  provê  uma 
maneira  conceitualmente  atraente  de  testar  uma  teoria. 
Se  um  pesquisador  pode  expressar  uma  teoria  em  termos 
de  relações  entre  variáveis  medidas  e  construtos  latentes 
(variáveis  estatísticas),  então  a  SEM  avaliará  quão  bem 
a  teoria  se  ajusta  à  realidade  quando  esta  é  representada 
por  dados. 

Esta  seção  continua  a  discussão  sobre  a  SEM  des¬ 
crevendo  um  processo  de  decisão  em  seis  estágios.  Este 
processo  varia  um  pouco  em  relação  àquele  introduzido 
no  Capítulo  1  a  fim  de  refletir  a  terminologia  e  os  pro¬ 
cedimentos  únicos  da  SEM.  Os  seis  estágios  são  como 
se  segue: 

1.  Definir  construtos  individuais 

2.  Desenvolver  o  modelo  de  mensuração  geral 

3.  Planejar  um  estudo  para  produzir  resultados  empíricos 

4.  Avaliar  a  validade  do  modelo  de  mensuração 

5.  Especificar  o  modelo  estrutural 

6.  Avaliar  a  validade  do  modelo  estrutural 

O  restante  deste  capítulo  fornece  uma  breve  visão  ge¬ 
ral  introdutória  desses  seis  estágios,  que  serão  discutidos 
também  com  mais  detalhes  nos  próximos  dois  capítulos. 
No  lugar  de  incluir  um  exemplo  HBAT  como  ilustração 
da  técnica  neste  capítulo,  o  mesmo  será  apresentado  no 
próximo.  Os  dois  capítulos  que  se  seguem  são  devotados 
ao  teste  dos  modelos  de  mensuração  e  estrutural,  respecti¬ 
vamente.  Muitas  análises  SEM  envolvem  o  teste  da  teoria 
de  mensuração  (como  os  construtos  são  representados)  e 
da  teoria  estrutural  (como  os  construtos  se  relacionam  en¬ 
tre  si).  A  ilustração  da  HBAT  é  coberta  em  ambos  os  ca¬ 
pítulos.  O  Capítulo  11  cobre  os  primeiros  quatro  estágios 
da  SEM,  enquanto  o  Capítulo  12  trata  dos  dois  estágios 
restantes. 

Estágio  1:  Definição  de  construtos  individuais 

Uma  boa  teoria  de  mensuração  é  uma  condição  necessá¬ 
ria  para  se  obter  resultados  úteis  a  partir  da  SEM.  Tes¬ 
tes  de  hipóteses  envolvendo  as  relações  estruturais  entre 
construtos  não  serão  mais  confiáveis  ou  válidos  do  que  o 
modelo  de  mensuração  que  explica  como  esses  construtos 
são  construídos.  O  pesquisador  deve  investir  significativo 
tempo  e  esforço  no  início  do  processo  de  pesquisa  para 
garantir  que  a  qualidade  de  medição  permita  a  obtenção 
de  conclusões  válidas. 

Operacionalização  do  construto 

O  processo  começa  com  uma  boa  definição  dos  constru¬ 
tos  envolvidos.  Esta  definição  deve,  então,  fornecer  a  base 
para  a  seleção  ou  planejamento  de  itens  indicadores  in¬ 


dividuais.  Um  pesquisador  operacíonalíza  um  construto 
selecionando  seus  itens  de  escala  de  mensuração  e  tipo 
de  escala.  Em  pesquisas  de  levantamentos,  a  operacio¬ 
nalização  de  um  construto  freqüentemente  envolve  uma 
série  de  itens  de  escala  em  um  formato  comum,  como  a 
escala  Likert  ou  uma  escala  diferencial  semântica.  As  de¬ 
finições  e  itens  são  derivados  a  partir  de  duas  abordagens 
comuns. 

Escalas  de  pesquisa  anterior.  Em  muitos  casos,  constru¬ 
tos  podem  ser  definidos  e  operacionalizados  da  mesma 
maneira  como  foram  em  estudos  prévios.  Pesquisadores 
podem  fazer  uma  busca  na  literatura  sobre  os  construtos 
individuais  e  identificar  escalas  que  tiveram  bom  desem¬ 
penho  anterior.  Muita  pesquisa  atualmente  utiliza  escalas 
que  foram  publicadas  em  periódicos  especializados  ou  que 
estão  disponíveis  mediante  solicitação  direta  ao  autor. 


Por  exemplo,  se  um  pesquisador  precisa  medir  apoio  do 
supervisor,  muitos  estudos  fornecem  definições  úteis  e 
os  correspondentes  itens  de  escala.  Como  exemplo,  um 
estudo  define  apoio  do  supervisor  como  a  transferência 
de  recursos  emocionais  ou  instrumentais  para  um  co¬ 
lega  a  partir  de  seu  superior  no  ambiente  de  trabalho. 
Três  itens  Likert  são  fornecidos  como  indicadores  deste 
construto.  Os  itens  avaliam  em  que  medida  o  emprega¬ 
do  percebe  seu  supervisor  como  alguém  que  ouve  quan¬ 
do  ocorrem  problemas,  como  uma  pessoa  confiável  em 
situações  difíceis  e  como  um  colaborador  na  tarefa  de 
realizar  um  trabalho  [21]. 


Desenvolvimento  de  nova  escala.  Medidas  de  cons¬ 
trutos  podem  ser  desenvolvidas.  Tal  desenvolvimento  é 
apropriado  quando  um  pesquisador  está  estudando  algo 
que  não  tem  uma  história  rica  de  pesquisas  anteriores. 
O  processo  geral  de  desenvolvimento  de  itens  de  escala 
pode  ser  longo  e  detalhado.  O  essencial  deste  processo  é 
destacado  no  próximo  capítulo,  mas  o  leitor  deve  consul¬ 
tar  outras  fontes  para  uma  discussão  mais  completa  [11]. 

Pré- teste 

Geralmente,  quando  medidas  são  desenvolvidas  para 
um  estudo  ou  quando  elas  são  obtidas  de  várias  fon¬ 
tes,  algum  tipo  de  pré-teste  deve  ser  feito.  O  pré-teste 
deve  usar  respondentes  semelhantes  àqueles  da  popula¬ 
ção  a  ser  estudada,  de  modo  a  se  resguardar  quanto  a 
adequação.  Pré-testes  são  particularmente  importantes 
quando  escalas  são  aplicadas  em  contextos  específicos 
(p.ex.,  situações  de  compras,  indústrias  ou  outros  casos 
nos  quais  especificidade  é  imperativa)  ou  contextos  fora 
de  seus  usos  normais.  Testes  empíricos  dos  resultados  de 
pré-teste  são  feitos  de  uma  maneira  idêntica  à  análise  de 
modelo  final  (ver  discussão  no  estágio  4,  adiante  neste 
capítulo).  Itens  que  estatisticamente  não  se  comportam 
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como  o  esperado  podem  precisar  de  refinamento  ou  eli¬ 
minação,  para  evitar  esses  problemas  quando  o  modelo 
final  é  analisado. 

Resumo 

Um  dos  passos  mais  importantes,  ainda  que  por  vezes  seja 
subjetivo,  é  a  operacionalização  de  construtos.  Na  tentati¬ 
va  de  garantir  precisão  teórica,  muitas  vezes  os  pesquisa¬ 
dores  têm  diversas  escalas  estabelecidas  a  serem  escolhi¬ 
das,  cada  uma  sendo  uma  pequena  variação  das  demais. 
Porém,  mesmo  com  o  amplo  uso  de  escalas,  o  pesquisador 
freqüentemente  se  encontra  diante  da  falta  de  uma  escala 
estabelecida  e  deve  desenvolver  uma  nova  ou  modificar 
consideravelmente  uma  existente  para  o  novo  contexto. 
Em  todas  essas  situações,  o  modo  como  o  pesquisador 
seleciona  os  itens  para  medir  cada  construto  determina  a 
fundamentação  de  todo  o  restante  da  análise  SEM. 

Estágio  2:  Desenvolvimento  e 
especificação  do  modelo  de  medida 

Com  os  itens  de  escala  especificados,  a  pesquisa  agora  deve 
especificar  o  modelo  de  medição.  Neste  estágio,  cada  cons¬ 
truto  latente  a  ser  incluído  no  modelo  é  identificado  e  as 
variáveis  indicadoras  medidas  (itens)  são  designadas  para 
construtos  latentes.  Apesar  de  essa  identificação  e  designa¬ 
ção  poderem  ser  representadas  por  equações,  é  mais  sim¬ 
ples  representar  este  processo  com  um  diagrama.  O  Docu¬ 
mento  10-2b  representa  um  modelo  simples  de  mensuração 
de  dois  construtos,  com  quatro  indicadores  associados  a 
cada  construto  e  uma  relação  correlacionai  entre  eles. 

Estimação  do  modelo  completo  de  mensuração  envol¬ 
ve  especificação  de  termos  adicionais  (ou  seja,  termos  de 
erro  para  cada  indicador).  Uma  especificação  básica  pode 
ser  ilustrada  como  se  segue: 


O  modelo  de  mensuração  simples  na  Figura  10-7  tem 
um  total  de  17  parâmetros  estimados  (isto  é,  oito  car¬ 
gas  estimadas,  oito  erros  estimados  e  uma  estimativa 
de  correlação  entre  construtos).  A  carga  estimada  para 
cada  seta  ligando  um  construto  a  uma  variável  medida 


é  uma  estimativa  da  carga  de  uma  variável  -  o  grau  em 
que  aquele  item  está  relacionado  com  o  construto.  Este 
estágio  de  SEM  pode  ser  imaginado  como  uma  designa¬ 
ção  de  variáveis  individuais  a  construtos.  Visualmente, 
isso  responde  a  seguinte  questão:  onde  as  setas  devem 
ser  esboçadas  para  ligar  construtos  a  variáveis? 

Diversos  caminhos  possíveis  não  foram  especificados 
(p.ex.,  correlações  entre  variáveis  indicadoras,  cargas  de 
indicadores  em  mais  de  um  construto  etc.).  No  processo 
de  estimação,  essas  cargas  não-especificadas  (um  total 
de  19)  são  consideradas  nulas,  o  que  significa  que  elas 
não  serão  estimadas. 


A  especificação  do  modelo  de  mensuração  pode  ser 
um  processo  direto,  mas  diversas  questões  ainda  devem 
ser  tratadas.  O  Capítulo  11  oferece  uma  discussão  mais 
detalhada  de  cada  uma  delas.  Os  tipos  de  questões  são  lis¬ 
tados  abaixo: 

1.  Podemos  empiricamente  sustentar  a  validade  e  a  unidimen- 
sionalidade  dos  construtos?  Pontos  essenciais  devem  ser 
acionados  para  se  estabelecer  a  base  teórica  dos  construtos 
e  mensurações. 

2.  Quantos  indicadores  devem  ser  usados  para  cada  construto? 
Qual  é  o  número  mínimo  de  indicadores?  Há  um  máximo? 
Quais  são  as  ponderações  nas  decisões  sobre  aumento  ou 
diminuição  no  número  de  indicadores? 

3.  As  medições  devem  ser  consideradas  retratos  dos  constru¬ 
tos  (o  que  significa  que  elas  descrevem  o  construto)  ou  de¬ 
vem  ser  vistas  como  explicação  do  construto  (tal  como  com¬ 
binamos  indicadores  em  um  índice)?  Cada  abordagem  traz 
consigo  diferentes  interpretações  sobre  o  que  representa  o 
construto. 

O  pesquisador,  mesmo  com  escalas  bem  definidas, 
ainda  deve  confirmar  a  validade  e  a  unidimensionalidade 
neste  contexto  específico.  Em  qualquer  esforço  de  desen¬ 
volvimento  de  escala,  questões  como  o  número  de  indi¬ 
cadores  e  o  tipo  de  especificação  de  construto  devem  ser 
abordadas.  Pesquisadores  sempre  devem  garantir  que  tais 
questões  são  completamente  examinadas,  pois  quaisquer 
problemas  não-resolvidos  neste  estágio  podem  afetar  a 
análise  inteira,  geralmente  de  maneiras  não  percebidas. 


Cov„,2 


e,  02  63  64  65  eg  67  63 


FIGURA  10-7  Representação  visual  (diagrama  de  caminhos)  de  um  modelo  de  mensuração. 

*  N.  de  R.  T.:  A  notação  correta  das  quatro  cargas  correspondentes  ao  segundo  construto  (C2)  é:  L,  L32  e  L42. 
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Estágio  3:  Planejamento  de  nm  estndo 
para  prodnzir  resnltados  empíricos 

Com  o  modelo  básico  especificado  em  termos  de  constru- 
tos  e  variáveis/indicadores  medidos,  o  pesquisador  deve 
voltar  a  atenção  para  problemas  envolvendo  planejamen¬ 
to  de  pesquisa  e  estimação.  Os  seis  problemas  abordados 
nesta  seção  são  os  seguintes: 

Planejamento  de  pesquisa 

1.  Tipo  de  dados  analisados:  covariâncias  ou  correlações 

2.  Dados  perdidos 

3.  Tamanho  amostrai 

Estimação  de  modelo 

4.  Estrutura  do  modelo 

5.  Técnicas  de  estimação 

6.  Programa  computacional  usado 

A  SEM  tem  muitas  similaridades  com  outras  técnicas 
multivariadas  quanto  a  essas  questões,  mas  também  apre¬ 
senta  algumas  considerações  únicas. 

Questões  de  delineamento  de  pesquisa 

Como  acontece  com  qualquer  outra  técnica  multivariada, 
a  SEM  requer  consideração  cuidadosa  de  fatores  que  afe¬ 
tam  o  planejamento  de  pesquisa  e  que  são  necessários  para 
uma  análise  SEM  bem  sucedida.  Apesar  de  os  aspectos  es¬ 
tatísticos  da  estimação  SEM  serem  discutidos  na  próxima 
seção,  aqui  é  importante  observar  que  tamanho  da  amos¬ 
tra  e  dados  perdidos  podem  ter  profundo  efeito  sobre  os 
resultados,  não  importando  qual  o  método  empregado. 
Além  disso,  a  SEM  pode  ser  estimada  com  covariâncias 
ou  correlações.  Assim,  o  pesquisador  deve  escolher  o  tipo 
apropriado  de  matriz  de  dados  para  a  questão  de  pesquisa 
que  é  tratada.  Essas  três  questões  são  discutidas  na  próxi¬ 
ma  seção. 

Covariância  versus  correlação.  Pesquisadores  usuários 
de  análises  SEM  no  passado  debateram  sobre  o  uso  de 
matriz  de  covariância  versus  correlação  como  entrada.  A 
SEM  foi  originalmente  desenvolvida  usando-se  matrizes 
de  covariância  (por  isso  é  conhecida  pelo  nome  comum  de 
análise  de  estruturas  de  covariância).  Muitos  pesquisadores 
defenderam  o  emprego  de  correlações  como  uma  forma 
mais  simples  de  análise  que  era  mais  fácil  de  interpretar.  A 
questão  era  também  mais  central  para  o  planejamento  da 
pesquisa  quando  as  matrizes  de  entrada  eram  geralmente 
computadas  usando-se  alguma  outra  rotina  estatística  fora 
do  programa  SEM.  Era  necessária  uma  escolha  para  calcu¬ 
lar  e  dar  entrada  à  matriz  apropriada.  Hoje  em  dia,  a  maio¬ 
ria  dos  programas  SEM  pode  computar  uma  solução  para 
o  modelo  a  partir  dos  dados  originais  sem  que  o  pesqui¬ 
sador  calcule  uma  matriz  de  correlação  ou  de  covariância 
em  separado.  Agora  os  pesquisadores  devem  considerar  a 
escolha  de  correlações  ou  covariâncias  baseados  principal¬ 
mente  em  aspectos  interpretativos  e  estatísticos. 


Interpretação.  A  grande  vantagem  da  entrada  de 
correlações  para  a  SEM  decorre  do  fato  de  que  as  esti¬ 
mativas  paramétricas  resultantes  são  por  definição  prévia 
padronizadas,  o  que  significa  que  não  são  dependentes  de 
escala.  Todos  os  valores  estimados  devem  estar  no  inter¬ 
valo  de  -1,0  a  -h1,0,  tornando  a  identificação  de  estima¬ 
tivas  inadequadas  mais  fácil  do  que  com  covariâncias,  as 
quais  não  apresentam  um  intervalo  definido.  Contudo,  é 
simples  produzir  esses  resultados  a  partir  de  uma  entrada 
de  covariâncias,  requisitando-se  uma  solução  completa¬ 
mente  padronizada.  Dessa  maneira,  correlações  não  têm 
qualquer  vantagem  real  sobre  os  resultados  padronizados 
obtidos  com  o  uso  de  covariâncias. 

Impacto  estatístico.  As  principais  vantagens  no  em¬ 
prego  de  covariâncias  surgem  de  considerações  de  caráter 
estatístico.  Primeiro,  o  uso  de  correlações  como  entrada 
pode  às  vezes  conduzir  a  erros  nos  cálculos  do  erro  pa¬ 
drão  [9].  Além  disso,  toda  vez  que  hipóteses  se  referem 
a  questões  relacionadas  com  a  escala  ou  a  magnitude  de 
valores  (p.ex.,  comparação  de  médias),  então  covariâncias 
devem  ser  usadas  porque  esta  informação  não  é  retida 
usando-se  correlações.  Finalmente,  qualquer  comparação 
entre  amostras  exige  que  covariâncias  sejam  usadas  como 
dados  de  entrada.  Assim,  covariâncias  têm  vantagens  dis¬ 
tintas  em  termos  de  suas  propriedades  estatísticas  versus 
correlações. 

Resumo.  Ao  se  comparar  o  emprego  de  correlações 
com  o  de  covariâncias,  recomendamos  o  de  covariâncias 
sempre  que  possível.  Programas  de  computador,  hoje 
em  dia,  tornam  a  seleção  de  uma  opção  em  vez  de  outra 
apenas  uma  questão  de  escolha  do  tipo  de  dados  a  serem 
computados  a  partir  do  menu  apropriado  [25].  Matrizes 
de  covariância  oferecem  ao  pesquisador  uma  flexibilidade 
muito  maior,  devido  ao  conteúdo  de  informação  relativa¬ 
mente  maior  que  elas  contêm. 

Dados  perdidos.  Exatamente  como  em  outros  procedi¬ 
mentos  multivariados,  o  pesquisador  deve  tomar  diversas 
decisões  importantes  referentes  a  dados  perdidos.  Duas 
questões  devem  ser  respondidas  no  que  diz  respeito  a  da¬ 
dos  perdidos,  para  que  se  trate  adequadamente  de  qual¬ 
quer  problema  que  isso  possa  criar: 

1.  Os  dados  perdidos  são  suficientes  e  não-aleatórios  a  pon¬ 
to  de  provocarem  problemas  de  estimação  ou  interpreta¬ 
ção? 

2.  Se  dados  perdidos  devem  ser  corrigidos,  qual  é  a  melhor 
abordagem? 

Discutiremos  os  aspectos  que  se  relacionam  especifi¬ 
camente  com  SEM  e  dados  perdidos  na  próxima  seção. 
O  leitor  deve  também  rever  o  Capítulo  2,  no  qual  é  dada 
uma  discussão  mais  completa  sobre  cada  técnica  e  os  mé¬ 
todos  de  avaliação  da  extensão  e  do  padrão  de  dados  per¬ 
didos. 
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Extensão  e  padrão  de  dados  perdidos.  Notavel¬ 
mente,  dados  perdidos  sempre  devem  ser  corrigidos  se 
seguirem  um  padrão  não-aleatório  ou  se  mais  de  10% 
dos  itens  de  dados  estão  faltando.  Dados  perdidos  são 
considerados  como  completamente  perdidos  ao  acaso 
(MCAR)  se  o  padrão  de  dados  perdidos  para  uma  variá¬ 
vel  não  depender  de  qualquer  outra  variável  no  conjunto 
de  dados  ou  dos  valores  da  variável  em  si  [40].  Se  o  pa¬ 
drão  de  dados  perdidos  para  uma  variável  se  relaciona 
com  outras  variáveis,  mas  não  com  seus  próprios  valores, 
então  ele  é  considerado  como  sendo  perdido  ao  acaso 
(MAR).  Novamente,  o  Capítulo  2  oferece  uma  discus¬ 
são  muito  mais  detalhada  sobre  os  procedimentos  em¬ 
pregados  na  avaliação  da  extensão  e  do  padrão  de  dados 
perdidos. 

Ações  corretivas  em  dados  perdidos.  Três  métodos 
básicos  estão  disponíveis  para  resolver  o  problema  de  da¬ 
dos  perdidos:  a  abordagem  de  caso  completo  (conhecida 
como  eliminação  por  lista),  a  abordagem  totalmente  dis¬ 
ponível  (conhecida  como  eliminação  aos  pares)  e  as  técni¬ 
cas  de  atribnição  baseadas  em  modelos.  Tradicionalmen¬ 
te,  eliminação  por  lista  era  considerada  mais  apropriada 
para  SEM.  Mais  recentemente,  a  eliminação  aos  pares, 
que  permite  o  uso  de  mais  dados,  tem  sido  aplicada.  Am¬ 
bos  os  procedimentos  podem  gerar  problemas  [1]. 

Como  resultado,  programas  SEM  introduziram  uma 
forma  de  atribuição  geralmente  conhecida  como  aborda¬ 
gens  baseadas  em  modelos.  Elas  estendem  a  técnica  mais 
comum  de  substituição  pela  média  no  sentido  de  que  da¬ 
dos  perdidos  são  atribuídos  (substituídos)  com  base  em 
todos  os  dados  disponíveis  para  um  dado  respondente. 
As  duas  abordagens  mais  comuns  são  (1)  a  estimação  de 
máxima  verossimilhança  dos  valores  perdidos  (ML)  e  (2) 


o  método  EM,  que  estima  os  valores  de  cada  média  e 
covariância  como  se  não  houvesse  qualquer  dado  perdi¬ 
do.  Esta  abordagem  difere  no  sentido  de  usar  a  informa¬ 
ção  não-perdida  disponível  para  um  respondente  a  fim 
de  fornecer  uma  estimativa  de  máxima  verossimilhança 
das  médias  e  covariâncias  amostrais  (no  lugar  dos  dados 
reais).  Uma  discussão  detalhada  desses  métodos  de  atri¬ 
buição  está  além  de  nosso  escopo,  mas  está  à  disposição 
em  várias  fontes  [13]. 

Escolha  de  uma  abordagem  de  dados  perdi¬ 
dos.  Qual  é  o  melhor  método  para  se  lidar  com  dados 
perdidos  para  SEM  em  geral?  Quando  os  dados  perdidos 
são  aleatórios,  são  menos  que  10%  das  observações,  e  as 
cargas  fatoriais  são  relativamente  elevadas  (0,7  ou  mais), 
bons  resultados  podem  ser  esperados  usando-se  qualquer 
uma  dessas  abordagens  de  dados  perdidos  [12].  Contudo, 
em  outros  casos,  a  seleção  apropriada  de  um  tratamento 
para  dados  perdidos  pode  resultar  em  maior  confiança  de 
que  os  resultados  são  válidos  e  livres  de  vieses.  Q  impac¬ 
to  da  técnica  selecionada  sobre  convergência  de  modelo, 
precisão  de  estimativa  de  parâmetro  e  precisão  de  quali¬ 
dade  de  ajuste  depende  não  somente  de  quanto  existe  de 
dados  perdidos,  mas  também  do  verdadeiro  tamanho  das 
cargas  fatoriais  e  do  tamanho  da  amostra  geral  [12]. 

A  Tabela  10-1  resume  as  vantagens  e  desvantagens  de 
cada  técnica.  A  abordagem  de  caso  completo  (eliminação 
por  lista)  se  torna  particularmente  problemática  quando 
amostras  e  cargas  fatoriais  são  pequenas.  Reciprocamen¬ 
te,  as  vantagens  das  técnicas  baseadas  em  modelos  se  tor¬ 
nam  evidentes  quando  tamanhos  amostrais  e  cargas  fato¬ 
riais  são  geralmente  menores.  A  abordagem  totalmente 
disponível  (eliminação  aos  pares)  tem  muitas  boas  pro¬ 
priedades,  mas  o  usuário  deve  estar  ciente  da  inflação  po- 


TABELA  10-1  Algumas  vantagens  e  desvantagens  de  diferentes  métodos  de  dados  perdidos 


Método 


Vantagens 


Desvantagens 


Caso  completo  (lista) 


Totalmente  disponível 
(aos  pares) 


Baseado  em  modelos 
(MUEM) 


X  mostra  pouco  viés  sob  a  maioria  das  • 
condições 

Tamanho  efetivo  de  amostra  é  conhecido 
Fácil  de  implementar  usando  qualquer 
programa  • 


Menos  problemas  com  convergência  • 

Estimativas  de  cargas  fatoriais 
relativamente  livres  de  vieses 
Fácil  de  implementar  usando  qualquer  • 

programa  • 

Menos  problemas  com  convergência  • 

X  mostra  pouco  viés  sob  a  maioria  das  • 

condições 

Viés  mínimo  sob  condições  de  dados 
perdidos  aleatórios 


Aumenta  a  probabilidade  de  não-convergência  (pro¬ 
grama  SEM  não  consegue  encontrar  uma  solução) 
a  menos  que  cargas  fatoriais  sejam  altas  (>  0,6)  e 
tamanhos  amostrais  sejam  grandes  (>  250) 
Probabilidade  aumentada  de  vieses  nas  cargas 
fatoriais 

Probabilidade  aumentada  de  vieses  em  estimativas 
de  relações  entre  fatores 

X  sofre  viés  para  cima  quando  os  dados  perdidos 
excedem  1 0%,  cargas  fatoriais  são  altas  e  tama¬ 
nhos  amostrais  são  grandes 
Tamanho  amostrai  efetivo  é  incerto 
Não  tão  bem  conhecido 
Indisponível  em  programas  SEM  mais  antigos 
Tamanho  amostrai  efetivo  é  incerto  para  EM 


Wofa:  Ver  Enders  e  Bandalos  (2001)  e  Enders  e  Peugh  (2004)  para  mais  detalhes.  ML/EM  foram  combinados  com  base  nas  diferenças  negligenciá¬ 
veis  entre  os  resultados  para  os  dois  (Enders  e  Peugh,  2004). 
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tencial  de  estatísticas  de  ajuste  quando  uma  quantia  mo¬ 
desta  ou  grande  de  dados  está  faltando  e  cargas  fatoriais 
são  grandes. 

Uma  consideração  final  na  seleção  de  uma  técnica  é 
a  especificação  do  tamanho  da  amostra.  As  técnicas  de 
abordagem  totalmente  disponível  (aos  pares)  e  baseada 
em  modelos  complicam  a  especificação  do  tamanho  amos¬ 
trai,  uma  vez  que  elas  potencialmente  utilizam  diferentes 
tamanhos  de  amostra  para  cada  termo  de  covariância.  No 
entanto,  o  pesquisador  pode  apenas  especificar  um  tama¬ 
nho  geral  (N)  usado  nos  cálculos  de  ajuste  geral  e  de  erros 
padrão  de  parâmetros.  Usando  PD  para  ilustrar,  o  pesqui¬ 
sador  não  pode  mais  identificar  um  só  tamanho  amostrai, 
pois  o  N  para  a  covariância  entre  duas  variáveis  quaisquer 
é  possivelmente  diferente  do  N  para  a  covariância  entre 
duas  variáveis  distintas.  Pesquisadores  SEM  investigaram 
os  variados  efeitos  de  se  estabelecer  N  como  o  tamanho 
da  amostra  completa  (o  maior  número  de  observações),  o 
tamanho  médio  da  amostra  e  o  tamanho  mínimo  da  mes¬ 
ma  (o  menor  N  associado  com  qualquer  covariância  amos¬ 
trai).  Esses  resultados  geralmente  sugerem  que  a  inserção 
do  tamanho  mínimo  conduz  aos  menores  problemas  com 
convergência,  viés  de  ajuste  e  viés  de  estimativas  paramé¬ 
tricas  [8, 13]. 

Resumindo,  quando  o  tamanho  amostrai  excede  250  e 
a  quantia  total  de  dados  perdidos  envolvidos  entre  as  va¬ 
riáveis  medidas  está  abaixo  de  10%,  então  a  abordagem 
totalmente  disponível  (aos  pares)  é  uma  boa  solução  para 
o  problema  de  perda  de  dados.  Com  este  método,  o  tama¬ 
nho  da  amostra  (N)  deve  ser  estabelecido  como  o  tamanho 
mínimo  (o  menor)  disponível  para  quaisquer  duas  covari- 
âncias.  Com  amostras  pequenas  e  quando  a  quantia  de  da¬ 
dos  perdidos  se  torna  grande,  então  as  abordagens  basea¬ 
das  em  modelos  (EM/ML)  se  tornam  uma  opção  superior. 
No  entanto,  deve-se  ter  cuidado  ao  se  extrair  conclusões  a 
partir  de  qualquer  amostra  que  contenha  grandes  quanti¬ 
dades  de  dados  perdidos. 

Tamanho  amostrai.  Em  geral,  a  SEM  requer  uma 
amostra  maior  em  comparação  com  outras  técnicas  mul- 
tivariadas.  Alguns  dos  algoritmos  estatísticos  usados  por 
programas  SEM  não  são  confiáveis  com  amostras  peque¬ 
nas.  Tamanho  amostrai,  como  em  qualquer  outro  método 
estatístico,  fornece  uma  base  para  a  estimação  de  erro  de 
amostragem.  Como  ponto  de  partida  para  a  discussão  de 
tamanho  amostrai  em  SEM,  o  leitor  pode  rever  as  discus¬ 
sões  sobre  tamanhos  exigidos  para  análise  fatorial  explo¬ 
ratória  (Capítulo  3).  Sabendo-se  que  amostras  maiores 
geralmente  demandam  mais  tempo  e  são  mais  caras  de  se 
obter,  a  questão  crítica  em  SEM  envolve  o  quão  grande 
uma  amostra  deve  ser  para  produzir  resultados  confiáveis. 

Opiniões  referentes  a  tamanhos  mínimos  de  amostras 
têm  variado  [28, 29].  Diretrizes  propostas  variam  com  pro¬ 
cedimentos  de  análises  e  características  de  modelos.  Cinco 
considerações  que  afetam  o  tamanho  exigido  para  amostra 
em  SEM  incluem  as  seguintes: 


1.  Distribuição  multivariada  de  dados 

2.  Técnica  de  estimação 

3.  Complexidade  do  modelo 

4.  Quantia  de  dados  perdidos 

5.  Quantia  de  variância  média  de  erro  entre  os  indicadores  re¬ 
flexivos 

Cada  uma  dessas  considerações  é  tratada  nos  próximos 
parágrafos. 

Distribuição  multivariada.  A  medida  que  os  dados 
se  desviam  mais  da  suposição  de  normalidade  multivaria¬ 
da,  a  proporção  de  respondentes  em  relação  a  parâmetros 
precisa  ser  maior.  Uma  proporção  geralmente  aceita  para 
minimizar  problemas  com  os  desvios  da  normalidade  é  de 
15  respondentes  para  cada  parâmetro  estimado  no  modelo. 
Apesar  de  alguns  procedimentos  de  estimação  serem  espe¬ 
cificamente  projetados  para  lidar  com  dados  não  normais, 
o  pesquisador  sempre  é  encorajado  a  fornecer  tamanho 
amostrai  suficiente  para  permitir  que  o  impacto  do  erro 
amostrai  seja  minimizado,  especialmente  para  dados  não- 
normais  [46]. 

Técnica  de  estimação.  O  procedimento  de  estimação 
SEM  mais  comum  é  a  estimação  de  máxima  verossimilhan¬ 
ça  (MLE).  E  sabido  que  ela  fornece  resultados  válidos  com 
tamanhos  amostrais  tão  pequenos  quanto  50,  mas  os  tama¬ 
nhos  mínimos  recomendados  para  garantir  soluções  MLE 
estáveis  são  de  100  a  150.  MLE  é  uma  abordagem  iterativa 
que  torna  mais  provável  que  amostras  pequenas  produzam 
resultados  inválidos.  Um  tamanho  amostrai  recomenda¬ 
do  é  200,  o  que  fornece  uma  base  sólida  para  estimação. 
Deve  ser  observado  que  à  medida  que  o  tamanho  amos¬ 
trai  se  torna  grande  (>400),  o  método  fica  mais  sensível  e 
praticamente  qualquer  diferença  é  detectada,  fazendo  com 
que  as  medidas  de  qualidade  de  ajuste  sugiram  ajuste  ruim 
[43].  Como  resultado,  tamanhos  amostrais  entre  150  e  400 
são  sugeridos,  sujeitos  às  outras  considerações  discutidas  a 
seguir. 

Complexidade  do  modelo.  Modelos  mais  simples  po¬ 
dem  ser  testados  com  amostras  menores.  De  forma  mais 
simples,  mais  variáveis  medidas  ou  indicadoras  exigem 
amostras  maiores.  Não  obstante,  modelos  podem  ser  com¬ 
plexos  em  outras  situações  a  ponto  de  todas  exigirem  tama¬ 
nhos  amostrais  maiores: 

•  Modelos  com  mais  construtos  que  exigem  mais  parâmetros  a 
serem  estimados 

•  Modelos  SEM  com  construtos  que  têm  menos  de  três  variá¬ 
veis  medidas/indicadoras 

•  Análises  multigrupo  que  demandam  uma  amostra  adequada 
para  cada  grupo 

O  papel  do  tamanho  da  amostra  é  produzir  mais  infor¬ 
mação  e  maior  estabilidade,  o  que  auxilia  o  pesquisador 
na  execução  da  SEM.  Uma  vez  que  um  pesquisador  tenha 
excedido  o  tamanho  absoluto  mínimo  (uma  observação  a 
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mais  do  que  o  número  de  covariâncias  observadas),  amos¬ 
tras  maiores  significam  menor  variabilidade  e  maior  estabi¬ 
lidade  nas  soluções.  Assim,  a  complexidade  do  modelo  em 
SEM  conduz  à  necessidade  por  amostras  maiores. 

Dados  perdidos.  Dados  perdidos  complicam  o  tes¬ 
te  de  modelos  SEM  e  o  uso  de  SEM  em  geral,  porque  na 
maioria  das  abordagens  para  se  corrigir  dados  perdidos  o 
tamanho  da  amostra  é  reduzido  em  algum  grau  a  partir 
do  número  original  de  casos.  Dependendo  da  técnica  de 
dados  perdidos  considerada  e  da  extensão  antecipada  dos 
mesmos  e  até  dos  tipos  de  questões  sendo  tratadas,  o  que 
pode  incluir  maiores  níveis  de  dados  perdidos,  o  pesquisa¬ 
dor  deve  planejar  um  aumento  no  tamanho  amostrai  para 
compensar  quaisquer  problemas  de  dados  perdidos. 

Variância  média  de  erro  de  indicadores.  Pesquisas 
recentes  indicam  que  o  conceito  de  comunalidade  (ver 
Capítulo  3  para  mais  detalhes)  é  uma  forma  mais  relevan¬ 
te  de  abordar  a  questão  do  tamanho  amostrai.  Comunali- 
dades  representam  a  quantia  média  de  variação  entre  as 
variáveis  medidas/indicadoras  explicada  pelo  modelo  de 
medição.  Comunalidades  podem  ser  diretamente  calcula¬ 
das  a  partir  de  cargas  de  construtos  (ver  Capítulo  11).  Es¬ 
tudos  mostram  que  amostras  maiores  são  exigidas  quando 
comunalidades  ficam  menores  (ou  seja,  os  construtos  não- 
observados  não  estão  explicando  tanta  variância  nos  itens 
medidos).  Modelos  contendo  múltiplos  construtos  com 
comunalidades  menores  que  0,5  (ou  seja,  estimativas  de 
cargas  padronizadas  menores  que  0,7)  também  requerem 
tamanhos  maiores  para  convergência  e  estabilidade  de 
modelo  [12].  O  problema  é  exagerado  quando  modelos 
têm  um  ou  dois  fatores. 

Resumo  sobre  tamanho  amostrai.  A  medida  que  a 
SEM  amadurece  e  pesquisa  adicional  sobre  questões  rele¬ 
vantes  a  respeito  de  delineamento  de  pesquisa  é  realizada, 
diretrizes  prévias  como  “sempre  maximize  seu  tamanho 
amostrai”  e  “amostras  de  300  são  exigidas”  não  são  mais 
apropriadas.  Ainda  é  verdade  que  amostras  maiores  geral¬ 
mente  produzem  soluções  mais  estáveis  que  são  mais  pro¬ 
váveis  de  serem  replicadas,  mas  foi  mostrado  que  decisões 
referentes  a  tamanho  amostrai  devem  ser  tomadas  com 
base  em  um  conjunto  de  fatores. 

Baseadas  na  discussão  sobre  tamanho  de  amostra,  as 
sugestões  a  seguir  são  oferecidas  com  base  na  complexida¬ 
de  do  modelo  e  nas  características  fundamentais  do  mode¬ 
lo  de  mensuração: 

•  Modelos  SEM  contendo  cinco  construtos  ou  menos,  cada 
um  com  mais  de  três  itens  (variáveis  observadas)  e  com  co¬ 
munalidades  elevadas  (0,6  ou  mais),  podem  ser  adequada¬ 
mente  estimados  com  amostras  tão  pequenas  quanto  as  de 
100-150. 

•  Se  alguma  comunalidade  for  modesta  (0,45-0,55),  ou  se  o 
modelo  contém  construtos  com  menos  de  três  itens,  então  o 
tamanho  exigido  para  a  amostra  é  da  ordem  de  200. 


•  Se  as  comunalidades  forem  inferiores  ou  se  o  modelo  incluir 
múltiplos  construtos  subidentificados  (menos  que  3  itens), 
então  tamanhos  amostrais  mínimos  de  300  ou  mais  são  ne¬ 
cessários  para  que  sejamos  capazes  de  recuperar  parâme¬ 
tros  da  população. 

•  Quando  o  número  de  fatores  for  maior  que  seis,  sendo  que 
alguns  deles  usam  menos  de  três  itens  medidos  como  indica¬ 
dores  e  múltiplas  comunalidades  baixas  estão  presentes,  as 
exigências  referentes  a  tamanho  de  amostra  podem  exceder 
500. 

Além  dessas  características  do  modelo  a  ser  estimado, 
o  tamanho  amostrai  deve  ser  aumentado  nas  seguintes 
circunstâncias: 

•  Dados  exibem  características  não-normais 

•  Certos  procedimentos  alternativos  de  estimação  são  usados 

•  Espera-se  mais  de  10%  de  dados  perdidos 

Para  garantir  uma  solução  precisa,  o  pesquisador  ago¬ 
ra  deve  considerar  vários  fatores  potenciais  que  podem 
influenciar  aumentos  no  tamanho  amostrai  em  diretrizes 
mais  gerais. 

Resumo  das  questões  sobre  deliueameuto  de  pesqui¬ 
sa.  Ao  se  planejar  uma  análise  SEM,  o  pesquisador 
deve  abordar  questões  enfrentadas  por  todas  as  técni¬ 
cas  multivariadas:  tipos  de  dados  a  serem  analisados, 
o  impacto  de  dados  perdidos,  e  o  tamanho  de  amostra 
exigido  para  se  atender  as  metas  de  pesquisa.  A  carac¬ 
terística  ímpar  da  análise  SEM  concentradas  sobre  a 
matriz  de  covariância,  no  lugar  das  observações  indi¬ 
viduais,  demanda  alguns  ajustes  em  nossas  orientações 
anteriores  sobre  tais  questões.  No  entanto,  independen¬ 
temente  dos  ajustes,  o  impacto  potencial  de  tais  fatores 
é  tão  crítico  em  SEM  quanto  em  qualquer  outra  técnica 
multivariada. 

Questões  sobre  estimação  de  modelo 

Além  dos  aspectos  mais  gerais  sobre  planejamento  de 
pesquisa  discutidos  na  seção  anterior,  a  análise  SEM  tem 
também  diversas  características  únicas.  Essas  característi¬ 
cas  se  relacionam  com  a  estrutura  do  modelo,  a  técnica  de 
estimação  empregada  e  o  programa  de  computador  sele¬ 
cionado  para  a  análise. 

Estrutura  do  modelo.  O  passo  mais  importante  para  se 
estabelecer  uma  análise  SEM  é  a  determinação  e  a  comu¬ 
nicação  da  estrutura  do  modelo  teórico  para  o  progra¬ 
ma.  Diagramas  de  caminhos  como  aqueles  utilizados  em 
exemplos  anteriores  podem  ser  úteis  para  este  fim.  Co¬ 
nhecendo  a  estrutura  do  modelo  teórico,  o  pesquisador 
pode  então  especificar  os  parâmetros  a  serem  estimados. 
Esses  modelos  freqüentemente  incluem  abreviações  SEM 
comuns  que  denotam  o  tipo  de  relação  ou  variável  referi¬ 
da.  O  Apêndice  lOB  inclui  um  guia  para  essas  abreviações 
comuns. 

Apesar  de  a  especificação  de  fatores  livres  e  fixos  ser 
relativamente  simples,  tal  tarefa  é  uma  diferença  crítica 
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entre  a  SEM  e  muitas  outras  técnicas  multivariadas.  Um 
parâmetro  livre  é  um  que  deve  ser  estimado  pela  análise 
SEM.  Um  parâmetro  fixo  é  aquele  cujo  valor  é  especificado 
pelo  pesquisador.  Geralmente  um  parâmetro  fixo  recebe  o 
valor  zero,  indicando  que  nenhuma  relação  é  estimada.  A 
SEM  requer  que  cada  possível  parâmetro  seja  especificado 
como  estimado  ou  não.  Hoje  em  dia,  programas  com  inter¬ 
faces  gráficas  (discutidos  em  uma  seção  adiante)  permitem 
que  o  pesquisador  facilmente  especifique  os  parâmetros  a 
serem  estimados,  muitas  vezes  diretamente  em  um  diagra¬ 
ma  de  caminhos.  No  entanto,  não  importando  qual  progra¬ 
ma  é  usado,  o  pesquisador  deve  ser  capaz  de  especificar  o 
modelo  SEM  completo  em  termos  de  cada  parâmetro  a  ser 
estimado. 

Técnica  de  estimação.  Logo  que  o  modelo  é  especificado, 
pesquisadores  devem  escolher  como  o  modelo  será  estima¬ 
do.  Em  outras  palavras,  qual  algoritmo  matemático  será 
utilizado  para  identificar  estimativas  para  cada  parâmetro 
livre?  Diversas  opções  estão  disponíveis  para  se  obter  uma 
solução  SEM. 

As  primeiras  tentativas  de  estimação  de  modelo  de 
equações  estruturais  foram  realizadas  com  regressão  de 
mínimos  quadrados  ordinários  (OLS).  Esses  esforços  fo¬ 
ram  rapidamente  superados  pela  estimação  de  máxima 
verossimilhança  (MEE),  que  é  mais  eficiente  e  sem  vieses 
quando  a  suposição  de  normalidade  multivariada  é  aten¬ 
dida.  MEE  foi  usada  nas  primeiras  versões  de  LISREL 
e  se  tornou  a  técnica  mais  amplamente  empregada  na 
maioria  dos  programas  SEM.  A  sensibilidade  potencial 
da  MEE  para  não-normalidade,  porém,  criou  uma  neces¬ 
sidade  por  técnicas  alternativas  de  estimação.  Métodos 
como  os  mínimos  quadrados  ponderados  (WLS),  míni¬ 
mos  quadrados  generalizados  (GLS),  e  estimação  as- 
sintoticamente  livre  de  distribuição  (ADE)  se  tornaram 
disponíveis  [16].  A  técnica  ADE  recebeu  particular  aten¬ 
ção  devido  a  sua  insensibilidade  à  não-normalidade  dos 
dados.  Sua  principal  desvantagem  é  o  tamanho  amostrai 
maior  exigido. 

Todas  as  técnicas  alternativas  de  estimação  se  populari¬ 
zaram  à  medida  que  os  computadores  pessoais  tornaram-se 
mais  potentes,  tornando-as  úteis  para  problemas  típicos.  A 
MEE  continua  sendo  a  técnica  mais  empregada  e  é  a  opção 
padrão  na  maioria  dos  programas  SEM.  Na  verdade,  ela 
tem  se  mostrado  bastante  robusta  diante  de  violações  da 
suposição  de  normalidade.  Pesquisadores  compararam  a 
MEE  com  outras  técnicas  e  ela  produziu  resultados  confiá¬ 
veis  sob  muitas  circunstâncias  [35, 36]. 

Programas  de  computador.  Diversos  programas  estatísti¬ 
cos  prontamente  disponíveis  são  convenientes  para  execu¬ 
tar  SEM.  Tradicionalmente,  o  programa  mais  usado  é  LIS¬ 
REL  (Linear  Structural  RELations)  [7,  25],  um  programa 
flexível  que  pode  ser  aplicado  em  muitas  situações  (ou  seja, 
estudos  cross-section,  experimentais,  quase-experimentais 


e  longitudinais).  Pesquisadores  de  muitas  áreas  de  estudo 
têm  aplicado  SEM  usando  LISREL,  e  isso  se  tornou  qua¬ 
se  sinônimo  de  modelagem  de  equações  estruturais.  EQS 
(uma  abreviação  para  equações)  é  outro  programa  ampla¬ 
mente  usado  que  também  pode  executar  regressão,  análise 
fatorial  e  testar  modelos  estruturais  [4].  AMOS  (Análise  de 
Estruturas  de  Momento)  é  um  terceiro  programa  que  tem 
conquistado  popularidade  por  ser  amigável  e  disponível 
como  uma  adição  ao  SPSS.  AMOS  também  esteve  entre  os 
primeiros  programas  SEM  a  simplificar  a  interface  de  modo 
que  um  pesquisador  poderia  executar  uma  análise  sem  ter 
que  escrever  qualquer  código  computacional.  Finalmente, 
CALIS  é  um  programa  SEM  disponível  com  SAS. 

Em  última  instância,  a  escolha  de  um  programa  SEM 
é  baseada  na  preferência  do  pesquisador  e  na  disponibili¬ 
dade.  Os  programas  estão,  na  verdade,  se  tornando  mais 
parecidos  à  medida  que  evoluem.  AMOS,  EQS  e  LISREL 
estão  disponíveis  com  interfaces  do  tipo  “aponte -e -clique”. 
Cada  um  deles  tem  também  uma  interface  gráfica  que  per¬ 
mite  ao  pesquisador  modificar  o  programa  com  um  diagra¬ 
ma  de  caminhos  interativo.  O  que  muda  de  programa  para 
programa  é  a  notação.  LISREL  usa  letras  gregas  para  re¬ 
presentar  fatores  latentes,  termos  de  erro  e  estimativas  de 
parâmetros,  e  letras  latinas  (x  e  y)  para  representar  variá¬ 
veis  observadas.  Esta  notação  fornece  uma  abreviação  con¬ 
veniente  para  a  descrição  de  modelos  e  a  comunicação  com 
o  programa.  Esta  tem  se  tornado  a  abreviação  mais  comum 
para  SEM,  a  qual  simplifica  consideravelmente  discussões 
uma  vez  que  o  usuário  se  familiariza  com  ela. 

Os  outros  programas  apóiam-se  menos  em  abreviações 
gregas  e  usam  mais  outras  notações,  como  distinções  entre 
letras  latinas  maiúsculas  e  minúsculas  ou  diferentes  cores 
para  descrever  diferentes  tipos  de  variável  e  relação.  Ape¬ 
sar  de  o  poder  computacional  ter  sido  uma  questão,  hoje 
em  dia  todos  esses  programas  estão  disponíveis  em  versões 
que  são  processadas  facilmente  praticamente  em  qualquer 
computador  pessoal.  Para  a  maioria  das  aplicações  padrão, 
esses  programas  devem  produzir  resultados  substantivos 
semelhantes.  Um  apêndice  no  final  do  Capítulo  II  ilustra 
essa  aplicação  com  mais  detalhes. 

Resumo  das  questões  sobre  estimação.  Os  aspectos  ím¬ 
pares  encontrados  na  análise  SEM  já  foram  problemáticos 
para  o  pesquisador  iniciante,  mas  os  avanços  em  algorit¬ 
mos  estatísticos  e  programas  de  computador  oferecem  não 
apenas  uma  gama  maior  de  opções  de  estimação  para  se 
lidar  com  várias  condições  nos  dados  de  entrada,  mas  tam¬ 
bém  melhoram  a  interface  entre  pesquisador  e  programa. 
O  pesquisador  atual  dispõe  de  uma  miríade  de  opções  de 
análise  em  qualquer  um  dos  pacotes  computacionais  que 
podem  tratar  de  qualquer  questão  de  pesquisa  apropriada 
para  uma  análise  SEM.  Assim,  pesquisadores  devem  ser 
vigilantes  em  não  permitir  que  as  facilidades  de  uso  dos 
softwares  substituam  o  julgamento  teórico  e  o  controle  do 
pesquisador,  os  quais  são  essenciais  em  SEM. 
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-  REGRAS  PRÁTICAS  10-2  - 

Estágios  1-3  de  SEM 

•  Quando  um  modelo  tem  escalas  inspiradas  em  várias  fontes 
relativas  a  outras  pesquisas,  recomenda-se  um  pré-teste 
usando  respondentes  semelhantes  àqueles  da  população  a 
ser  estudada,  para  examinar  itens  quanto  a  adequação 

•  Eliminação  aos  pares  de  casos  perdidos  (abordagem 
totalmente  disponível)  é  uma  boa  alternativa  para  se  lidar 
com  dados  perdidos  quando  a  quantia  destes  é  inferior  a 
10%  e  o  tamanho  amostrai  gira  em  torno  de  250  ou  mais 

•  Quando  os  tamanhos  amostrais  se  tornam  pequenos 
ou  quando  os  dados  perdidos  excedem  10%,  um  dos 
métodos  de  atribuição  para  dados  perdidos  passa  a  ser 
uma  boa  alternativa  para  se  lidar  com  dados  perdidos 

•  Quando  a  quantia  de  dados  perdidos  fica  muito  elevada 
(15%  ou  mais),  a  SEM  pode  não  ser  adequada 

•  A  matriz  de  covariância  observada  da  amostra  (S)  pode 
ser  representada  por  uma  matriz  de  covariância  ou  de 
correlação 

•  Matrizes  de  covariância  fornecem  ao  pesquisador  uma 
maior  flexibilidade  decorrente  do  conteúdo  informativo 
relativamente  maior  que  elas  contêm  e  são  a  forma 
recomendada  de  entrada  para  modelos  SEM 

•  Q  tamanho  mínimo  de  amostra  para  um  modelo  SEM 
em  particular  depende  de  vários  fatores,  incluindo  a 
complexidade  do  modelo  e  as  comunalidades  (variância 
média  extraída  entre  itens)  em  cada  fator: 

•  Modelos  SEM  contendo  cinco  ou  menos  construtos, 
cada  um  com  mais  de  três  itens  (variáveis  observadas)  e 
com  elevadas  comunalidades  (0,6  ou  mais),  podem  ser 
adequadamente  estimados  com  amostras  tão  pequenas 
quanto  100-150 

•  Quando  o  número  de  fatores  é  maior  que  seis,  sendo 
que  alguns  deles  têm  menos  que  três  itens  medidos 
como  indicadores,  e  múltiplas  comunalidades  baixas 
estão  presentes,  as  exigências  de  tamanho  amostrai 
podem  exceder  500 


Estágio  4:  Avaliação  da  validade 
do  modelo  de  medida 

Com  o  modelo  de  mensuração  especificado,  dados  sufi¬ 
cientes  coletados  e  decisões  importantes  já  tomadas,  como 
a  técnica  de  estimação,  o  pesquisador  chega  ao  evento 
mais  fundamental  do  teste  de  SEM:  “O  modelo  de  men¬ 
suração  é  válido?”.  Validade  de  modelo  de  mensuração 
depende  da  qualidade  de  ajuste  para  o  mesmo  e  evidência 
específica  de  validade  de  construto. 

Qualidade  de  ajuste  (GOF)  indica  o  quão  bem  o  mode¬ 
lo  especificado  reproduz  a  matriz  de  covariância  entre  os 
itens  indicadores  (ou  seja,  a  similaridade  entre  as  matrizes 
de  covariância  estimada  e  observada).  Desde  a  primeira 
vez  que  a  medida  GOF  foi  desenvolvida,  pesquisadores 


têm  procurado  refinar  e  desenvolver  novas  medidas  que 
reflitam  várias  facetas  da  habilidade  do  modelo  para  re¬ 
presentar  os  dados.  Dessa  forma,  diversas  medidas  alter¬ 
nativas  de  GOF  estão  à  disposição  do  pesquisador.  Cada 
medida  GOF  é  única,  mas  as  medições  são  classificadas 
em  três  grupos  gerais:  medidas  absolutas,  medidas  incre¬ 
mentais  e  medidas  de  ajuste  de  parcimônia.  Nas  seções  a 
seguir,  primeiramente  revemos  alguns  elementos  básicos 
para  o  cálculo  da  medida  GOF,  seguindo  para  discussões 
de  cada  classe  de  medidas  GOF.  Leitores  interessados  em 
discussões  mais  detalhadas  e  de  caráter  estatístico  devem 
consultar  o  Apêndice  lOC,  que  dá  uma  cobertura  mais 
aprofundada  sobre  muitas  das  medidas  de  GOF. 

O  básico  sobre  qualidade  de  ajuste 

Sempre  que  a  teoria  de  um  pesquisador  é  usada  para  es¬ 
pecificar  um  modelo  a  partir  do  qual  os  parâmetros  são 
estimados,  o  ajuste  do  modelo  compara  a  teoria  com  a 
realidade  representada  pelos  dados.  Se  a  teoria  de  um 
pesquisador  fosse  perfeita,  a  matriz  de  covariância  esti¬ 
mada  (SJ  e  a  matriz  de  covariância  observada  (S)  seriam 
iguais.  Assim,  a  matriz  de  covariância  estimada  é  mate¬ 
maticamente  comparada  com  a  matriz  de  covariância 
observada  para  se  fornecer  uma  estimativa  do  ajuste  do 
modelo.  Quanto  mais  próximos  os  valores  dessas  duas 
matrizes  uns  em  relação  aos  outros,  melhor  é  o  ajuste  do 
modelo. 

Discutimos  a  medida  fundamental  de  ajuste,  qui-qua- 
drado  (x^),  e  como  a  mesma  quantifica  as  diferenças  entre 
ambas  as  matrizes.  Em  seguida,  a  discussão  se  concentra 
no  cálculo  dos  graus  de  liberdade,  e  finalmente  em  como 
inferência  estatística  é  afetada  pelo  tamanho  da  amostra 
e  pelo  o  ímpeto  que  disponibiliza  medidas  alternativas  de 
GOF. 

GOF  de  quí-quadrado  (x^)-  A  diferença  nas  matrizes 
de  covariância  (S  —  X*,)  é  o  valor -chave  na  avaliação  de 
GOF  de  qualquer  modelo  SEM.  Procedimentos  de  esti¬ 
mação  SEM,  como  o  de  máxima  verossimilhança,  pro¬ 
duzem  estimativas  paramétricas  que  matematicamente 
minimizam  esta  diferença  para  um  modelo  especificado. 
Um  teste  qui-quadrado  (x^)  fornece  um  teste  estatístico 
da  diferença  resultante.  Ele  é  formalmente  representado 
pela  equação  a  seguir: 

X  =  (A  - 1 )  (Matriz  de  covariância  amostrai  observada  -  Matriz 
de  covariância  estimada  SEM) 

ou 

X^=(N-l)(S-5;j 

N  é  o  tamanho  da  amostra  geral.  Deve  ser  observado 
que  mesmo  quando  as  diferenças  nas  matrizes  de  covariân¬ 
cia  se  mantêm  constantes,  o  valor  x^  aumenta  quando  a 
amostra  também  aumenta.  Analogamente,  a  matriz  de 
covariância  estimada  SEM  é  influenciada  pelo  número 
de  parâmetros  livres  para  serem  estimados  (o  k  em  X  J,  e 
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assim  os  graus  de  liberdade  do  modelo  também  influen¬ 
ciam  o  teste  GOF  de  x- 

Graus  de  liberdade  {dj).  Como  em  outros  procedimen¬ 
tos  estatísticos,  graus  de  liberdade  representam  a  quan¬ 
tia  de  informação  matemática  disponível  para  estimar 
parâmetros  do  modelo.  Comecemos  com  uma  revisão 
de  como  isso  é  calculado  e,  em  seguida,  coloquemos  isso 
em  palavras.  O  número  de  graus  de  liberdade  para  uma 
análise  de  um  modelo  de  estrutura  de  covariância  (SEM) 
é  determinado  por 

df^^[{p){p  +  l)\-k 

onde  p  é  o  número  total  de  variáveis  observadas  e,  k  é 
o  número  de  parâmetros  estimados  (livres).  A  diferença 
em  comparação  com  os  cálculos  de  graus  de  liberdade 
discutidos  em  capítulos  anteriores  é  que  eles  são  basea¬ 
dos  no  número  de  observações  para  as  variáveis  envolvi¬ 
das  (p.ex.,  em  regressão,  dfé  o  tamanho  da  amostra  me¬ 
nos  o  número  de  coeficientes  estimados),  enquanto  que 
o  cálculo  SEM  se  baseia  no  número  de  covariâncias  úni¬ 
cas  e  variâncias  na  matriz  de  covariância  observada.  Na 
equação  anterior,  ll2[{p){p  -f  1)]  representa  o  número 
de  termos  de  covariância  abaixo  da  diagonal  somado  às 
variâncias  sobre  a  diagonal.  Uma  implicação  importante 
é  que  tamanho  amostrai  não  afeta  os  graus  de  liberda¬ 
de,  e  veremos  adiante  como  isso  influencia  o  emprego  de 
qui-quadrado  como  medida  de  GOF. 

Sígníficâncía  estatística  de  x.  A  hipótese  nula  implica¬ 
da  de  SEM  é  que  as  matrizes  de  covariância  observadas 
na  amostra  e  estimada  por  SEM  são  iguais,  o  que  signi¬ 
fica  que  o  modelo  se  ajusta  perfeitamente.  Sabendo-se 
que  o  ajuste  perfeito  não  é  o  caso,  o  valor  x  aumenta. 
Como  os  valores  críticos  da  distribuição  x  são  conhe¬ 
cidos,  pode  ser  determinada  a  probabilidade  de  que 
qualquer  matriz  de  covarância  observada  na  amostra  e  a 
estimada  por  SEM  sejam  realmente  iguais  em  uma  dada 
população.  Tal  probabilidade  é  o  tradicional  valor-p 
associado  com  testes  estatísticos  paramétricos.  Progra¬ 
mas  SEM  fornecem  tanto  o  valor  x  computado  quanto 
o  valor-p,  de  forma  que  o  usuário  não  tem  que  realizar 
este  cálculo. 

Em  capítulos  precedentes  queríamos  tipicamente  va- 
lores-p  menores  (abaixo  de  0,05)  para  mostrar  que  uma 
relação  existia.  Com  o  teste  GOF  de  x  em  SEM,  quanto 
menor  o  valor-p,  maior  a  chance  de  que  as  matrizes  de  co¬ 
variância  observada  na  amostra  e  estimada  por  SEM  não 
sejam  iguais.  Logo,  com  SEM  não  queremos  que  o  valor-p 
para  o  teste  x  seja  pequeno  (estatisticamente  signiflcan- 
te).  Ao  invés  disso,  se  nossa  teoria  for  sustentada  por  este 
teste,  queremos  um  valor  pequeno  para  x  (e  um  corres¬ 
pondente  valor-p  grande)  que  indica  nenhuma  diferença 
estatisticamente  significante  entre  as  matrizes. 


Resumo.  Qui-quadrado  (x^)  é  a  medida  fundamental  usa¬ 
da  em  SEM  para  quantificar  diferenças  entre  as  matrizes 
de  covariância  observada  e  estimada.  No  entanto,  a  real 
avaliação  de  GOF  com  um  só  valor  x  é  complicada  por 
diversos  fatores  discutidos  na  próxima  seção.  Para  oferecer 
perspectivas  alternativas  de  ajuste  do  modelo,  pesquisado¬ 
res  desenvolveram  diversas  novas  medidas  de  qualidade  de 
ajuste.  As  discussões  a  seguir  apresentam  o  papel  do  qui- 
quadrado,  bem  como  das  medidas  alternativas. 

Medidas  de  ajuste  absoluto 

índices  de  ajuste  absoluto  são  uma  medida  direta  de 
quão  bem  o  modelo  especificado  pelo  pesquisador  repro¬ 
duz  os  dados  observados  [26].  Como  tais,  eles  fornecem  a 
avaliação  mais  básica  de  quão  bem  a  teoria  de  um  pesqui¬ 
sador  se  ajusta  aos  dados  da  amostra.  Eles  não  comparam 
explicitamente  a  GOF  de  um  modelo  especificado  com  a 
de  qualquer  outro  modelo.  Em  vez  disso,  cada  modelo  é 
avaliado  independentemente  de  outros  possíveis  modelos. 

Estatística  %.  O  índice  de  ajuste  absoluto  mais  funda¬ 
mental  é  a  estatística  x-  Ela  é  também  a  única  medida  de 
ajuste  SEM  com  caráter  estatístico  [7].  Fundamentalmente, 
ela  é  a  mesma  estatística  x  usada  em  classificação  cruzada 
para  examinar  se  existe  uma  relação  entre  duas  medidas 
não-métricas.  A  diferença  crucial,  porém,  é  que  em  SEM 
o  pesquisador  está  procurando  por  semelhanças  entre  ma¬ 
trizes  (ou  seja,  valores  baixos  de  x^)  para  sustentar  o  mode¬ 
lo  como  representativo  dos  dados.  No  entanto,  em  muitas 
outras  aplicações  (como  classificação  cruzada)  que  usam 
uma  estatística  x,  o  pesquisador  procura  por  diferenças 
(ou  seja,  valores  grandes  de  x^)  para  sustentar  uma  relação 
entre  as  medidas  não-métricas. 

A  estatística  GOF  de  x  apresenta  duas  proprieda¬ 
des  matemáticas  que  são  problemáticas  em  seu  emprego 
como  medida  GOF.  Primeiro,  lembre-se  que  a  estatística 
X  é  uma  função  matemática  que  depende  do  tamanho  da 
amostra  {N)  e  da  diferença  entre  as  matrizes  de  covariância 
observada  e  estimada.  A  medida  que  N  aumenta,  o  mesmo 
acontece  com  o  valor  x,  mesmo  quando  as  diferenças  en¬ 
tre  as  matrizes  são  idênticas.  Em  segundo  lugar,  apesar  de 
isso  talvez  não  parecer  tão  óbvio,  a  estatística  x  pode  ficar 
maior  quando  o  número  de  variáveis  observadas  aumenta. 
Desse  modo,  ainda  que  se  mantenha  tudo  igual,  o  simples 
acréscimo  de  indicadores  a  um  modelo  faz  com  que  os  va¬ 
lores  X  fiquem  maiores. 

Apesar  de  o  teste  x  ser  intuitivamente  satisfatório  e 
poder  fornecer  um  teste  de  significância  estatística,  essas 
propriedades  matemáticas  apresentam,  às  vezes,  proble¬ 
mas  desagradáveis.  Alguém  poderia  argumentar  que  o  ta¬ 
manho  da  amostra  não  deveria  influenciar  no  ajuste  de  um 
modelo  SEM.  Na  verdade,  recomendamos  anteriormente 
amostras  maiores.  Poder-se-ia  argumentar  também  que 
se  mais  variáveis  são  necessárias  para  representar  a  reali¬ 
dade,  então  elas  deveriam  corresponder  a  um  ajuste  me- 
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lhor,  e  não  pior,  desde  que  elas  produzissem  medidas  váli¬ 
das.  Assim,  de  algum  modo  as  propriedades  matemáticas 
do  teste  GOF  de  x  reduzem  o  ajuste  de  um  modelo  por 
motivos  que  podem  não  ser  verdadeiramente  prejudiciais 
à  sua  validade  geral. 

Por  esta  razão,  o  teste  GOF  de  x  é  difícil  de  usar  como 
o  único  indicador  de  ajuste  de  SEM.  Pesquisadores  de¬ 
senvolveram  muitas  medidas  alternativas  de  ajuste  para 
corrigir  o  viés  devido  a  grandes  amostras  e  crescente  com¬ 
plexidade  do  modelo.  Diversos  desses  índices  GOF  são 
apresentados  a  seguir.  Contudo,  o  problema  afeta  muitos 
desses  índices,  particularmente  alguns  dos  índices  de  ajus¬ 
te  absoluto.  Dito  isso,  o  valor  x  um  modelo  resume 
bem  o  ajuste  de  um  modelo,  e,  com  experiência,  o  pesqui¬ 
sador  pode  fazer  julgamentos  ponderados  sobre  modelos 
com  base  neste  resultado.  Em  suma,  o  teste  estatístico  ou 
o  valor-p  resultante  é  menos  significativo  quando  o  tama¬ 
nho  amostrai  fica  grande  ou  quando  o  número  de  variá¬ 
veis  observadas  se  torna  maior. 

índice  de  qualidade  de  ajuste  (GFI).  O  GFI  foi  uma  pri¬ 
meira  tentativa  de  produzir  uma  estatística  de  ajuste  que 
fosse  menos  sensível  a  tamanho  amostrai.  Ainda  que  N 
não  seja  incluído  na  fórmula,  esta  estatística  continua  in¬ 
diretamente  sensível  ao  tamanho  da  amostra  por  conta  do 
efeito  de  N  sobre  distribuições  amostrais  [30].  O  intervalo 
possível  de  valores  GFI  é  de  0  a  1,  com  valores  maiores 
indicando  melhor  ajuste.  No  passado,  valores  GFI  maio¬ 
res  que  0,9  eram  geralmente  considerados  bons.  Outros 
argumentam  que  0,95  deveria  ser  usado  [18].  Retornamos 
adiante  com  mais  detalhes  sobre  valores  bons  e  ruins  de 
ajuste.  O  Apêndice  lOC  contém  um  pouco  mais  de  deta¬ 
lhes  sobre  o  GFI  e  outros  índices  de  ajuste. 

Um  índice  ajustado  de  qualidade  de  ajuste  (AGFI) 
tenta  levar  em  conta  diferentes  graus  de  complexidade 
do  modelo.  Ele  faz  isso  ajustando  GFI  por  uma  propor¬ 
ção  entre  os  graus  de  liberdade  usados  em  um  modelo  e  o 
número  total  de  graus  de  liberdade  disponíveis.  O  AGFI 
penaliza  modelos  mais  complexos  e  favorece  aqueles  com 
um  número  mínimo  de  caminhos  livres.  Valores  AGFI 
são  tipicamente  menores  do  que  valores  GFI  em  propor¬ 
ção  à  complexidade  do  modelo.  Nenhum  teste  estatísti¬ 
co  é  associado  com  GFI  ou  AGFI,  apenas  orientações  de 
ajuste  [44]. 

Raiz  do  resíduo  quadrático  médio  (RMSR)  e  raiz  padro- 
uizada  do  resíduo  médio  (SRMR).  Se  pensamos  em 
cada  termo  de  covariância  ou  variância  como  um  valor 
individual  que  será  previsto,  então  podemos  imaginar  o 
ajuste  como  o  quão  precisamente  cada  termo  é  previsto. 
O  erro  de  previsão  para  cada  termo  de  covariância  cria 
um  resíduo.  A  raiz  do  resíduo  quadrático  médio  (RMSR) 
é  a  raiz  quadrada  da  média  dos  resíduos  quadrados:  uma 
média  dos  resíduos  entre  termos  individuais  observados  e 
estimados  de  covariância  e  variância.  Quando  covariân- 
cias  são  empregadas  como  entrada,  RMSR  é  a  covariân¬ 


cia  residual  média  e  ainda  é  expressa  em  termos  do  domí¬ 
nio  de  escala  das  medições.  E  difícil,  portanto,  comparar 
resultados  RMSR  de  um  modelo  com  o  próximo,  a  menos 
que  os  resultados  sejam  padronizados. 

Uma  estatística  alternativa  sustentada  em  resíduos  é 
a  raiz  padronizada  do  resíduo  médio  (SRMR).  Trata-se 
de  um  valor  padronizado  de  RMSR  e,  assim,  é  mais  útil 
para  comparar  ajuste  ao  longo  de  modelos.  A  despeito  de 
nenhum  valor  estatístico  de  referência  poder  ser  estabele¬ 
cido,  o  pesquisador  pode  avaliar  a  significância  prática  da 
magnitude  do  SRMR  sob  a  ótica  dos  objetivos  de  pesquisa 
e  das  covariâncias  ou  correlações  observadas  ou  reais  [2]. 
Valores  menores  de  RMSR  e  SRMR  representam  melhor 
ajuste,  e  valorações  mais  altas  correspondem  a  ajustes 
piores,  o  que  coloca  RMSR  e  SRMR  em  uma  categoria  de 
índices  que,  às  vezes,  são  conhecidos  como  medidas  de  má 
qualidade  de  ajuste,  nas  quais  altos  valores  são  indicativos 
de  ajuste  ruim. 

Resíduos  padronizados  (SMRSs)  são  calculados  para 
toda  covariância  possível.  SMRSs  individuais  permitem 
que  um  pesquisador  localize  problemas  potenciais  com 
um  modelo  de  mensuração.  O  valor  SRMR  médio  é  0,  o 
que  significa  que  tanto  resíduos  positivos  quanto  negati¬ 
vos  podem  ocorrer.  Assim,  uma  covariância  prevista  me¬ 
nor  que  o  valor  observado  resulta  em  um  resíduo  positivo, 
enquanto  uma  covariância  prevista  maior  que  a  observa¬ 
da  resulta  em  um  resíduo  negativo.  E  difícil  estabelecer 
uma  regra  rígida  e  rápida  que  indique  quando  um  resíduo 
é  muito  grande,  mas  o  pesquisador  deve  analisar  cuidado¬ 
samente  qualquer  resíduo  padronizado  que  exceda  14,01 
(abaixo  de  -4,0  ou  acima  de  4,0). 

Raiz  do  erro  quadrático  médio  de  aproximação  (RMSEA). 

Outra  medida  que  tenta  corrigir  a  tendência  da  estatística 
GOF  de  X  3  rejeitar  modelos  com  amostras  grandes  ou 
grande  número  de  variáveis  observadas  é  a  raiz  do  erro 
quadrático  médio  de  aproximação  (RMSEA).  Ela  difere 
de  RMSR  no  sentido  de  que  tem  uma  distribuição  conhe¬ 
cida  [19].  Assim,  ela  representa  melhor  o  quão  bem  um 
modelo  se  ajusta  a  uma  população  e  não  apenas  a  uma 
amostra  usada  para  estimação.  Ela  explicitamente  tenta 
corrigir  complexidade  do  modelo  e  tamanho  amostrai  in¬ 
cluindo  cada  um  desses  dados  em  sua  computação.  Valo¬ 
res  RMSEA  menores  indicam  melhor  ajuste.  Logo,  assim 
como  SRMR  e  RMSR,  ela  é  um  índice  de  má  qualida¬ 
de  de  ajuste,  em  contraste  com  índices  nos  quais  valores 
maiores  produzem  ajuste  melhor. 

A  questão  sobre  qual  é  um  “bom”  valor  RMSEA  é 
polêmica,  mas  valores  típicos  estão  abaixo  de  0,10  para  a 
maioria  dos  modelos  aceitáveis.  Um  exame  empírico  de 
diversas  medidas  determinou  que  RMSEA  é  mais  ade¬ 
quada  para  uso  em  estratégias  de  modelos  confirmatórios 
ou  concorrentes  à  medida  que  amostras  se  tornam  maio¬ 
res  [39].  Amostras  grandes  podem  ser  consideradas  como 
consistindo  de  mais  de  500  respondentes.  Uma  vantagem- 
chave  de  RMSEA  é  que  um  intervalo  de  confiança  pode 
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ser  construído,  fornece  o  domínio  de  valores  RMSEA 
para  um  dado  nível  de  confiança.  Assim,  isso  nos  permite 
reportar  que  a  RMSEA  está  entre  0,03  e  0,08,  por  exem¬ 
plo,  com  95%  de  confiança. 

Outros  índices  absolutos.  A  maioria  dos  programas 
SEM,  hoje  em  dia,  fornece  ao  usuário  muitos  índices  di¬ 
ferentes  de  ajuste.  Na  discussão  precedente,  nos  concen¬ 
tramos  mais  naqueles  que  são  mais  comumente  usados. 
Nesta  seção,  tocamos  rapidamente  em  uns  poucos  outros 
que  por  vezes  são  mencionados: 

•  X  normado:  Esta  medida  GOF  é  uma  proporção  simples  de 
X  com  o  grau  de  liberdade  para  um  modelo.  Geralmente 
proporções  x:df  da  ordem  de  3:1  ou  menos  são  associadas 
com  modelos  melhor  ajustados,  exceto  em  circunstâncias 
envolvendo  amostras  extremamente  grandes  (maiores  que 
750)  ou  outras  circunstâncias  atenuantes,  como  um  elevado 
grau  de  complexidade  do  modelo. 

•  O  índice  de  validação  cruzada  esperada  (ECVI)  é  uma 
aproximação  da  qualidade  de  ajuste  que  o  modelo  estimado 
atingiria  em  outra  amostra  do  mesmo  tamanho.  Baseado  na 
matriz  de  covariância  de  amostra,  ele  leva  em  conta  o  tama¬ 
nho  amostrai  real  e  a  diferença  que  poderia  ser  esperada 
em  outra  amostra.  O  ECVI  também  leva  em  consideração 
o  número  de  parâmetros  estimados  para  um  dado  modelo. 
E  mais  útil  na  comparação  do  desempenho  de  um  modelo 
com  outro. 

•  O  índice  de  validação  cruzada  real  (CVI)  pode  ser  execu¬ 
tado  usando-se  a  matriz  de  covariância  computada  obtida 
de  um  modelo  em  uma  amostra  para  prever  a  matriz  de  co¬ 
variância  observada  conseguida  de  uma  amostra  de  valida¬ 
ção.  Dada  uma  amostra  suficientemente  grande  (ou  seja,  N 
>  500  para  a  maioria  das  aplicações),  o  pesquisador  pode 
criar  uma  amostra  de  validação  dividindo  aleatoriamente  as 
observações  originais  em  dois  grupos. 

•  Gama  chapéu  também  tenta  corrigir  o  tamanho  amostrai  e 
a  complexidade  do  modelo  pela  inclusão  de  cada  uma  des¬ 
sas  informações  em  seu  cálculo.  Valores  típicos  de  gama 
chapéu  variam  entre  0,9  e  1,0.  Sua  principal  vantagem  é  que 
ele  tem  uma  distribuição  conhecida  [10]. 

Estes  quatro  últimos  índices  são  apenas  uma  amostra 
dos  demais  índices  de  ajuste  absoluto,  e  de  forma  alguma 
correspondem  a  uma  lista  exaustiva.  Para  mais  informa¬ 
ções,  o  leitor  pode  consultar  a  documentação  associada 
com  o  programa  SEM  específico  em  uso. 

índices  de  ajuste  incremental 

índices  de  ajuste  incremental  diferem  dos  absolutos  no 
sentido  de  que  eles  avaliam  o  quão  bem  um  modelo  espe¬ 
cificado  se  ajusta  relativamente  a  algum  modelo  alterna¬ 
tivo  de  referência.  O  modelo  de  referência  mais  comum 
é  chamado  de  modelo  nulo,  um  que  assume  que  todas  as 
variáveis  observadas  são  não-correlacionadas.  Isso  impli¬ 
ca  que  nenhuma  redução  de  dados  poderia  possivelmente 
melhorar  o  modelo,  pois  ele  não  contém  fatores  multi- 
itens  (ver  Capítulo  3),  o  que  tornaria  impossível  quaisquer 
construtos  multi-itens  ou  relações  entre  eles.  Esta  classe 


de  índices  de  ajuste  representa  a  melhora  em  ajuste  pela 
especificação  de  construtos  multi-itens  relacionados. 

A  maioria  dos  programas  SEM  oferece  múltiplos  índi¬ 
ces  de  ajuste  incremental  como  saída  padrão.  Programas 
diferentes  oferecem  diferentes  estatísticas  de  ajuste,  de 
modo  que  você  pode  não  encontrar  todos  eles  em  uma 
saída  SEM  em  particular.  Além  disso,  à  vezes  eles  são 
chamados  de  índices  de  ajuste  comparativo,  por  motivos 
óbvios. 

índice  de  ajuste  normado  (NFI).  O  NFI  é  um  dos  índices 
de  ajuste  incremental.  Ele  é  uma  proporção  da  diferença 
no  valor  x  para  o  modelo  ajustado  e  um  modelo  nulo  di¬ 
vidida  pelo  valor  x  para  o  modelo  nulo.  Varia  entre  0  e  1, 
e  um  modelo  com  ajuste  perfeito  corresponde  a  um  NFI 
de  I.  O  CFI  foi  obtido  deste  índice  como  um  esforço  para 
incluir  complexidade  do  modelo  em  uma  medida  de  ajus¬ 
te  [3]. 

índice  de  ajuste  comparativo  (CFI).  O  CFI  é  um  índice 
de  ajuste  incremental  que  é  uma  versão  melhorada  do  ín¬ 
dice  de  ajuste  normado  (NFI)  [5,  19].  O  CFI  é  normado, 
de  forma  que  seus  valores  variam  entre  0  e  I,  com  valores 
mais  altos  indicando  melhor  ajuste.  Pelo  fato  do  CFI  ter 
muitas  propriedades  desejáveis,  incluindo  sua  insensibi¬ 
lidade  relativa,  mas  não  completa,  em  relação  à  comple¬ 
xidade  do  modelo,  ele  está  entre  os  índices  mais  usados. 
Valores  CFI  abaixo  de  0,90  não  são  geralmente  associados 
com  um  modelo  que  se  ajusta  bem. 

índice  de  Tucker  Lewis  (TLI).  O  TLI  antecede  o  CFI 
e  é  conceitualmente  semelhante,  no  sentido  de  que  tam¬ 
bém  envolve  uma  comparação  matemática  de  um  modelo 
teórico  de  mensuração  especificado  com  um  modelo  nulo 
de  referência  [45].  O  TLI  não  é  normado,  e,  assim,  seu 
valor  pode  ficar  abaixo  de  0  ou  acima  de  I.  No  entanto, 
tipicamente,  modelos  com  bom  ajuste  têm  valores  que  se 
aproximam  de  I,  e  um  modelo  com  um  valor  maior  sugere 
um  ajuste  melhor  do  que  o  modelo  com  menor  valor.  Na 
prática,  o  TLI  e  o  CFI  geralmente  fornecem  valores  muito 
parecidos. 

índice  de  não-centralidade  relativa  (RNI).  O  RNI  tam¬ 
bém  compara  o  ajuste  observado  resultante  do  teste  de 
um  modelo  especificado  com  aquele  de  um  modelo  nulo. 
Como  os  demais  índices  de  ajuste  incremental,  valores 
maiores  representam  melhor  ajuste,  e  os  valores  possíveis 
geralmente  variam  entre  0  e  I.  RNIs  menores  que  0,90 
geralmente  não  são  associados  com  bom  ajuste. 

Resumo.  Cada  estatística  de  teste  incremental  apresenta 
suas  vantagens  e  desvantagens.  O  leitor  pode  facilmente 
encontrar  outros  índices  de  ajuste  incremental  em  dife¬ 
rentes  programas  SEM  e  deve  consultar  as  referências 
desta  seção  para  informações  mais  detalhadas.  Existem 
outros  índices  de  ajuste  incremental,  mas  os  que  foram 
apresentados  aqui  correspondem  às  estatísticas  mais  apli- 
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cadas  [19].  Entre  eles,  o  TLI  e  o  CFI  parecem  ser  os  mais 
usados. 

índices  de  ajuste  de  parcimônia 

O  terceiro  grupo  de  índices  é  especiflcamente  planejado 
para  fornecer  informação  sobre  qual  modelo,  em  um  con¬ 
junto  de  modelos  concorrentes,  é  melhor,  considerando 
seu  ajuste  relativo  à  sua  complexidade.  Uma  medida  de 
ajuste  de  parcimônia  é  melhorada  por  um  melhor  ajuste 
ou  por  um  modelo  mais  simples.  Neste  caso,  um  modelo 
mais  simples  é  aquele  com  menos  caminhos  de  parâme¬ 
tros  estimados. 

índices  de  ajuste  de  parcimônia  são  conceitualmente 
parecidos  com  a  noção  de  um  ajustado  (discutido  no 
Capítulo  4),  no  sentido  de  que  eles  relacionam  ajuste  do 
modelo  com  a  complexidade  do  mesmo.  Modelos  mais 
complexos  devem  se  ajustar  melhor  aos  dados,  de  forma 
que  medidas  de  ajuste  devem  ser  relativas  à  complexida¬ 
de  antes  que  comparações  entre  modelos  possam  ser  exe¬ 
cutadas.  Os  índices  não  são  úteis  na  avaliação  do  ajuste 
de  um  só  modelo,  mas  são  muito  úteis  na  comparação  do 
ajuste  de  dois  modelos,  sendo  um  mais  complexo  que  o 
outro. 

A  razão  de  parcimônia  (PR)  de  qualquer  modelo  for¬ 
ma  a  base  para  essas  medidas  e  é  calculada  como  a  razão 
entre  graus  de  liberdade  usados  por  um  modelo  e  o  total 
disponível  de  graus  de  liberdade  [31].  Discutimos  como 
a  razão  de  parcimônia  é  usada  em  cada  um  dos  índices  a 
seguir. 

índice  de  qnalidade  de  ajnste  de  parcimônia  (PGFI).  O 

PGFI  ajusta  o  GFI  usando  o  PR.  Teoricamente,  os  valores 
variam  entre  0  e  1.  Assim,  dois  modelos  podem  ser  com¬ 
parados  e  aquele  com  um  PGFI  maior  é  preferível,  com 
base  na  combinação  de  ajuste  e  parcimônia  representada 
por  este  índice.  Um  PGFI  tomado  sozinho  não  é  um  indi¬ 
cador  útil  do  ajuste  de  um  modelo.  Como  outros  índices 
de  ajuste  de  parcimônia,  um  valor  de  PGFI  deve  ser  usado 
somente  na  comparação  com  o  PGFI  de  outro  modelo. 

índice  de  ajnste  normado  de  parcimônia  (PNFI).  O 

PNFI  ajusta  o  índice  de  ajuste  normado  (NFI)  multipli- 
cando-o  por  PR  [34].  Como  o  PGFI,  valores  relativamen¬ 
te  elevados  representam  ajuste  relativamente  melhor,  de 
maneira  que  ele  pode  ser  usado  do  mesmo  modo  que  o 
NFI.  O  PNFI  assume  algumas  das  características  adicio¬ 
nais  de  índices  de  ajuste  incremental  relativamente  aos 
índices  de  ajuste  absoluto,  além  de  favorecer  modelos 
menos  complexos.  Novamente,  os  valores  do  PNFI  de¬ 
vem  ser  usados  na  comparação  de  um  modelo  com  ou¬ 
tro,  sendo  que  os  valores  mais  altos  de  PNFI  são  melhor 
sustentados  quanto  aos  critérios  capturados  por  este  ín¬ 
dice. 

Resumo.  O  emprego  de  índices  de  ajuste  de  parcimô¬ 
nia  permanece  de  algum  modo  controverso.  Alguns  pes¬ 


quisadores  argumentam  que  uma  comparação  de  índices 
de  ajuste  incremental  de  modelos  concorrentes  fornece 
evidência  similar,  e  que  podemos  posteriormente  levar 
parcimônia  em  conta  de  alguma  outra  maneira.  É  óbvio 
dizer  que  um  índice  de  parcimônia  pode  fornecer  infor¬ 
mação  útil  na  avaliação  de  modelos  concorrentes,  mas 
isso  não  é  o  suficiente  para  se  confiar.  Quando  empre¬ 
gado,  o  PNFI  é  o  índice  de  ajuste  de  parcimônia  mais 
amplamente  aplicado. 

Uso  de  Índices  de  ajuste 

Em  última  instância,  índices  de  ajuste  são  utilizados  para 
estabelecer  a  aceitabilidade  de  um  modelo  SEM.  Prova¬ 
velmente  nenhum  outro  tópico  de  SEM  é  mais  discutido 
do  que  o  que  constitui  um  ajuste  adequado  ou  bom.  Tal¬ 
vez  a  melhor  evidência  de  sua  controvérsia  seja  o  núme¬ 
ro  sempre  crescente  de  índices  de  ajuste  disponíveis  para 
avaliar  a  qualidade  ou  má  qualidade  de  ajuste.  Os  índices 
já  discutidos  são  apenas  uma  amostra  daqueles  comumen- 
te  citados  em  saídas  padrão  de  SEM. 

Problemas  associados  com  o  uso  de  índices  de  ajus¬ 
te.  A  crescente  coleta  de  índices  de  ajuste  e  a  falta  de 
diretrizes  consistentes  podem  ser  uma  tentação  para 
o  pesquisador  simplesmente  escolher  um  índice  que 
forneça  a  melhor  evidência  de  ajuste  em  uma  análise 
específica  e  um  índice  diferente  em  outra  análise.  Ob¬ 
viamente,  esta  metodologia  deve  ser  evitada.  Fazer  isso 
requer  respostas  simples  e  concisas  para  duas  questões 
importantes: 

1.  Qual  é  a  melhor  estatística  (ou  estatísticas)  de  ajuste  para 
objetivamente  refletir  o  ajuste  de  um  modelo? 

2.  Quais  são  os  valores  objetivos  de  corte  que  sugerem  bom 
ajuste  de  modelo  para  uma  dada  estatística? 

Infelizmente,  as  respostas  para  essas  perguntas  não 
são  simples  e  nem  imediatas.  Alguns  pesquisadores 
comparam  a  busca  por  respostas  a  tais  questões  com  o 
“mítico  Tosão  de  Ouro,  a  conquista  da  fonte  da  juven¬ 
tude  e  a  busca  pela  verdade  e  beleza  absolutas”  [32].  De 
fato,  muitos  problemas  são  associados  com  a  procura 
pelo  bom  ajuste.  Segue  adiante  um  breve  resumo  dos 
principais  aspectos  sobre  ajuste  de  modelos,  bem  como 
orientações  práticas  para  a  interpretação  de  índices  de 
ajuste. 

Problemas  com  o  teste  x-  Talvez  a  evidência  mais 
clara  e  convincente  de  que  um  ajuste  de  modelo  é  adequa¬ 
do  seja  um  valor  com  um  valor-p  indicando  ausência 
de  diferença  significante  entre  as  matrizes  de  covariância 
observada  da  amostra  e  a  estimada  por  SEM.  Por  exem¬ 
plo,  se  um  pesquisador  está  satisfeito  com  a  tradicional 
taxa  de  erro  Tipo  I  de  5%,  então  um  valor-p  maior  que 
0,05  sugere  que  o  modelo  dele  reproduziu  de  maneira  efi¬ 
caz  a  matriz  de  covariância  das  variáveis  observadas  -  um 
“bom”  ajuste  do  modelo. 
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Assim,  será  que  este  resultado  significa  que  um  valor 
não-significante  de  x  sempre  permite  que  o  pesquisador  diga 
“caso  encerrado”?  Não  é  bem  assim.  Lembre-se  que  o  valor 
X  é  influenciado  não  somente  pela  diferença  entre  as  matri¬ 
zes  de  covariância,  mas  também  pelo  tamanho  da  amostra. 
Além  disso,  aumentar  o  tamanho  da  matriz  de  covariância 
(isto  é,  usar  mais  variáveis  indicadoras)  aumenta  as  chances 
de  que  as  diferenças  nas  matrizes  sejam  grandes.  Como  re¬ 
sultado,  o  que  parece  ser  um  teste  estatístico  simples  e  po¬ 
deroso  tem  penalidades  inerentes  para  modelos  envolvendo 
amostras  maiores  e  mais  variáveis  indicadoras  [3].  Esses  fa¬ 
tores  também  funcionam  no  sentido  contrário,  de  modo  que 
um  modelo  simples,  particularmente  um  com  uma  amostra 
pequena,  pode  produzir  um  x  não-significante  (indicando 
bom  ajuste)  mas  fracassar  na  exibição  de  qualquer  outra  evi¬ 
dência  de  validade  ou  adequação.  Assim,  o  pesquisador  não 
deve  confiar  em  apenas  uma  medida  de  GOF. 

Valores  de  corte  para  índices  de  ajuste:  o  mágico 
0,90.  O  principal  objetivo  de  qualquer  um  desses  índices 
de  ajuste  é  auxiliar  o  pesquisador  na  discriminação  entre 
modelos  especificados  aceitáveis  e  inaceitáveis.  A  questão 
crucial  ainda  permanece:  o  que  indica  bom  ajuste  para  es¬ 
ses  índices?  Periódicos  especializados  estão  repletos  com 
resultados  SEM  que  citam  um  valor  de  0,90  para  índices  im¬ 
portantes,  como  TFI,  CFI,  NFI  ou  GFI,  como  indicando  um 
modelo  aceitável.  Alguns  podem  citar  precedentes  de  um 
artigo  previamente  publicado.  Outras  vezes,  a  regra  do  0,90 
é  simplesmente  citada  como  uma  regra  ad  hoc  razoável  sem 
suporte  de  teoria  prévia.  Em  geral,  de  alguma  forma  o  0,90 
se  tornou  o  número  mágico  para  modelos  bem  ajustados. 

No  entanto,  pesquisas  têm  contestado  o  uso  de  um  só 
valor  de  corte  para  esses  índices.  Os  estudos  identificaram 
uma  série  de  fatores  adicionais  que  afetam  os  valores  dos 
índices  associados  com  ajuste  aceitável: 

•  Uma  pesquisa  que  usa  dados  simulados  (para  os  quais  o 
ajuste  real  é  conhecido)  oferece  contra-argumentos  sobre 
esses  valores  de  corte  e  não  apóia  o  0,90  como  uma  regra 
prática  geralmente  aceitável  [19].  Isso  demonstra  que,  por 
vezes,  mesmo  um  índice  de  qualidade  de  ajuste  incremental 
acima  de  0,90  ainda  estaria  associado  a  um  modelo  grave¬ 
mente  mal-especificado. 

•  Mais  recentemente,  outros  pesquisadores  questionaram  o 
emprego  de  apenas  um  valor  de  corte,  até  mesmo  para  me¬ 
didas  de  ajuste  absoluto.  Como  anteriormente  discutido,  a 
maioria  dos  índices  GOF  compartilha  do  problema  de  puni¬ 
ções  injustas  de  modelos  com  mais  variáveis  observadas  por 
construto  latente  [26].  Em  contraste,  a  RMSEA  e  a  SRMR 
realmente  fornecem  uma  vantagem  (elas  diminuem)  quan¬ 
do  um  modelo  contém  mais  variáveis. 

•  Finalmente,  a  verdadeira  distribuição  inerente  de  dados 
pode  influenciar  índices  de  ajuste  [14].  Particularmente,  à 
medida  que  os  dados  se  tornam  menos  apropriados  para 
a  técnica  de  estimação  selecionada  em  particular,  a  habili¬ 
dade  de  índices  de  ajuste  refletirem  má  especificação  com 
precisão  pode  variar.  Essa  questão  parece  afetar  índices  de 
ajuste  incremental  mais  do  que  os  absolutos. 


No  final,  nenhum  valor  “mágico”  sozinho  diferencia 
bons  modelos  dos  ruins  para  qualquer  um  desses  índices. 
E  interessante  comparar  esses  problemas  em  SEM  com 
a  falta  geral  de  preocupação  para  estabelecer  um  núme¬ 
ro  mágico  em  regressão  múltipla.  Se  um  valor  mágico 
mínimo  de  de  0,5  tivesse  algum  dia  sido  imposto,  seria 
apenas  um  limite  arbitrário  que  excluiria  pesquisa  poten¬ 
cialmente  significativa.  Logo,  devemos  ser  cuidadosos  na 
adoção  de  tais  padrões;  não  é  prático  usar  um  conjunto 
único  de  regras  de  corte  que  se  aplique  para  todos  os  mo¬ 
delos  SEM  de  qualquer  tipo. 

Especificação  inaceitável  de  modelo  para  atingir  ajns- 

te.  E  também  criticamente  importante  perceber  a  distin¬ 
ção  entre  teste  de  teoria  e  a  busca  por  um  bom  ajuste.  A 
SEM  não  é  usada  para  se  conseguir  um  bom  ajuste;  é  em¬ 
pregada  para  testar  teoria.  E  muito  fácil  ficar  tão  obcecado 
com  ajuste,  que  um  teste  válido  de  teoria  jamais  ocorre.  Na 
verdade,  a  busca  para  se  conseguir  um  valor  mágico  para 
um  índice  de  ajuste  pode  levar  a  diversas  práticas  desacon¬ 
selháveis  na  especificação  do  modelo  [26, 27,  33].  Em  cada 
um  dos  seguintes  casos,  um  pesquisador  pode  ser  capaz  de 
aumentar  ajuste,  mas  apenas  de  uma  maneira  que  compro¬ 
mete  o  teste  da  teoria  em  questão.  Essas  ações  devem  ser 
evitadas  sempre  que  possível,  pois  cada  uma  delas  tem  o 
potencial  de  limitar  indevidamente  a  habilidade  da  SEM 
de  fornecer  um  verdadeiro  teste  do  modelo: 

1.  Usar  apenas  dois  ou  três  itens  para  representar  cada  cons¬ 
truto. 

2.  Usar  um  único  item  para  representar  um  construto  e  arbitra¬ 
riamente  especificar  o  erro  de  mensuração. 

3.  Examinar  o  ajuste  de  um  modelo  de  mensuração  conduzindo 
análises  SEM  separadas  para  cada  construto  ao  invés  de  uma 
análise  para  o  modelo  inteiro.  O  resultado  é  um  conjunto  de 
índices  de  ajuste  para  cada  construto  e  um  modelo  geral  de 
mensuração  que  jamais  é  testado.  Esta  abordagem  conduz  a 
múltiplos  conjuntos  de  índices  de  ajuste,  cada  um  tendo  uma 
chance  maior  de  atingir  um  corte  desejado  em  TLI,  GFI,  CFI, 
RFI  e  outros  índices  do  que  o  modelo  como  um  todo. 

4.  Usar  uma  amostra  menor. 

5.  Testar  um  modelo  de  mensuração  usando  parcelas  de  itens, 
o  que  significa  que  o  conjunto  completo  de  variáveis  indica¬ 
doras  (p.ex.,  15  indicadores  para  um  construto)  é  parcelado 
em  um  pequeno  número  de  indicadores  compostos  (como  3 
compostos  de  5  itens  cada).  Um  composto  é  essencialmente 
um  escore  fatorial  múltiplo. 

Cada  um  desses  passos  pode  ser  associado  com  várias 
conseqüências  indesejáveis: 

•  Maiores  chances  de  encontrar  problemas  estatísticos  com 
convergência  de  modelo,  estimativas  paramétricas  menos 
precisas,  confiabilidade  reduzida  de  construto,  menor  poder 
estatístico  e  uma  incapacidade  de  detectar  variáveis  observa¬ 
das  que  são  verdadeiramente  problemáticas. 

•  Uma  melhora  artificial  de  ajuste  pela  alteração  das  circunstân¬ 
cias  de  um  modelo  e  não-manutenção  da  fidelidade  ao  verda¬ 
deiro  significado  de  um  construto  ou  hipótese. 
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•  Problemas  que  obscurecem  validade  no  conjunto  de  construtos 
e  medidas.  Um  exemplo  comum  é  a  possibilidade  de  ocultar 
problemas  potenciais  de  validade  discriminante  que  ocorrem 
em  casos  de  elevadas  correlações  entre  construtos  ou  substan¬ 
ciais  cargas  cruzadas  de  variáveis  indicadoras.  A  execução  de 
análises  SEM  sobre  construtos  individuais,  subconjuntos  de 
construtos,  ou  mesmo  o  parcelamento  ad  hoc  de  itens  podem 
ocultar  problemas  dessa  natureza  que  podem  ser  encontrados 
quando  o  modelo  completo  é  testado. 

Ciência  dos  problemas  com  esses  passos  não  significa 
que  um  deles  não  possa  ser  necessário  na  abordagem  de 
uma  especificação  particular  de  modelo,  ou  ser  diagnos¬ 
ticamente  útil  na  construção  de  um  modelo.  Além  disso, 
melhora  de  ajuste  não  é  uma  justificativa  apropriada  para 
qualquer  um  desses  passos.  Sempre  se  lembre  que  esses 
procedimentos  podem  interferir  no  teste  geral  de  um  mo¬ 
delo  de  mensuração,  e,  assim,  a  teoria  de  medição  conti¬ 
nua  não  testada  até  que  todas  as  variáveis  medidas  sejam 
incluídas  em  um  só  teste. 

Diretrizes  para  estabelecer  ajuste  aceitável  e  inaceitá¬ 
vel.  Uma  regra  simples  para  valores  de  índice  que  dife¬ 
rencia  modelos  bons  de  modelos  ruins  em  todas  as  situa¬ 
ções  não  pode  ser  oferecida.  No  entanto,  diversas  diretrizes 
gerais  podem  auxiliar  na  determinação  da  aceitabilidade  de 
ajuste  para  um  dado  modelo: 

•  Usar  múltiplos  índices  de  diferentes  tipos:  Geralmente,  o  em¬ 
prego  de  três  ou  quatro  índices  de  ajuste  fornece  evidência 
adequada  de  ajuste  de  modelo.  Pesquisas  recentes  sugerem 
um  conjunto  razoavelmente  comum  de  índices  que  funcio¬ 
nam  adequadamente  em  uma  vasta  gama  de  situações:  CFI, 
TLI,  RNI,  Gama  chapéu,  SRMR  e  RMSEA.  Um  pesquisa¬ 
dor  não  precisa  apelar  para  todos  esses  índices  por  conta  da 
redundância  entre  eles  (ver  Apêndice  lOC,  o  qual  descreve 


esses  índices  em  mais  detalhes).  Contudo,  o  pesquisador 
deve  usar  pelo  menos  um  índice  incremental  e  um  índice 
absoluto,  além  do  valor  x  e  dos  graus  de  liberdade  asso¬ 
ciados.  Pelo  menos  um  dos  índices  deve  ser  de  má  quali¬ 
dade  de  ajuste.  Um  modelo  que  relata  o  valor  x^  e  graus 
de  liberdade,  CFI  e  RMSEA  freqüentemente  disporá  de 
suficiente  informação  para  sua  avaliação.  Quando  comparar 
modelos  de  complexidade  variada,  o  pesquisador  pode  tam¬ 
bém  desejar  o  acréscimo  do  PNFI.  Outra  evidência  sugere 
que  a  aplicação  de  uma  única  regra  de  qualidade  de  ajuste 
que  exija  um  índice  de  0,95  ou  mais  não  é  melhor  do  que 
simplesmente  usar  apenas  o  teste  GOF  de  x  [32]. 

•  Ajustar  os  valores  de  corte  de  índice  com  base  em  caracterís¬ 
ticas  do  modelo:  A  Tabela  10-2  oferece  algumas  orientações 
para  o  emprego  de  índices  de  ajuste  em  diferentes  situações. 
As  orientações  são  baseadas  principalmente  em  pesquisa 
de  simulação  que  considera  diferentes  tamanhos  amostrais, 
complexidades  e  graus  de  erro  na  especificação  de  modelos 
para  examinar  o  quão  precisamente  vários  índices  de  ajuste 
funcionam  [19, 32].  Um  ponto-chave  ao  longo  dos  resultados 
é  que  modelos  mais  simples  e  amostras  menores  devem  ser 
sujeitos  a  avaliação  mais  estrita  do  que  os  modelos  mais  com¬ 
plexos  com  amostras  maiores.  Analogamente,  modelos  mais 
complexos  com  amostras  menores  podem  demandar  critérios 
de  algum  modo  menos  estritos  para  avaliação  com  os  múlti¬ 
plos  índices  de  ajuste  [41]. 


Por  exemplo,  com  base  em  uma  amostra  de  100  respon- 
dentes  e  um  modelo  de  quatro  construtos  com  um  total 
de  somente  12  variáveis  indicadoras,  evidência  de  bom 
ajuste  incluiria  um  valor  (x^)  insignificante,  um  CFI  de 
pelo  menos  0,97  e  uma  RMSEA  de  0,08  ou  menos.  No 
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TABELA  10-2  Características  de  diferentes  índices  de  ajuste  demonstrando  qualidade  de  ajuste  ao  longo  de  situações  distintas  de  modelagem 


N<250* 

N>250 

Estatística 

Número  de 
variáveis  (m) 

m<12 

1 2  <  m  <  30 

m>30 

m<12** 

12  <  /n<  30 

m>30 

2 

X 

Valores-p  insig¬ 
nificantes  espe¬ 
rados 

Valores-p  signi- 
ficantes  podem 
resultar  mesmo 
com  bom  ajuste 

Valores-p  signi- 
ficantes  podem 
ser  esperados 

Valores-p  in¬ 
significantes 
podem  resultar 
com  bom  ajuste 

Valores-p  signi- 
ficantes  podem 
ser  esperados 

Valores-p  signifi- 
cantes  podem  ser 
esperados 

CFI  ou  TLI 

0,97  ou  melhor 

0,95  ou  melhor 

Acima  de  0,92 

0,95  ou  melhor 

Acima  de  0,92 

Acima  de  0,90 

RNI 

Não  pode  diag¬ 
nosticar  má 
especificação 
tão  bem 

0,95  ou  melhor 

Acima  de  0,92 

0,95  ou  melhor, 
mas  não  use 
com  N  >  1 000 

Acima  de  0,92, 
mas  não  use 
com  N  >  1 000 

Acima  de  0,90,  mas 
não  use  com  N  > 
1000 

SRMR 

Pode  ter  viés 
para  cima;  use 
outros  índices 

0,08  ou  menos 
(com  CFI  de 

0,95  ou  maior) 

Menos  que  0,09 
(com  CFI  acima 
de  0,92) 

Pode  ter  viés 
para  cima;  use 
outros  índices 

0,08  ou  menos 
(com  CFI  acima 
de  0,92) 

0,08  ou  menos 
(com  CFI  acima  de 
0,92) 

RMSEA 

Valores  <  0,08 
com  CFI  =  0,97 
ou  maior 

Valores  <  0,08 
com  CFI  de  0,95 
ou  maior 

Valores  <  0,08 
com  CFI  acima 
de  0,92 

Valores  <  0,07 
com  CFI  de  0,97 
ou  maior 

Valores  <  0,07 
com  CFI  de  0,92 
ou  maior 

Valores  <  0,07  com 
CFI  de  0,90  ou 
maior 

Nota:  m  =  número  de  variáveis  observadas;  N  se  aplica  ao  número  de  observações  por  grupo  quando  se  usa  CFA  para  múltiplos  grupos  ao  mesmo  tempo. 


*  N.  de  R.  T.:  Aparentemente  os  autores  ignoraram  a  possibilidade  de  A  ser  igual  a  250,  não  esclarecendo  onde  incluir  este  valor. 

**  N.  de  R.  T.:  A  expressão  correta  seria  “m  <  12”. 
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entanto,  é  extremamente  não-realista  aplicar  os  mesmos 
critérios  para  um  modelo  de  oito  construtos  com  50  va¬ 
riáveis  indicadoras  testadas  com  uma  amostra  de  2000 
respondentes. 


Vale  a  pena  repetir  que  a  Tabela  10-2  é  dada  mais  com 
o  intuito  de  oferecer  uma  idéia  ao  pesquisador  de  como  ín¬ 
dices  de  ajuste  podem  ser  usados  do  que  propriamente  para 
sugerir  regras  absolutas  para  padrões  que  separem  ajuste 
bom  do  ruim.  Além  disso,  vale  repetir  que  mesmo  um  mo¬ 
delo  com  bom  ajuste  ainda  deve  atender  aos  outros  critérios 
para  validade  discutidos  em  cada  um  dos  capítulos  subse- 
qüentes. 

•  Usar  índices  para  comparar  modelos.  A  despeito  de  ser  di¬ 
fícil  determinar  absolutamente  quando  um  modelo  é  bom 
ou  ruim,  é  muito  mais  fácil  determinar  que  um  modelo  é 
melhor  do  que  outro.  Os  índices  da  Tabela  10-2  funcionam 
bem  na  diferenciação  da  superioridade  relativa  de  modelos. 
Um  CFl  de  0,95,  por  exemplo,  indica  um  modelo  com  me¬ 
lhor  ajuste  do  que  outro  de  mesma  complexidade  mas  com 
um  CFl  de  0,85,  particularmente  no  caso  com  modelos  ani¬ 
nhados.  Um  modelo  é  aninhado  com  outro  se  ele  contém  o 
mesmo  número  de  variáveis  e  pode  ser  formado  a  partir  do 
outro  modelo  via  alteração  das  relações,  como  acréscimo  ou 
eliminação  de  caminhos. 

•  A  busca  de  melhor  ajuste  à  custa  do  teste  de  um  verdadeiro 
modelo  não  é  um  bom  negócio.  Muitas  especificações  po¬ 
dem  influenciar  o  ajuste  do  modelo,  e  assim  o  pesquisador 
deve  se  certificar  de  que  todas  as  especificações  devam  ser 
feitas  para  melhor  aproximar  a  teoria  a  ser  testada,  ao  invés 
de  se  esperar  que  se  aumente  o  ajuste. 

Revisão.  Não  é  exagero  enfatizar  que  essas  são  diretri¬ 
zes  de  uso  e  não  regras  que  garantem  um  modelo  corre¬ 
to.  Assim,  nenhum  valor  específico  em  qualquer  índice 
pode  separar  modelos  em  ajustes  aceitáveis  e  inaceitáveis. 
Quando  usamos  vários  modelos  juntos,  eles  oferecem 
evidência  que  permite  uma  avaliação  de  um  modelo  te¬ 
órico.  Assim  como  nenhum  critério  absoluto  estabelece 
uma  taxa  de  erro  Tipo  I  “aceitável”  em  estatística  alguma, 
nenhum  critério  absoluto  define  aceitabilidade  de  GOF 
também.  Pesquisadores  sempre  devem  dar  espaço  para 
circunstâncias  atenuantes  não-antecipadas  que  possam 
afetar  a  interpretação  de  resultados  do  modelo.  Questões 
relacionadas  ao  modelo  em  si,  à  amostra  e  ao  contexto  da 
pesquisa  sempre  podem  influenciar  aquilo  que  é  aceitável 
ou  não.  Assim,  a  situação  afeta  e  deve  afetar  a  aceitabili¬ 
dade  de  modelos. 

Resumo 

Q  estágio  4  introduz  procedimentos  usados  para  estabe¬ 
lecer  a  validade  de  um  modelo  de  mensuração.  Ajuste  é 
um  critério  útil  na  avaliação  da  validade  de  um  modelo, 
mas  avaliar  ajuste  geralmente  não  é  uma  tarefa  simples. 
Apesar  de  o  teste  GQF  de  x  ser  conceitualmente  simples, 
problemas  computacionais  impedem  que  ele  seja  empre¬ 
gado  como  o  único  teste  estatístico  (como  o  teste  F  geral 


em  regressão  ou  ANGVA).  Assim,  muitos  outros  índices 
foram  desenvolvidos.  Não  existe  qualquer  valor  absoluto 
de  corte  que  possa  distinguir  bons  modelos  de  ruins  para 
qualquer  um  desses  índices.  É  claro,  porém,  que  mode¬ 
los  mais  simples  demandam  padrões  mais  estritos  do  que 
modelos  mais  complexos.  Além  disso,  é  importante  evitar 
várias  práticas  ruins  que  possam  resultar  unicamente  da 
busca  de  um  bom  ajuste.  Q  leitor  aprenderá  mais  sobre 
como  ajuste  pode  ser  avaliado  por  meio  das  ilustrações 
nos  próximos  capítulos. 

Estágio  5:  Especificação  do  modelo  estrutural 

A  especificação  do  modelo  de  mensuração  (isto  é,  a  de¬ 
signação  de  variáveis  indicadoras  para  os  construtos  que 
elas  devem  representar)  é  um  passo  crítico  no  desenvolvi¬ 
mento  de  um  modelo  SEM.  Esta  atividade  é  realizada  no 
estágio  2.  G  estágio  5  envolve  a  especificação  do  modelo 
estrutural  pela  designação  de  relações  de  um  construto 
com  outro,  com  base  no  modelo  teórico  proposto.  A  es¬ 
pecificação  de  modelo  estrutural  foca  o  emprego  do  tipo 
de  relação  da  Figura  10-lc  para  representar  hipóteses  es¬ 
truturais  do  modelo  do  pesquisador.  Em  outras  palavras, 
quais  relações  de  dependência  existem  entre  construtos? 
Cada  hipótese  representa  uma  relação  específica  que  deve 
ser  qualificada. 


Retornamos  ao  modelo  de  compromisso  de  cliente  do 
início  do  capítulo.  O  modelo  de  mensuração  mostrado 
na  Figura  10-7  não  inclui  quaisquer  relações  estruturais 
entre  os  construtos.  Todos  os  construtos  foram  conside¬ 
rados  exógenos  e  correlacionados. 

Ao  especificar  um  modelo  estrutural,  o  pesquisador 
agora  seleciona  cuidadosamente  o  que  se  acredita  serem 
os  fatores-chave  que  influenciam  gastos  de  clientela.  Este 
serviço  em  particular  dá  uma  forte  razão  para  se  suspei¬ 
tar  que  percepções  de  preço  (neste  caso,  se  os  preços  são 
percebidos  como  sendo  justos),  de  serviço  (avaliação  da 
qualidade  do  serviço)  e  de  atmosfera  (quão  agradáveis 
são  as  instalações)  afetam  gastos  da  clientela  (a  quan¬ 
tia  relativa  de  recursos  que  um  cliente  gasta  com  este 
provedor  de  serviços),  que,  por  sua  vez,  afeta  o  compro¬ 
misso  dos  clientes.  Com  base  em  suficiente  teoria,  que  é 
apenas  referida  aqui,  o  pesquisador  propõe  as  seguintes 
relações  estruturais: 

H{.  Percepções  de  preço  por  parte  do  consumidor 
são  positivamente  relacionadas  com  gastos  de 
clientela. 

H^-  Percepções  de  serviço  por  parte  do  consumidor 
são  positivamente  relacionadas  com  gastos  de 
clientela. 

Hy  Percepções  de  atmosfera  por  parte  do  consumi¬ 
dor  são  positivamente  relacionadas  com  gastos 
de  clientela. 

{Continua) 
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H^.  Gasto  de  clientela  é  positivamente  relacionado 
com  compromisso  dos  clientes. 

Essas  relações  são  mostradas  na  Figura  10-8.  é 
especificada  com  a  seta  conectando  Preço  e  Gastos  de 
Clientes  e  é  designada  com  H^.  Analogamente,  //j, 
e  7/4  são  especificadas.  A  parte  interna  deste  diagrama 
envolvendo  as  relações  de  dependência  entre  construtos 
representa  a  parte  estrutural  do  modelo.  A  parte  externa 
também  retrata  a  estrutura  especificada  de  mensuração 
que  já  teria  sido  testada  no  estágio  anterior.  Qualquer 
correlação  entre  construtos  exógenos  é  explicada  com  re¬ 
lações  correlacionais  (como  na  Figura  10-ld).  Portanto, 
as  três  relações  entre  construtos  exógenos  são  especifica¬ 
das  exatamente  como  foram  no  modelo  de  mensuração. 

Sob  outro  ponto  de  vista,  o  modelo  estrutural  pode 
ser  especificado  adicionando-se  restrições  ao  modelo  de 
mensuração.  Caminhos  estruturais  específicos  substi¬ 
tuem  as  correlações  entre  construtos  para  cada  relação 
hipotetizada.  Com  a  exceção  de  relações  correlacionais 
entre  construtos  exógenos,  nenhum  caminho  é  esboçado 
entre  dois  construtos  para  os  quais  nenhuma  relação  di¬ 
reta  de  dependência  é  assumida.  Assim,  aquelas  relações 
são  restringidas  para  serem  iguais  a  zero. 


Apesar  de  a  atenção  neste  estágio  estar  sobre  o  mo¬ 
delo  estrutural,  a  estimação  do  modelo  SEM  requer  que 


as  especificações  de  mensuração  sejam  incluídas  também. 
Deste  modo,  o  diagrama  de  caminhos  representa  tanto  a 
parte  estrutural  quanto  de  mensuração  de  SEM  em  um 
modelo  geral.  Logo,  o  diagrama  de  caminhos  na  Figura 
10-8  mostra  não  apenas  o  conjunto  completo  de  constru¬ 
tos  e  indicadores  no  modelo  de  mensuração,  mas  também 
impõe  as  relações  estruturais  entre  construtos.  O  modelo 
agora  está  pronto  para  estimação.  Em  outros  termos,  a 
teoria  geral  está  para  ser  testada,  incluindo  as  relações  te¬ 
orizadas  de  dependência  entre  construtos. 

Estágio  6:  Avaliação  da  validade 
do  modelo  estrutural 

O  último  estágio  envolve  esforços  para  testar  validade  do 
modelo  estrutural  e  suas  correspondentes  relações  teóri¬ 
cas  presumidas  -  H^).  Perceba  que  se  o  modelo  de 
mensuração  não  sobreviveu  a  seu  teste  de  validade  no  es¬ 
tágio  4,  os  estágios  5  e  6  não  podem  ser  realizados.  Tería¬ 
mos  chegado  a  um  sinal  vermelho.  Se  o  estágio  4  propicia 
um  sinal  verde,  significando  que  o  modelo  de  mensuração 
foi  validado,  então  podemos  executar  um  teste  válido  das 
relações  estruturais. 

Duas  diferenças  importantes  surgem  no  teste  do  ajus¬ 
te  de  um  modelo  estrutural  relativamente  a  um  modelo 
de  mensuração.  Primeiro,  ainda  que  o  ajuste  aceitável  do 
modelo  geral  deva  ser  estabelecido,  modelos  alternativos 


H4 


FIGURA  10-8  Diagrama  completo  de  caminhos  exibindo  relações  estruturais  teorizadas  e  a  especificação  completa  de  mensuração. 
Nota:  As  especificações  do  modelo  de  mensuração  são  mostradas  em  cinza.  Já  as  especificações  do  modelo  estrutural  são  mostradas  em  preto. 
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OU  concorrentes  podem  ser  comparados  se  uma  aborda¬ 
gem  apropriada  é  adotada.  Segundo,  uma  ênfase  particu¬ 
lar  é  dada  sobre  os  parâmetros  estimados  para  as  relações 
estruturais,  pois  elas  oferecem  evidência  empírica  direta 
sobre  as  relações  hipotéticas  descritas  no  modelo  estru¬ 
tural. 

GOF  do  modelo  estrutural.  O  processo  de  se  estabelecer 
a  validade  do  modelo  estrutural  segue  as  diretrizes  gerais 
esboçadas  no  estágio  4.  Os  dados  observados  ainda  são 
representados  pela  matriz  de  covariância  observada.  Isso 
não  muda,  e  nem  deve  mudar.  Não  obstante,  uma  nova 
matriz  SEM  de  covariância  estimada  é  calculada,  e  é  dife¬ 
rente  daquela  do  modelo  de  mensuração.  Tal  diferença  é 
um  resultado  das  relações  estruturais  no  modelo  estrutu¬ 
ral.  Lembre-se  que  o  modelo  de  mensuração  assume  que 
todos  os  construtos  são  correlacionados  entre  si  (relações 
via  correlações).  No  entanto,  em  um  modelo  estrutural, 
as  relações  entre  alguns  construtos  são  assumidas  como 
sendo  0.  Portanto,  para  quase  todos  os  modelos  SEM,  a 
GOF  de  X  P^ra  o  modelo  de  mensuração  será  menor  do 
que  a  GOF  de  x  para  o  modelo  estrutural.  Ouando  os 
valores  GOF  diferem,  o  ajuste  do  modelo  estrutural  tam¬ 
bém  deve  ser  avaliado. 

O  ajuste  geral  pode  ser  avaliado  usando  os  mesmos  cri¬ 
térios  do  modelo  de  mensuração:  usando  o  valor  x  P^r^ 
o  modelo  estrutural,  um  outro  índice  absoluto,  um  índice 
incremental,  um  indicador  de  qualidade  de  ajuste  e  um 
de  má  qualidade  de  ajuste.  Essas  medidas  estabelecem  a 
validade  do  modelo  estrutural,  mas  comparações  entre  os 
ajustes  gerais  também  devem  ser  feitas  com  o  modelo  de 
mensuração.  Geralmente,  quanto  mais  próxima  a  GOF 
do  modelo  estrutural  estiver  do  modelo  de  mensuração, 
melhor  o  ajuste  do  modelo  estrutural,  uma  vez  que  o  ajus¬ 
te  do  modelo  de  mensuração  fornece  um  limite  superior 
para  a  GOF  de  um  modelo  estrutural  convencional. 

Ajuste  competitivo 

Anteriormente,  uma  avaliação  de  modelos  concorrentes 
foi  discutida  como  uma  abordagem  para  SEM.  O  princi¬ 
pal  objetivo  é  garantir  que  o  modelo  proposto  não  ape¬ 
nas  tenha  ajuste  aceitável,  mas  que  desempenhe  melhor 
do  que  algum  modelo  alternativo.  Caso  contrário,  o  mo¬ 
delo  alternativo  é  sustentado.  A  comparação  de  modelos 
pode  ser  realizada  pela  avaliação  de  diferenças  em  índi¬ 
ces  de  ajuste  incremental  ou  de  parcimônia,  juntamente 
com  diferenças  entre  valores  de  GOF  de  para  cada 
modelo. 

Comparação  de  modelos  aninhados.  Geralmente,  mo¬ 
delos  aninhados  concorrentes  SEM  são  comparados  com 
base  em  uma  estatística  de  diferença  de  qni-qnadrados 
(Ax')  O  valor  de  algum  modelo  de  referência  (B)  é 
subtraído  do  valor  x^  de  um  modelo  aninhado  alternativo 
(A)  menos  restrito.  Analogamente,  a  diferença  em  graus 
de  liberdade  é  encontrada,  com  um  grau  de  liberdade  a 


menos  para  cada  caminho  adicional  que  é  estimado.  A 
equação  a  seguir  é  usada  para  computação: 

Ax^  =  X^  -  X^ 

^Adf  ''■df(B)  '^dí(A) 

Adf  =  df(B)-df(A) 

Como  a  diferença  de  dois  valores  distribuídos  x  é  ela 
própria  distribuída  x^,  podemos  testar  quanto  a  significân- 
cia  estatística,  dada  uma  diferença  Ax^  e  a  diferença  em 
graus  de  liberdade  (Adf).  Por  exemplo,  para  um  mode¬ 
lo  com  uma  diferença  de  um  grau  de  liberdade  {Adf=  1, 
o  que  significa  um  caminho  extra  no  modelo  A),  um  Ax 
de  3,84  ou  mais  seria  significante  no  nível  0,05.  O  pesqui¬ 
sador  concluiria  que  o  modelo  com  um  caminho  a  mais 
fornece  um  ajuste  melhor,  com  base  na  redução  signifi¬ 
cativa  na  GOF  de  x^-  Modelos  aninhados  também  podem 
ser  formados  pela  eliminação  de  caminhos,  com  o  mesmo 
processo  seguido  no  cálculo  de  diferenças  em  x  e  graus 
de  liberdade. 


Um  exemplo  de  um  modelo  aninhado  na  Figura  10-8 
pode  ser  o  acréscimo  de  um  caminho  estrutural  a  partir 
do  construto  Preços  diretamente  para  o  construto  Com¬ 
promisso  do  Cliente.  Este  caminho  extra  reduziria  os 
graus  de  liberdade  em  um  a  menos.  O  novo  modelo  seria 
reestimado,  e  o  Ax^,  calculado.  Se  for  maior  que  3,84, 
então  o  pesquisador  concluiria  que  o  modelo  alternati¬ 
vo  tem  um  ajuste  significantemente  melhor.  Antes  que  o 
caminho  seja  acrescentado,  porém,  é  necessário  suporte 
teórico  para  a  nova  relação. 


Comparação  com  outros  modelos  concorrentes.  O  usuá¬ 
rio  deve  saber  como  executar  este  cálculo,  pois  ele  nor¬ 
malmente  é  realizada  manualmente,  e  não  por  um  progra¬ 
ma  SEM.  Tal  procedimento  também  pode  ser  utilizado 
para  comparar  o  ajuste  de  um  modelo  estrutural  com  o 
ajuste  de  um  modelo  de  mensuração.  Como  o  modelo  es¬ 
trutural  é  uma  versão  mais  restrita  do  de  mensuração,  é 
aninhado  com  ele. 


Portanto,  a  GOF  de  x  os  resultados  do  modelo  de 
mensuração  no  exemplo  de  compromisso  de  cliente  pode 
ser  comparado  com  a  GOF  de  x  para  os  resultados  do 
modelo  estrutural  correspondentes  à  Figura  10-8  usando 
-se  um  teste  Ax^.  O  teste  resulta  em  Adf=  3,  pois  as  três 
relações  entre  construtos  são  assumidas  como  sendo  0 
(cada  construto  exógeno  para  Compromisso  de  Cliente). 
Se  o  teste  Ax^  for  insignificante,  ele  oferecerá  suporte 
para  o  modelo  estrutural. 


Modelos  equivalentes.  É  importante  saber  que  boas 
estatísticas  de  ajuste  não  provam  que  uma  teoria  é  a 
melhor  maneira  de  explicar  a  matriz  de  covariância  ob- 
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servada.  Como  anteriormente  descrito,  modelos  equiva¬ 
lentes  podem  potencialmente  produzir  a  mesma  matriz 
de  covariância  estimada.  Logo,  qualquer  modelo  dado, 
mesmo  com  bom  ajuste,  é  apenas  uma  explicação  poten¬ 
cial;  outros  arranjos  empíricos  podem  se  ajustar  igual¬ 
mente  bem.  Em  outras  palavras,  bom  ajuste  empírico 
não  demonstra  que  um  dado  modelo  é  a  única  estrutura 
verdadeira.  Estatísticas  favoráveis  de  ajuste  são  alta¬ 
mente  desejáveis,  mas  é  importante  perceber  que  mes¬ 
mo  que  elas  sejam  encontradas,  outros  modelos  talvez 
expliquem  os  dados  igualmente  bem  ou  até  melhor.  De 
fato,  muitos  modelos  alternativos  podem  fornecer  um 
ajuste  equivalente  [38]. 

Esta  questão  reforça  ainda  mais  a  necessidade  de  se 
construir  modelos  de  mensuração  sustentados  em  teoria 
sólida.  Modelos  mais  complexos  podem  ter  uma  quantia 
muito  grande  de  modelos  equivalentes.  No  entanto,  é  bem 
possível  que  muitos,  ou  todos,  façam  pouco  sentido,  dada 
a  natureza  conceituai  dos  construtos  envolvidos.  Assim, 
no  final,  resultados  empíricos  oferecem  alguma  evidência 
de  validade,  mas  o  pesquisador  deve  fornecer  evidência 
teórica  que  seja  igualmente  importante  na  validação  de 
um  modelo. 

Teste  das  relações  estruturais 

O  bom  ajuste  de  modelo  por  si  só  é  insuficiente  para 
sustentar  uma  teoria  estrutural  proposta.  O  pesquisador 
também  deve  examinar  as  estimativas  paramétricas  in¬ 
dividuais  que  representam  cada  hipótese  específica.  Um 
modelo  teórico  é  considerado  válido  na  medida  em  que  as 
estimativas  de  parâmetros  sejam: 

1.  Estatisticamente  significantes  e  na  direção  prevista.  Ou  seja, 
elas  são  maiores  que  zero  para  uma  relação  positiva  e  me¬ 
nores  que  zero  para  uma  relação  negativa. 

2.  Não-triviais.  Esta  característica  deve  ser  verificada  usando- 
se  estimativas  de  cargas  completamente  padronizadas.  A 
orientação  aqui  é  a  mesma  de  qualquer  outra  técnica  multi- 
variada. 

Logo,  o  modelo  estrutural  mostrado  na  Figura  10-8  é 
considerado  aceitável  apenas  quando  ele  demonstra  ajus¬ 
te  aceitável  e  quando  as  estimativas  de  caminhos  repre¬ 
sentando  cada  uma  das  quatro  hipóteses  são  significantes 
e  na  direção  prevista.  O  pesquisador  também  pode  exami¬ 
nar  as  estimativas  de  variância  explicada  para  os  constru¬ 
tos  endógenos  de  maneira  análoga  à  análise  de  feita  em 
regressão  múltipla. 

Resumo 

O  estágio  final  de  SEM  fornece  um  teste  de  quão  bem  a 
teoria  de  um  pesquisador  sobre  a  maneira  como  constru¬ 
tos  se  relacionam  entre  si  realmente  adere  à  realidade. 
Realidade  em  SEM  é  representada  por  uma  matriz  de 
covariância  observada.  O  modelo  de  mensuração  pode 
sustentar  a  teoria  proposta,  mas  o  pesquisador  deve 
especificar  as  relações  estruturais  e  reavaliar  o  mode¬ 


-  REGRAS  PRÁTICAS  10-3  - 

Estágios  SEM  4-6 

•  Quando  modelos  ficam  mais  complexos,  aumenta 
a  possibilidade  de  modelos  alternativos  com  ajuste 
equivalente 

•  Múltiplos  índices  de  ajuste  devem  ser  usados  para 
avaliar  qualidade  de  ajuste  de  um  modelo  e  devem 
incluir: 

•  O  valor  e  o  d/ associado 

•  Um  índice  de  ajuste  absoluto  (ou  seja,  GFI,  RMSEA 
ou  SRMR) 

•  Um  índice  de  ajuste  incremental  (ou  seja,  CFI  ou 
TLI) 

•  Um  índice  de  qualidade  de  ajuste  (GFI,  CFI,  TLI 
etc.) 

•  Um  índice  de  má  qualidade  de  ajuste  (RMSEA, 
SRMR  etc.) 

•  Nenhum  valor  único  “mágico”  para  os  índices  de  ajuste 
separa  modelos  bons  de  ruins,  e  não  é  prático  aplicar 
um  único  conjunto  de  regras  de  corte  para  todos  os 
modelos  de  mensuração,  e  nem  para  todos  os  modelos 
SEM  de  qualquer  tipo 

•  A  qualidade  do  ajuste  depende  consideravelmente  das 
características  do  modelo,  incluindo  tamanho  amostrai 
e  complexidade  do  modelo: 

•  Modelos  simples  com  amostras  pequenas  devem  ser 
mantidos  sob  estritos  padrões  de  ajuste;  até  mesmo 
um  valor-p  insignificante  para  um  modelo  simples 
pode  não  ser  significativo 

•  Modelos  mais  complexos  com  amostras  maiores 
não  devem  ser  mantidos  para  os  mesmos  padrões 
estritos,  e,  assim,  quando  amostras  são  grandes  e 
o  modelo  contém  um  grande  número  de  variáveis 
medidas  e  estimativas  paramétricas,  valores  de  corte 
de  0,95  sobre  medidas  de  GOF  são  não-realistas 


lo.  Esta  segunda  avaliação  de  ajuste  é  conduzida  para 
fornecer  informação  na  forma  do  ajuste  geral  e  de  es¬ 
timativas  individuais  dos  parâmetros  para  os  caminhos 
estruturais.  Mais  detalhes  são  fornecidos  sobre  proce¬ 
dimentos  usados  neste  estágio  nos  Capítulos  11  e  12, 
incluindo  discussões  sobre  medidas  diagnósticas  para 
os  modelos  estrutural  e  de  mensuração.  A  Figura  10-9 
fornece  uma  visão  esquemática  dos  estágios  e  algumas 
das  atividades  envolvidas  no  teste  de  um  modelo  SEM. 
Observe  que  ela  assume  que  o  pesquisador  está  interes¬ 
sado  em  testar  um  modelo  estrutural  completo.  Como 
veremos  no  Capítulo  11,  por  vezes  um  teste  de  um  mo¬ 
delo  de  mensuração  pode  sozinho  tratar  de  questões  de 
pesquisa  importantes. 

Resumo 

Vários  objetivos  importantes  de  aprendizado  foram  for¬ 
necidos  para  este  capítulo.  Tais  objetivos  reunidos  ofe- 
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FiGURA  10-9  Processo  de  seis  estágios  para  modeiagem  de  equações  estruturais. 


recem  uma  visão  básica  de  SEM.  Esta  visão  básica  deve 
viabilizar  uma  melhor  compreensão  das  ilustrações  mais 
específicas  que  seguem  nos  próximos  capítulos. 

Compreender  as  características  distintas  de  SEM.  A 

SEM  é  uma  abordagem  flexível  para  examinar  como  as 
coisas  se  relacionam  entre  si.  Assim,  as  aplicações  da 
SEM  podem  parecer  bastante  distintas.  No  entanto,  três 
características  fundamentais  da  SEM  são  (1)  a  estimação 
de  múltiplas  relações  de  dependência  inter-relacionadas, 
(2)  uma  habilidade  para  representar  conceitos  não-obser- 
vados  em  tais  relações  e  corrigir  erros  de  mensuração  no 


processo  de  estimação,  e  (3)  um  foco  na  explicação  da  co- 
variância  entre  os  itens  medidos. 

Diferenciar  variáveis  de  constrntos.  Os  modelos  tipi¬ 
camente  testados  usando  SEM  envolvem  um  modelo  de 
mensuração  e  um  estrutural.  A  maioria  das  técnicas  multi- 
variadas  discutidas  nos  capítulos  anteriores  se  concentram 
na  análise  direta  de  variáveis.  Variáveis  são  os  itens  reais 
que  são  medidos  por  meio  de  um  levantamento,  de  obser¬ 
vações  ou  algum  outro  instrumento  de  medição.  Variáveis 
são  consideradas  observáveis  na  medida  em  que  podemos 
obter  uma  medida  direta  delas.  Construtos  são  fatores 
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inobserváveis  ou  latentes  que  são  representados  por  uma 
variável  estatística  que  consiste  de  múltiplas  variáveis.  Em 
termos  simples,  múltiplas  variáveis  são  matematicamente 
reunidas  para  representar  um  construto.  Construtos  po¬ 
dem  ser  exógenos  ou  endógenos.  Construtos  exógenos  são 
o  equivalente  latente  multi-itens  de  variáveis  independen¬ 
tes.  Eles  são  construtos  que  são  determinados  por  fatores 
fora  do  modelo.  Construtos  endógenos  são  o  equivalente 
latente  multi-itens  de  variáveis  dependentes. 

Entender  modelagem  de  eqnações  estrntnrais  e  como 
ela  pode  ser  imaginada  como  nma  combinação  de  técni¬ 
cas  mnltivariadas  familiares.  A  SEM  pode  ser  pensada 
como  uma  combinação  de  análise  fatorial  e  análise  de  re¬ 
gressão  múltipla.  A  parte  do  modelo  de  mensuração  é  se¬ 
melhante  à  análise  fatorial  no  sentido  de  que  ela  também 
demonstra  como  variáveis  medidas  têm  cargas  sobre  um 
número  menor  de  fatores  (construtos).  Diversas  analogias 
com  regressão  se  aplicam,  mas  o  relevante  entre  elas  é  o 
fato  de  que  resultados  importantes  ou  construtos  endóge¬ 
nos  são  previstos  usando-se  outros  múltiplos  construtos 
da  mesma  maneira  que  variáveis  independentes  prevêem 
variáveis  dependentes  em  regressão  múltipla. 

Conhecer  as  condições  básicas  para  cansalidade  e  como 
SEM  pode  ajndar  a  estabelecer  nma  relação  de  cansa  e 
efeito.  Teoria  pode  ser  definida  como  um  conjunto  sis¬ 
temático  de  relações  que  fornecem  uma  explicação  con¬ 
sistente  e  abrangente  de  um  fenômeno.  A  SEM  se  tornou 
a  ferramenta  multivariada  mais  proeminente  para  testes 
da  teoria  de  comportamentos.  A  história  da  SEM  se  de¬ 
senvolve  a  partir  da  ânsia  de  se  testar  modelos  causais. 
Teoricamente,  quatro  condições  devem  estar  presentes 
para  estabelecer  causalidade:  (1)  covariação,  (2)  seqüên- 
cia  temporal,  (3)  associação  legítima  e  (4)  suporte  teóri¬ 
co.  a  SEM  pode  estabelecer  evidências  de  covariação  por 
meio  de  testes  de  relações  representadas  por  um  modelo. 
A  SEM  não  pode,  usualmente,  demonstrar  que  a  causa 
ocorreu  antes  do  efeito,  pois  dados  cross-section  são,  na 
maioria  das  vezes,  usados  em  SEM.  Modelos  SEM  que 
usam  dados  longitudinais  podem  ajudar  a  demonstrar 
seqüência  temporal.  A  evidência  de  associação  legítima 
entre  causa  e  efeito  pode  ser  dada,  pelo  menos  em  parte, 
pela  SEM.  Se  a  adição  de  outras  causas  alternativas  não 
elimina  a  relação  entre  causa  e  efeito,  então  a  inferência 
causal  se  torna  mais  forte.  Por  fim,  suporte  teórico  somen¬ 
te  pode  ser  fornecido  com  discernimento.  Descobertas 
empíricas  por  si  mesmas  não  podem  tornar  sensata  uma 
relação.  Assim,  a  SEM  pode  ser  útil  para  se  estabelecer 
causalidade,  mas  o  simples  emprego  da  SEM  em  qualquer 
conjunto  de  dados  não  significa  que  inferências  causais 
podem  ser  estabelecidas. 

Explicar  os  tipos  básicos  de  relações  envolvidas  em 
SEM.  Os  quatro  tipos  de  relações  teóricas  fundamen¬ 
tais  em  um  modelo  SEM  são  descritos  na  Figura  10-1,  a 


qual  também  mostra  a  representação  gráfica  convencio¬ 
nal  de  cada  tipo.  O  primeiro  exibe  relações  entre  cons¬ 
trutos  latentes  e  variáveis  medidas.  Construtos  latentes 
são  representados  por  curvas  ovais,  e  variáveis  medidas, 
por  retângulos.  O  segundo  mostra  covariação  ou  corre¬ 
lação  simples  entre  construtos.  Isso  não  implica  qualquer 
seqüência  causal  e  não  distingue  construtos  exógenos  de 
endógenos.  Esses  dois  primeiros  tipos  de  relações  são  fun¬ 
damentais  na  formação  de  um  modelo  de  mensuração.  O 
terceiro  tipo  de  relação  mostra  como  um  construto  exó¬ 
geno  se  relaciona  com  um  endógeno  e  pode  representar 
uma  inferência  causal  na  qual  o  construto  exógeno  é  uma 
causa,  e  o  endógeno,  um  efeito.  A  quarta  relação  descre¬ 
ve  como  um  construto  endógeno  se  relaciona  com  outro. 
Também  pode  representar  uma  seqüência  causal  de  um 
construto  endógeno  para  outro. 

Entender  qne  o  objetivo  de  SEM  é  explicar  co variância  e 
como  ela  se  tradnz  no  ajnste  de  nm  modelo.  Às  vezes, 
SEM  é  chamada  de  análise  de  estrutura  de  covariância. 
Os  algoritmos  que  executam  a  estimação  da  SEM  têm  a 
meta  de  explicar  a  matriz  de  covariância  observada  das 
variáveis,  S,  usando  uma  matriz  de  covariância  estimada, 
Xi,,  calculada  usando  as  equações  de  regressão  que  repre¬ 
sentam  o  modelo  do  pesquisador.  Em  outras  palavras,  a 
SEM  busca  por  um  conjunto  de  estimativas  de  parâme¬ 
tros  produzindo  valores  de  covariância  estimada  que  se 
aproximam  muito  dos  valores  de  covariância  observada. 
Quanto  mais  próximos  ficam  tais  valores,  melhor  se  ajusta 
o  modelo.  Ajuste  indica  o  quão  bem  um  modelo  especifi¬ 
cado  reproduz  a  matriz  de  covariância  entre  os  itens  medi¬ 
dos.  A  estatística  básica  de  ajuste  da  SEM  é  o  x^-  Contudo, 
sua  sensibilidade  a  tamanho  da  amostra  e  complexidade 
do  modelo  acarretou  o  desenvolvimento  de  muitos  outros 
índices  de  ajuste.  O  ajuste  é  melhor  avaliado  usando-se 
múltiplos  índices  de  ajuste.  E  importante  também  perce¬ 
ber  que  nenhum  valor  mágico  determina  quando  um  mo¬ 
delo  tem  o  melhor  ajuste.  Ao  invés  disso,  o  contexto  do 
modelo  deve  ser  levado  em  consideração  na  avaliação  do 
ajuste.  Modelos  simples  com  pequenas  amostras  devem 
ser  tratados  com  padrões  diferentes  dos  usados  em  mode¬ 
los  mais  complexos  testados  com  amostras  maiores. 

Saber  como  representar  vísualmente  um  modelo  usando 
um  diagrama  de  caminhos.  O  conjunto  inteiro  de  rela¬ 
ções  que  constitui  um  modelo  SEM  pode  ser  visualmen¬ 
te  descrito  por  meio  de  um  diagrama  de  caminhos.  Cada 
tipo  de  relação  é  convencionalmente  representado  com 
um  tipo  diferente  de  seta  e  abreviado  com  um  símbolo 
distinto.  A  Figura  10-8  retrata  um  diagrama  de  caminhos 
que  mostra  um  modelo  de  mensuração  e  um  estrutural.  A 
parte  interna  representa  o  modelo  estrutural.  A  externa, 
o  modelo  de  mensuração. 

Listar  os  seis  estágios  da  modelagem  de  equações  estru¬ 
turais  e  compreender  o  papel  da  teoria  no  processo.  A 
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Figura  10-9  lista  os  seis  estágios  no  processo  SEM.  Ele 
começa  com  a  escolha  das  variáveis  que  serão  medidas. 
Conclui  com  a  avaliação  do  ajuste  do  modelo  estrutural 
geral.  Deve  ser  enfatizado  também  que  a  teoria  desem¬ 
penha  um  papel  fundamental  em  cada  passo  do  processo. 
A  meta  de  uma  SEM  é  fornecer  um  teste  da  teoria.  As¬ 
sim,  sem  teoria,  um  verdadeiro  teste  de  SEM  não  pode 
ser  concluído. 

Como  anteriormente  mencionado,  este  capítulo  não 
inclui  um  exemplo  estendido  de  HBAT.  No  lugar  disso, 
um  novo  exemplo  HBAT  será  introduzido  no  próximo 
capítulo.  Ao  longo  dos  próximos  dois  capítulos,  será  ilus¬ 
trado  o  uso  completo  da  SEM  para  testar  relações-chave 
que  ajudarão  a  HBAT  a  tomar  decisões  administrativas 
estratégicas. 

Questões 

1.  Qual  é  a  diferença  entre  um  construto  latente  e  uma  variá¬ 
vel  medida? 

2.  Quais  são  as  características  marcantes  da  SEM? 

3.  Descreva  como  pode  ser  computada  a  matriz  de  covariância 
estimada  em  uma  análise  SEM  (Xj.).  Por  que  a  comparamos 
com  S? 


4.  Qual  é  a  semelhança  entre  a  modelagem  de  equações  estru¬ 
turais  e  as  outras  técnicas  multivariadas  discutidas  em  capí¬ 
tulos  anteriores? 

5.  Q  que  é  uma  teoria?  Como  uma  teoria  é  representada  em 
uma  estrutura  SEM? 

6.  Q  que  é  uma  correlação  ilegítima?  Como  ela  pode  ser  reve¬ 
lada  usando-se  SEM? 

7.  Q  que  é  ajuste? 

8.  Qual  é  a  diferença  entre  um  índice  de  ajuste  absoluto  e  um 
relativo? 

9.  De  que  forma  o  tamanho  amostrai  afeta  a  modelagem  de 
equações  estruturais? 

10.  Por  que  não  estão  disponíveis  valores  mágicos  para  distin¬ 
guir  ajuste  bom  de  ajuste  ruim  em  situações  em  geral? 

11.  Faça  um  diagrama  de  caminhos  com  dois  construtos  exóge¬ 
nos  e  um  endógeno.  Cada  construto  exógeno  é  medido  por 
cinco  itens,  e  o  endógeno,  por  quatro  itens.  Qs  dois  constru¬ 
tos  exógenos  devem  estar  negativamente  relacionados  com 
o  endógeno. 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustra  problemas  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 
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Estimação  de  relações  usando  análise  de  caminhos 


Qual  era  o  objetivo  de  se  desenvolver  o  diagrama  de  ca¬ 
minhos?  Ele  é  a  base  para  a  análise  de  caminhos,  o  proce¬ 
dimento  para  estimação  empírica  da  força  de  cada  relação 
(caminho)  descrita  no  diagrama.  A  análise  de  caminhos 
calcula  a  força  das  relações  usando  somente  uma  matriz 
de  correlação  ou  covariância  como  entrada.  Descrevemos 
o  processo  básico  na  próxima  seção,  usando  um  exemplo 
simples  para  ilustrar  como  as  estimativas  são  realmente 
computadas. 

Identificação  de  caminhos 

O  primeiro  passo  é  identificar  todas  as  relações  que  co¬ 
nectam  dois  construtos  quaisquer.  A  análise  de  cami¬ 
nhos  permite  decompor  a  correlação  simples  (bivariada) 
entre  duas  variáveis  quaisquer  na  soma  dos  componen¬ 
tes  que  conectam  tais  pontos.  O  número  e  tipos  de  ca¬ 
minhos  componentes  entre  duas  variáveis  quaisquer  são 
estritamente  uma  função  do  modelo  proposto  pelo  pes¬ 
quisador. 

Um  caminho  composto  é  um  caminho  ao  longo  das  se¬ 
tas  de  um  diagrama  que  segue  três  regras: 

1.  Após  seguir  adiante  em  uma  seta,  o  caminho  não  pode  re¬ 
troceder;  mas  o  caminho  pode  ir  para  trás  quantas  vezes  fo¬ 
rem  necessárias  antes  de  ir  para  frente. 

2.  O  caminho  não  pode  seguir  por  meio  da  mesma  variável 
mais  do  que  uma  vez. 

3.  O  caminho  pode  incluir  apenas  uma  seta  curva  (par  de  va¬ 
riáveis  correlacionadas). 

Quando  se  aplicam  essas  regras,  cada  seta  representa 
um  caminho.  Se  apenas  uma  seta  conecta  dois  construtos 
(a  análise  de  caminhos  também  pode  ser  conduzida  com 
variáveis),  então  a  relação  entre  os  mesmos  é  igual  à  es¬ 
timativa  de  parâmetro  entre  os  dois  construtos.  Por  en¬ 
quanto,  essa  relação  pode  ser  chamada  de  relação  direta. 
Cobrimos  detalhadamente  relações  estruturais  diretas  e 
indiretas  no  Capítulo  12.  Se  houver  múltiplas  setas  ligan¬ 
do  um  construto  a  outro,  como  em  X  — >  Y  — >  Z,  então 
o  efeito  de  X  sobre  Z  é  igual  ao  produto  das  estimativas 
paramétricas  para  cada  seta.  Este  conceito  pode  parecer 
bastante  complicado,  mas  um  exemplo  o  torna  fácil  de  se 
acompanhar: 


A  Figura  lOA-1  retrata  um  modelo  simples  com  dois 
construtos  exógenos  e  Yj)  causalmente  relacionados 
com  o  construto  endógeno  (Y^).  O  caminho  por  corre¬ 


lação  A  é  Yj  correlacionado  com  Yj,  o  caminho  B  é  o 
efeito  de  Yj  prevendo  Yj,  e  C  mostra  o  efeito  de  Yj  pre¬ 
vendo  Yj.  O  valor  para  Yj  pode  ser  dado  simplesmente 
com  uma  equação  de  regressão: 


Y^=h,Y^  +  b,Y, 


Podemos  agora  identificar  os  caminhos  direto  e  in¬ 
direto  em  nosso  modelo.  Para  facilitar  a  referência  aos 
caminhos,  os  causais  são  chamados  de  A,  B  e  C. 


Caminhos  diretos 
A  =  Yj  a  Yj 
B  =  Yi  a  Yi 
C  =  Yj  a  Yi 


Caminhos  indiretos 

AC  =  Yi  a  Yj 
AB  =  Yj  a  Yj 


Estimação  da  relação 

Com  os  caminhos  diretos  e  indiretos  agora  definidos, 
podemos  representar  a  correlação  entre  cada  construto 
como  a  soma  dos  caminhos  diretos  e  indiretos. 


As  três  correlações  únicas  entre  os  construtos  podem  ser 
mostradas  como  compostas  de  caminhos  diretos  e  indi¬ 
retos  como  se  segue: 

Corr;,,^j=B+AC 
Corr^jyi  =  C+AB 

Primeiro,  de  Yj  e  Yj  é  simplesmente  igual  a  A.  A 
correlação  de  Yj  e  Yj  (Corr^j.^  yJ  pode  ser  representada 
como  dois  caminhos:  B  e  AC.  O  símbolo  B  representa 
o  caminho  direto  de  Yj  a  Yj,  e  o  outro  caminho  (com¬ 
posto)  segue  a  seta  curvilínea  de  Yj  para  Yj  e  então 
para  Yj.  Analogamente,  a  correlação  de  Y2  e  Yj  pode 
ser  mostrada  como  composta  de  dois  caminhos  causais: 
Ce  AB. 


Uma  vez  que  as  correlações  são  definidas  em  termos 
de  caminhos,  os  valores  das  correlações  observadas  po¬ 
dem  ser  substituídos  e  as  equações  podem  ser  resolvidas 
para  cada  caminho  separadamente.  Qs  caminhos  então 
representam  as  relações  causais  entre  construtos  (seme¬ 
lhantemente  a  um  coeficiente  de  regressão)  ou  estimati¬ 
vas  correlacionais. 
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Diagrama  de  caminhos 


Correlações  bivariadas 

Xi  X2 

1,0 

Xg  0,50  1 ,0 

Vi  0,60  0,70  1,0 


Correlações  como  caminhos  compostos  Resolução  dos  coeficientes  estruturais 

Corrx,x2  =  A  0,50  =  A 

Corr^,  y,  =  B  +  AC  0,60  =  B  +  AC 

Corr^gV,  =  C  +  AB  0,70  =  C  +  AB 

Substituindo  A  =  0,50 
0,60  =  B  +  0,50C 
0,70  =  C  +  0,50B 

Solução  para  B  e  C 
B  =  0,33 
C  =  0,53 

FIGURA  10A-1  Cálculo  dos  coeficientes  estruturais  com  análise  de  caminhos. 


Usando  as  correlações  como  mostradas  na  Figura  lOA-1, 
podemos  resolver  as  equações  para  cada  correlação  (ver 
Figura  lOA-1)  e  estimar  as  relações  causais  representa¬ 
das  pelos  coeficientes  e  òj- 

Sabemos  que  A  é  igual  a  0,50,  e  assim  podemos  subs¬ 
tituir  este  valor  nas  demais  equações.  Resolvendo  essas 
duas  equações,  conseguimos  valores  de  B  {b{)  =  0,33  e 
C(b2)  =  0,53.  Os  cálculos  são  exibidos  na  Figura  lOA- 
1.  Esta  abordagem  permite  que  a  análise  de  caminhos 
resolva  qualquer  relação  causal  com  base  apenas  nas 
correlações  entre  os  construtos  e  o  modelo  causal  espe¬ 
cificado. 


Como  você  pode  perceber  a  partir  deste  exemplo  sim¬ 
ples,  se  mudarmos  o  modelo  de  caminhos  de  alguma  for¬ 
ma,  as  relações  causais  também  mudarão.  Tal  mudança 
fornece  a  base  para  a  modificação  do  modelo  para  atingir 
um  ajuste  melhor,  se  isso  for  teoricamente  justificado. 

Com  essas  regras  simples,  o  modelo  maior  agora  pode 
ser  delineado  simultaneamente,  usando  correlações  ou 
covariâncias  como  os  dados  de  entrada.  Devemos  obser¬ 
var  que,  quando  usados  em  um  modelo  maior,  podemos 
resolver  qualquer  número  de  equações  inter-relacionadas. 
Assim,  variáveis  dependentes  em  uma  relação  podem  fa¬ 
cilmente  ser  independentes  em  outra.  Não  importa  quão 
grande  o  diagrama  de  caminhos  fique  ou  quantas  relações 
sejam  incluídas,  a  análise  de  caminhos  fornece  uma  ma¬ 
neira  de  analisar  o  conjunto  de  relações. 


Abreviações  SEM 
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O  guia  a  seguir  ajuda  na  pronúncia  e  na  compreensão 
de  abreviações  comuns  de  SEM.  A  terminologia  SEM 
freqüentemente  é  abreviada  com  uma  combinação  de 


caracteres  gregos  e  romanos,  para  ajudar  a  distinguir  di¬ 
ferentes  partes  de  um  modelo  SEM. 


Símbolo 

Pronúncia 

Significado 

C 

ksi 

Um  construto  associado  com  variáveis  medidas  X 

A 

lâmbda  “x” 

Um  caminho  representando  a  carga  fatorial  entre  um  construto 
latente  e  uma  variável  medida  x 

lâmbda  “y” 

Um  caminho  representando  a  carga  fatorial  entre  um  construto 
latente  e  uma  variável  medida  y. 

A 

lâmbda  maiúsculo 

Uma  maneira  de  se  referir  a  um  conjunto  de  estimativas  de  cargas 
representadas  em  uma  matriz  na  qual  linhas  correspondem  a  va¬ 
riáveis  medidas  e  colunas  se  associam  a  construtos  latentes 

ú 

êta 

Um  construto  associado  com  variáveis  medidas  Y 

tp 

fi 

Um  caminho  representado  por  uma  seta  curvada  de  dois  sentidos 
que  representa  a  covariação  entre  um  ^  e  outro  ^ 

fi  maiúsculo 

Uma  maneira  de  se  referir  à  matriz  de  covariância  ou  de  correla¬ 
ção  entre  um  conjunto  de  construtos  ^ 

7 

gama 

Um  caminho  representando  uma  relação  causal  (coeficiente  de 
regressão)  de  um  ^  para  um  q 

r 

gama  maiúsculo 

Uma  maneira  de  se  referir  ao  conjunto  inteiro  de  relações  7  para 
um  dado  modelo 

P 

beta 

Um  caminho  representando  uma  relação  causal  (coeficiente  de 
regressão)  de  um  construto  q  para  outro  construto  q 

B 

beta  maiúsculo 

Uma  maneira  de  se  referir  ao  conjunto  inteiro  de  relações  (3  para 
um  dado  modelo 

ô 

delta 

0  termo  de  erro  associado  com  uma  variável  x  entre  os  valores 
medidos  e  estimados 

08 

téta  delta 

Um  modo  de  se  referir  às  variâncias  e  covariâncias  residuais  asso¬ 
ciadas  com  as  estimativas  de  x\  os  itens  de  variância  de  erro  estão 
na  diagonal 

8 

épsilon 

0  termo  de  erro  associado  com  uma  variável  y  entre  os  valores 
medidos  e  estimados 

0. 

téta  épsilon 

Uma  maneira  de  se  referir  às  variâncias  e  covariâncias  residuais 
associadas  com  as  estimativas  de  y;  os  itens  da  variância  de  erro 
estão  na  diagonal 

zéta 

Uma  maneira  de  se  capturar  a  covariação  entre  erros  de  constru- 

T 

tau 

Os  termos  de  intercepto  para  estimação  de  uma  variável  medida 

K 

capa 

Os  termos  de  intercepto  para  estimação  de  um  construto  latente 

2 

X 

qui-quadrado 

A  razão  de  verossimilhança 

Apêndice  lOC 


Detalhe  sobre  índices  GO F  selecionados 


o  capítulo  descreve  como  pesquisadores  desenvolve¬ 
ram  muitos  índices  de  ajuste  diferentes  que  represen¬ 
tam  a  GOF  de  um  modelo  SEM  de  diferentes  manei¬ 
ras.  Aqui,  um  pouco  mais  de  detalhe  é  fornecido  sobre 
alguns  dos  índices  críticos,  como  um  esforço  para  ofe¬ 
recer  uma  melhor  compreensão  sobre  qual  informação 
está  contida  em  cada  um  deles. 


índice  de  qualidade  de  ajuste  (GFI) 

Se  imaginarmos  como  a  função  de  ajuste  mínimo  de¬ 
pois  que  um  modelo  SEM  tenha  sido  estimado,  usando  k 
graus  de  liberdade  (S  —  X*.),  e  se  pensarmos  em  como 
a  função  de  ajuste  que  resultaria  se  todos  os  parâmetros 
fossem  nulos  (nada  se  relaciona  com  nada;  não  há  rela¬ 
ções  teóricas),  então  podemos  definir  o  GFI  simplesmen¬ 
te  como: 


F, 

GFI  =  1  - 

Po 

Um  modelo  que  se  ajusta  bem  produz  uma  proporção 
FJFq  que  é  muito  pequena.  Reciprocamente,  um  modelo 
que  não  se  ajusta  bem  produz  uma  FJFg  que  é  relativa¬ 
mente  grande,  pois  não  difere  muito  de  F^.  Esta  pro¬ 
porção  funciona  de  maneira  parecida  com  a  proporção 
SSE/SST  discutida  no  Capítulo  4.  No  caso  extremo,  se 
um  modelo  falha  para  explicar  qualquer  covariância  ver¬ 
dadeira  entre  variáveis  medidas,  FJF^  é  1,  o  que  significa 
que  o  GFI  é  nulo. 

Raiz  do  erro  quadrático  médio 
de  aproximação  (RMSEA) 

O  cálculo  de  RMSEA  é  bastante  direto  e  é  fornecido  aqui 
para  demonstrar  como  os  estatísticos  procuram  corrigir  os 
problemas  usando  apenas  a  estatística  x^- 


RMSEA= 


(N-1) 


Note  que  os  d/ são  subtraídos  do  numerador  como 
um  esforço  para  capturar  a  complexidade  do  modelo. 
O  tamanho  da  amostra  é  usado  no  denominador  para 
levar  isso  em  conta.  Para  evitar  valores  negativos  de 
RMSEA,  o  numerador  é  considerado  zero  se  d/^.  exce¬ 
der  x^- 


índice  de  ajuste  comparativo  (CFI) 

A  forma  geral  de  computação  do  CFI  é: 


CFI  =  1  - 


Aqui,  k  representa  valores  associados  com  o  modelo 
ou  teoria  especificados  pelo  pesquisador,  ou  seja,  o  ajus¬ 
te  resultante  com  k  graus  de  liberdade.  N  denota  valores 
associados  com  o  modelo  estatístico  nulo.  Além  disso,  a 
equação  é  normada  para  valores  entre  0  e  1  -  com  valores 
mais  altos  indicando  ajuste  melhor  -  com  substituição  por 
um  valor  adequado  (isto  é,  zero)  se  um  valor  x  for  menor 
que  os  correspondentes  graus  de  liberdade. 

índice  de  Tucker-Lewis  (TLI) 

A  equação  para  o  TLI  é  dada  aqui  para  fins  de  compa¬ 
ração: 


TLI=^ 


fí  2  ^ 

(  2  U 

Ti 

dfr 

df, 

Lv 

2  ^ 

-1 

df , 

Lv  N  ) 

_ 

Novamente,  N e  kse  referem  aos  modelos  nulo  e  espe¬ 
cificado,  respectivamente.  O  TLI  não  é  normado,  e,  assim, 
seus  valores  podem  ficar  abaixo  de  0  ou  acima  de  1.  Ele  pro¬ 
duz  valores  semelhantes  ao  CFI  na  maioria  das  situações. 

Proporção  de  parcimônia  (PR) 

A  proporção  de  parcimônia  (PR)  forma  a  base  para  medi¬ 
das  GOF  de  parcimônia  [31]: 


Como  pode  ser  visto  pela  fórmula,  ela  é  a  razão  de 
graus  de  liberdade  usados  por  um  modelo  pelo  total  de 
graus  de  liberdade  disponíveis.  Assim,  outros  índices  são 
ajustados  por  PR  para  formar  índices  de  ajuste  de  par¬ 
cimônia.  Apesar  de  esses  índices  poderem  ser  úteis,  eles 
tendem  a  favorecer  fortemente  as  medidas  mais  parcimo¬ 
niosas.  Essas  medidas  existem  há  bastante  tempo,  mas 
ainda  não  são  muito  aplicadas. 
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CAPITULO 


SEM:  Análise 


Fatorial  Confirmatória 


Objetivos  de  aprendizagem 

Ao  concluir  este  capítulo,  você  deverá  ser  capaz  de: 

■  Diferenciar  entre  análise  fatorial  exploratória  e  análise  fatorial  oonfirmatória. 

■  Avaliar  a  validade  de  construto  de  um  modelo  de  mensuração. 

■  Saber  oomo  representar  um  modelo  de  mensuração  usando  um  diagrama  de  caminhos. 

■  Entender  os  princípios  básicos  de  identificação  estatística  e  conhecer  algumas  das  principais 
causas  dos  problemas  de  identificação  de  SEM. 

■  Compreender  o  eonceito  de  ajuste  da  forma  como  se  aplica  em  modelos  de  mensuração  e 
ser  eapaz  de  avaliar  o  ajuste  de  um  modelo  de  análise  fatorial  confirmatória. 

■  Saber  oomo  a  SEM  pode  ser  usada  para  eomparar  resultados  entre  grupos,  inoluindo 
validação  cruzada  de  um  modelo  de  mensuração  ao  longo  de  amostras  distintas. 


Apresentação  do  capítulo 

0  capítulo  anterior  introduziu  os  fundamentos  de  modelagem  de  equações  estruturais.  Ele  descreveu 
as  duas  partes  básicas  para  um  modelo  de  equações  estruturais  convencional.  Este  capítulo  aborda 
a  primeira  parte,  demonstrando  como  processos  confirmatórios  podem  testar  uma  teoria  proposta  de 
mensuração.  A  teoria  de  mensuração  pode  ser  representada  com  um  modelo  que  mostra  como  variá¬ 
veis  medidas  se  unem  para  representar  construtos.  A  análise  fatorial  confirmatória  (CEA)  nos  permite 
testar  o  quão  bem  as  variáveis  medidas  representam  os  construtos.  A  principal  vantagem  é  que  o 
pesquisador  pode  testar  analiticamente  uma  teoria  conceitualmente  fundamentada,  explicando  como 
diferentes  itens  medidos  descrevem  importantes  medidas  psicológicas,  sociológicas  ou  de  negócios. 
Quando  resultados  de  CEA  são  combinados  com  testes  de  validade  de  construto,  os  pesquisadores 
podem  obter  um  melhor  entendimento  da  qualidade  de  suas  medições. 

A  importância  de  se  avaliar  a  qualidade  de  medidas  em  um  modelo  comportamental  não  pode  ser 
superestimada.  Não  existem  conclusões  válidas  sem  medidas  válidas.  Os  procedimentos  descritos 
neste  capítulo  demonstram  como  a  validade  de  um  modelo  de  mensuração  pode  ser  testada  usando- 
se  CEA  e  SEM. 


Termos-chave 

Antes  de  começar  este  capítulo,  leia  os  termos-chave  para 
comprender  os  conceitos  e  a  terminologia  empregados.  Ao 
longo  do  capítulo,  os  termos-chave  aparecem  em  negrito. 
Outros  pontos  que  merecem  destaque  no  capítulo  e  referên¬ 
cias  cruzadas  nos  termos-chave,  estão  em  itálico.  Exemplos 
ilustrativos  estão  em  quadros. 


Busca  de  especificação  Abordagem  empírica  de  tentativa  e 
erro  que  pode  conduzir  a  mudanças  seqüenciais  no  modelo 
baseadas  em  diagnóstioos-chave  do  modelo. 

Caso  Heywood  Solução  fatorial  que  produz  uma  estimativa  de 
variância  de  erro  menor  que  0  (uma  variância  negativa  de 
erro).  Programas  SEM  comumente  geram  uma  solução  impró¬ 
pria  quando  um  caso  Heywood  estâ  presente. 
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Condição  de  ordem  Exigência  de  que  os  graus  de  liberdade 
para  um  modelo  sejam  maiores  que  zero;  ou  seja,  o  número 
de  termos  únicos  de  covariância  e  variância  menos  o  número 
de  estimativas  de  parâmetros  livres  deve  ser  positivo. 

Condição  de  ordenação  Exigência  de  que  cada  parâmetro  indi¬ 
vidual  estimado  seja  única  e  algebricamente  definido.  Se  você 
imagina  um  conjunto  de  equações  que  poderia  definir  qual¬ 
quer  variável  dependente,  a  condição  de  ordenação  é  violada 
se  duas  equações  quaisquer  são  duplicatas  matemáticas. 

Confiabilidade  de  construto  (CR)  Medida  de  confiabilidade  e 
consistência  interna  das  variáveis  medidas  representando  um 
construto  latente.  Deve  ser  estabelecida  antes  que  a  validade 
do  construto  possa  ser  avaliada. 

Correlações  quadráticas  múltiplas  Valores  representando  a 
extensão  em  que  a  variância  de  uma  variável  medida  é  expli¬ 
cada  por  um  fator  latente.  É  semelhante  ã  Idéia  de  comunall- 
dade  em  EEA. 

Covariância  de  erro  entre  construtos  Covariância  entre  dois 
termos  de  erro  de  variáveis  medidas  indicando  diferentes 
construtos. 

Covariância  interna  de  erro  de  construto  Covariância  entre 
dois  termos  de  erro  de  variáveis  medidas  que  são  indicadores 
de  diferentes  construtos. 

Equivalência  de  estrutura  fatorial  Às  vezes  conhecida  como 
invariância  de  configuração,  ela  existe  quando  um  bom  ajuste 
é  obtido  de  um  modelo  CEA  multi-grupo  que  simultaneamente 
estima  uma  solução  fatorial  para  todos  os  grupos,  com  cada 
grupo  configurado  com  a  mesma  estrutura  (mesmo  padrão  de 
parâmetros  livres  e  fixados).  Ver  também  modelo  totalmente 
livre  de  múltiplos  grupos. 

Equivalência  escalar  Condição  de  teoria  da  mensuração  na 
qual  as  quantias  de  construtos  podem  ser  comparadas  entre 
grupos.  Na  prática,  isso  significa  que  uma  comparação  válida 
das  médias  entre  grupos  pode  ser  feita. 

Equivalência-tau  Suposição  de  que  um  modelo  de  mensuração 
é  congênere  e  que  todas  as  cargas  fatoriais  são  iguais. 

Exatamente  identificado  Modelo  SEM  que  contém  exatamente 
0  número  suficiente  de  graus  de  liberdade  para  estimar  todos 
os  parâmetros  livres.  Modelos  exatamente  Identificados  têm 
ajuste  perfeito,  por  definição,  o  que  significa  que  uma  avalia¬ 
ção  de  ajuste  não  tem  sentido. 

Identificação  Se  existe  informação  suficiente  para  identificar 
uma  solução  para  um  conjunto  de  equações  estruturais.  Um 
problema  de  Identificação  conduz  a  uma  incapacidade  de  o 
modelo  proposto  gerar  estimativas  únicas  e  pode  impedir  que 
0  programa  SEM  gere  resultados.  As  três  possíveis  condições 
de  identificação  são  super-identificado,  exatamente  identifica¬ 
do  e  sub-identificado. 

índice  de  modificação  Quantia  em  que  o  valor  do  modelo 
geral  seria  reduzido  ao  se  livrar  qualquer  caminho  em  particu¬ 
lar  que  não  seja  correntemente  estimado. 

Invariância  de  configuração  Ver  equivalência  de  estrutura  fa¬ 
torial. 

Invariância  de  mensuração  Condição  de  teoria  de  mensuração 
na  qual  as  medidas  que  formam  um  modelo  de  mensuração 
têm  0  mesmo  significado  e  são  usadas  da  mesma  maneira 
por  diferentes  grupos  de  respondentes. 


Invariância  métrica  Evidência  de  que  respondentes  usam  as 
escalas  de  avaliação  de  maneira  análoga  ao  longo  de  grupos 
e  assim  as  diferenças  entre  valores  podem  ser  diretamente 
comparadas. 

Medidas  unidimensionais  Conjunto  de  variáveis  medidas 
(indicadores)  com  apenas  um  construto  latente  inerente. 
Isto  é,  as  variáveis  indicadoras  carregam  sobre  apenas  um 
construto. 

Modelo  de  mensuração  Especificação  da  teoria  de  mensura¬ 
ção  que  mostra  como  construtos  são  operacionalizados  por 
conjuntos  de  variáveis  medidas.  A  especificação  é  semelhan¬ 
te  a  uma  EEA  por  análise  fatorial,  mas  difere  no  sentido  de  que 
0  número  de  fatores  e  itens  que  carregam  sobre  cada  fator 
devem  ser  conhecidos  e  especificados  antes  que  a  análise 
possa  ser  conduzida. 

Modelo  de  mensuração  congênere  Modelo  de  mensuração 
consistindo  de  diversos  construtos  unidimensionais  com  to¬ 
das  as  cargas  cruzadas  sendo  consideradas  nulas.  Isso  é  re¬ 
presentado  em  CFA  com  todas  as  covahãnoias  de  erro  interno 
e  entre  construtos  sendo  fixadas  como  zero. 

Modelo  fatorial  de  primeira  ordem  Covariâncias  entre  variáveis 
medidas  explicadas  com  uma  única  camada  fatorial  latente. 
Ver  também  modelo  fatorial  de  segunda  ordem,  que  tem  duas 
camadas  de  fatores  latentes. 

Modelo  fatorial  de  segunda  ordem  Teoria  de  mensuração  que 
envolve  duas  “camadas"  de  construtos  latentes.  Esses  mode¬ 
los  introduzem  fatores  latentes  de  segunda  ordem  que  são  a 
causa  de  múltiplos  fatores  latentes  de  primeira  ordem,  que, 
por  sua  vez,  são  a  causa  de  variáveis  medidas  (x). 

Modelo  não-identificado  Ver  modelo  sub-identificado. 

Modelo  sub-identificado  Modelo  com  mais  parâmetros  a  se¬ 
rem  estimados  do  que  variâncias  ou  covariâncias  de  itens. 
O  termo  não-identificado  é  usado  como  sinônimo  de  sub- 
identificado. 

Modelo  super-identificado  Modelo  que  tem  mais  termos  únicos 
de  covariância  e  variância  do  que  parâmetros  a  serem  estima¬ 
dos.  Ele  tem  uma  quantia  positiva  de  graus  de  liberdade.  Este 
é  0  tipo  preferido  de  identificação  para  um  modelo  SEM. 

Modelo  totalmente  livre  de  múltiplos  grupos  (TF)  Modelo  que 
usa  a  mesma  estrutura  (padrão  de  parâmetros  fixos  e  livres) 
em  todos  os  grupos. 

Operacionalização  Maneira  pela  qual  um  construto  pode  ser 
representado.  Com  CEA,  um  conjunto  de  variáveis  medidas  é 
utilizado  para  representar  um  construto. 

Parâmetro  Representação  numérica  de  alguma  característica 
de  uma  população.  Em  SEM,  relações  são  a  característica 
de  interesse  para  as  quais  os  procedimentos  de  modelagem 
geram  estimativas.  Parâmetros  são  características  numéricas 
das  relações  SEM,  comparáveis  com  coeficientes  de  regres¬ 
são  em  regressão  múltipla. 

Parcelamento  de  item  Combinação  de  variáveis  medidas  em 
conjuntos  de  variáveis  pela  soma  ou  média  de  vários  itens. 
Essas  parcelas  podem  então  ser  usadas  como  indicadores 
quando  o  número  total  de  indicadores  não  é  gerenciável. 

Regra  dos  três  indicadores  Assume  modelos  de  mensuração 
congêneres  nos  quais  todos  os  construtos  têm  pelo  menos 
três  indicadores  identificados. 
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Resíduos  padronizados  Resíduos  divididos  pelo  erro  padrão 
dos  mesmos.  Usados  como  uma  medida  diagnóstica  do  ajus¬ 
te  do  modelo. 

Resíduos  Diferenças  individuais  entre  termos  de  covariância 
observada  e  termos  de  covariância  estimada. 

Restrições  Fixar  uma  relação  potencial  em  um  modelo  SEM 
para  algum  valor  especificado  (mesmo  que  seja  zero)  ao  in¬ 
vés  de  permitir  que  o  valor  seja  estimado  (livre). 

Teoria  de  mensuração  Série  de  relações  que  sugerem  como 
variáveis  medidas  representam  um  construto  não  medido  di¬ 
retamente  (latente).  Uma  teoria  de  mensuração  pode  ser  re¬ 
presentada  por  uma  série  de  equações  do  tipo  regressão  e 
que  matematicamente  relacionam  um  fator  (construto)  com  as 
variáveis  medidas. 

Teoria  de  mensuração  formativa  Teoria  baseada  nas  su¬ 
posições  de  que  (1)  as  variáveis  medidas  são  a  causa  do 
construto  e  (2)  o  erro  na  medição  é  uma  falta  de  habilidade 
para  explicar  completamente  o  construto.  O  construto  não 
é  latente  neste  easo.  Ver  também  teoria  de  mensuração  re¬ 
flexiva. 

Teoria  de  mensuração  refiexiva  Teoria  baseada  nas  suposi¬ 
ções  de  que  (1)  construtos  latentes  são  a  causa  de  variáveis 
medidas  e  (2)  o  erro  de  medição  resulta  da  incapacidade  de 
explicar  completamente  tais  medidas.  É  a  representação  típi¬ 
ca  para  um  construto  latente.  Ver  também  teoria  de  mensura¬ 
ção  formativa. 

TF  Ver  modelo  totalmente  livre  de  múltiplos  grupos. 

Vaiidação  cruzada  Tentativa  de  reproduzir  os  resultados  encon¬ 
trados  em  alguma  amostra  usando  dados  de  uma  amostra  di¬ 
ferente,  geralmente  obtidos  da  mesma  população. 

Vaiidação  cruzada  apertada  Obtida  quando  as  cargas  fato¬ 
riais,  correlações  de  construtos  e  termos  de  variância  de  erro 
são  os  mesmos  na  amostra  original  como  são  nas  amostras 
de  validação  oruzada. 

Vaiidação  cruzada  soita  Obtida  quando  um  modelo  TF  com¬ 
posto  de  uma  amostra  original  e  de  uma  amostra  de  validação 
cruzada  fornece  bom  ajuste. 

Vaiidade  convergente  O  quanto  indicadores  de  um  construto 
específico  convergem  ou  compartilham  uma  elevada  propor¬ 
ção  de  variância  em  comum. 

Validade  de  construto  O  quanto  um  conjunto  de  variáveis  me¬ 
didas  realmente  representa  o  construto  latente  teórico  que 
aquelas  variáveis  sâo  planejadas  para  medir. 

Validade  de  expressão  O  quanto  o  conteúdo  dos  itens  é  con¬ 
sistente  com  a  definição  do  construto,  com  base  apenas  no 
julgamento  do  pesquisador. 

Validade  discriminante  O  quanto  um  construto  é  verdadeira¬ 
mente  distinto  de  outros.  A  matriz  fi  ($)  de  correlações  de 
construtos  pode  ser  útil  nesta  avaliação. 

Validade  nomológica  Teste  de  validade  que  examina  se  as  cor¬ 
relações  entre  os  construtos  na  teoria  de  mensuração  fazem 
sentido.  A  matriz  fi  ($)  de  correlações  de  construtos  pode  ser 
útil  nesta  avaliação. 

Variância  extraída  (VE)  Uma  medida  resumida  de  convergên¬ 
cia  em  um  conjunto  de  itens  que  representa  um  construto 
latente.  É  o  percentual  médio  de  variação  explicada  entre 
os  itens. 


Viés  de  métodos  constantes  Covariância  entre  variáveis  medi¬ 
das  é  influenciada  pelo  método  de  coleta  de  dados  (p.ex.,  o 
mesmo  método  de  coleta,  formato  do  questionário,  ou  mesmo 
tipo  de  escala). 


O  QUE  É  ANÁLISE  EATORIAL 
CONEIRMATÓRIA? 

Este  capítulo  começa  fornecendo  uma  descrição  de  aná¬ 
lise  fatorial  confirmatória  (CFA).  CFA  é  uma  maneira 
de  testar  o  quão  bem  variáveis  medidas  representam 
um  número  menor  de  construtos.  O  capítulo  ilustra  este 
processo  mostrando  como  a  CFA  é  parecida  com  outras 
técnicas  multivariadas.  Em  seguida,  um  exemplo  simples 
é  dado.  Uns  poucos  aspectos  importantes  da  CFA  são 
discutidos  antes  de  se  descrever  os  estágios  da  CFA  com 
mais  detalhes  e  demonstrar  tal  técnica  com  uma  ilustra¬ 
ção  estendida. 

CEA  e  análise  fatorial  exploratória 

O  Capítulo  3  descreveu  procedimentos  para  conduzir 
análise  fatorial  exploratória  (EFA).  A  EFA  explora  os 
dados  e  fornece  ao  pesquisador  informação  sobre  quan¬ 
tos  fatores  são  necessários  para  melhor  representar  os 
dados.  Com  EFA,  todas  as  variáveis  medidas  são  rela¬ 
cionadas  com  cada  fator  por  uma  estimativa  de  carga 
fatorial.  Uma  estrutura  simples  resulta  quando  cada 
variável  medida  carrega  muito  sobre  apenas  um  fator  e 
tem  cargas  menores  sobre  outros  fatores  (isto  é,  cargas 
<  0,4). 


No  Capítulo  3,  EFA  foi  conduzida  sobre  13  variáveis  do 
banco  de  dados  da  HBAT.  Com  base  nos  auto-valores  e 
no  padrão  das  cargas,  uma  solução  de  quatro  fatores  foi 
considerada  a  mais  adequada.  Os  quatro  fatores  foram 
nomeados  com  base  nas  variáveis  que  carregam  bastante 
sobre  cada  fator.  Usando  este  processo,  os  fatores  foram 
chamados  de  (1)  serviço  ao  cliente,  (2)  marketing,  (3) 
suporte  técnico  e  (4)  valor  do  produto  (ver  Capítulo  3 
para  mais  detalhes). 


A  característica  notável  de  EFA  é  que  os  fatores  fo¬ 
ram  derivados  de  resultados  estatísticos  e  não  de  teoria, 
e  assim  eles  somente  podem  ser  nomeados  depois  que  a 
análise  fatorial  é  executada.  A  EFA  pode  ser  conduzida 
sem  que  se  saiba  quantos  fatores  realmente  existem  ou 
quais  variáveis  pertencem  a  quais  construtos.  Neste  con¬ 
texto,  CFA  e  EFA  não  são  a  mesma  técnica.  Observe  que 
neste  capítulo  os  termos /uíor  e  construto  são  usados  como 
sinônimos. 

A  análise  fatorial  confirmatória  (CFA)  é  semelhante 
à  EFA  em  alguns  aspectos,  mas  filosoficamente  é  muito 
diferente.  Com  a  CFA,  o  pesquisador  deve  especificar  o 
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número  de  fatores  que  existem  dentro  de  um  conjunto  de 
variáveis  e  sobre  qual  fator  cada  variável  irá  carregar  ele¬ 
vadamente  antes  que  resultados  possam  ser  computados. 
A  técnica  não  designa  variáveis  a  fatores.  Ao  invés  disso, 
o  pesquisador  deve  ser  capaz  de  fazer  essa  designação  an¬ 
tes  que  quaisquer  resultados  possam  ser  obtidos.  SEM  é 
então  aplicada  para  testar  o  grau  em  que  o  padrão  a  prio- 
ri  de  cargas  fatoriais  do  pesquisador  representa  os  dados 
reais.  Assim,  ao  invés  de  permitir  que  o  método  estatístico 
determine  o  número  de  fatores  e  cargas,  como  em  EFA, 
a  estatística  de  CEA  nos  diz  o  quão  bem  nossa  especifica¬ 
ção  dos  fatores  combina  com  a  realidade  (os  dados  ver¬ 
dadeiros).  Em  um  certo  sentido,  CEA  é  uma  ferramenta 
que  nos  permite  confirmar  ou  rejeitar  nossa  teoria  pré- 
concebida. 

CEA  é  usada  para  fornecer  um  teste  confirmatório  de 
nossa  teoria  de  mensuração.  Modelos  SEM  freqüente- 
mente  envolvem  uma  teoria  de  mensuração  e  uma  teoria 
estrutural.  Uma  teoria  de  mensuração  especifica  como 
variáveis  medidas  representam  lógica  e  sistematicamen¬ 
te  construtos  envolvidos  em  um  modelo  teórico.  Em 
outras  palavras,  a  teoria  de  mensuração  especifica  uma 
série  de  relações  que  sugerem  como  variáveis  medidas 
representam  um  construto  latente  que  não  é  diretamente 
medido. 

A  teoria  de  mensuração  demanda  que  um  construto 
seja  primeiramente  definido.  Portanto,  diferentemente  da 
EFA,  com  a  CEA  um  pesquisador  usa  teoria  de  mensu¬ 
ração  para  especificar  a  priori  o  número  de  fatores,  bem 
como  quais  variáveis  carregam  sobre  tais  fatores.  Esta 
especificação  é  freqüentemente  referida  como  a  maneira 
que  os  construtos  conceituais  em  um  modelo  de  mensura¬ 
ção  são  operacíonalizados.  CEA  não  pode  ser  conduzida 
sem  uma  teoria  de  mensuração.  Em  EFA,  não  é  necessá¬ 
ria  tal  teoria  e  nem  a  habilidade  de  se  definir  construtos 
antecipad  amente. 

Um  exemplo  simples  de  CFA  e  SEM 

Agora  vamos  ilustrar  uma  CFA  simples,  utilizando  dois 
construtos  do  exemplo  primeiramente  introduzido  no 
Capítulo  10.  Discutiremos  agora  como  a  teoria  de  men¬ 
suração  é  representada  em  um  diagrama  de  caminhos  e 
na  notação  mais  formal  com  letras  gregas  empregadas  em 
SEM. 


Considere  uma  situação  na  qual  um  pesquisador  está  in¬ 
teressado  em  estudar  lealdade  de  clientes.  Após  rever  a 
teoria  relevante,  o  pesquisador  conclui  que  lealdade  de 
clientela  é  formada  por  dois  fatores:  gastos  de  clientes  e 
envolvimento  de  clientes.  O  construto  gastos  de  Clientes 
pode  ser  definido  como  a  quantia  relativa  de  recursos 
que  um  cliente  gasta  com  uma  marca,  entre  diversas  al¬ 
ternativas  concorrentes.  Ele  pode  ser  representado  pelos 
seguintes  quatro  itens: 


•  De  cada  R$  100,00  que  você  gasta  com _ ,  quan¬ 

to  você  investe  na  marca  X? 

•  Quando  você  pensa  em _ ,  com  qual  freqüên- 

cia  você  pensa  na  marca  X? 

•  De  cada  dez  vezes  que  você  usa  um _ ,  com 

que  freqüência  você  usa  a  marca  X? 

•  Quanto  você  espera  gastar  na  marca  X  no  próximo  ano? 

O  construto  Compromisso  de  Cliente  pode  ser  defi¬ 
nido  como  o  grau  em  que  um  cliente  fica  emocionalmen¬ 
te  envolvido  e  disposto  a  se  sacrificar  por  uma  marca. 
Assim,  o  construto  Compromisso  de  Cliente  pode  ser 
representado  por  quatro  variáveis  medidas  avaliadas 
usando-se  uma  escala  de  Likert  de  sete  pontos  do  tipo 
concordo-discordo: 

•  Estou  disposto  a  fazer  um  esforço  para  obter  a  marca  X. 

•  Eu  me  sentiria  desconfortável  usando  uma  marca  que 
compete  com  a  X. 

•  Sinto  orgulho  de  dizer  aos  meus  amigos  que  compro  a 
marca  X. 

•  Eu  continuaria  a  comprar  a  marca  X  mesmo  que  ela 
custasse  mais  do  que  todas  as  suas  concorrentes. 


Um  diagrama  visual 

Teorias  de  mensuração  com  freqüência  são  representadas 
usando-se  diagramas  visuais. Os  diagramas  representam 
visualmente  os  modelos  teóricos  testados  usando  técni¬ 
cas  de  SEM  como  LISREL,  AMOS,  EOS  ou  CALIS.  Os 
caminhos  do  construto  latente  para  os  itens  medidos  são 
mostrados  com  as  setas.  Cada  caminho  representa  uma 
relação  ou  carga  que  deve  existir  com  base  na  teoria  de 
mensuração.  Usando  CFA,  apenas  as  cargas  que  teorica¬ 
mente  conectam  um  item  medido  ao  seu  correspondente 
fator  latente  são  calculadas.  Todas  as  demais  são  assumi¬ 
das  como  nulas,  uma  diferença  fundamental  entre  EFA  e 
CFA.  Lembre-se  que  técnicas  EFA  produzem  uma  carga 
para  cada  variável  sobre  cada  fator. 


A  teoria  de  mensuração  que  descreve  o  construto  Com¬ 
promisso  de  Cliente  pode  ser  representada  como  se  mos¬ 
tra  na  Figura  11-1.  Observe  que  a  teoria  de  mensuração 
representada  neste  diagrama  sugere  que  os  itens  que 
correspondem  aos  gastos  de  clientes  não  carregam  sobre 
o  fator  de  Compromisso  de  clientes  e  vice-versa. 


Em  notação  SEM  comum,  construtos  são  represen¬ 
tados  por  letras  gregas  e  variáveis  medidas  por  letras  ro¬ 
manas.  O  Apêndice  lOB  inclui  uma  breve  lista  e  um  guia 
de  pronúncia  para  caracteres  gregos  freqüentemente  em¬ 
pregados  como  abreviações  de  SEM.  Em  CFA,  as  desig¬ 
nações  mais  comuns  são  construtos  latentes  (^),  variáveis 
medidas  (x),  relações  entre  os  construtos  latentes  e  as  res¬ 
pectivas  variáveis  medidas  (isto  é,  cargas  fatoriais)  (XJ, 
e  erro  (8),  que  é  o  grau  em  que  fator  latente  não  explica 
a  variável  medida  (semelhante  ao  conceito  de  1  -  a  co- 
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munalidade  de  item  discutida  no  Capítulo  3).  Com  CFA, 
não  distinguimos,  e  nem  precisamos  distinguir,  constru- 
tos  exógenos  de  endógenos.  No  programa  SEM,  todos  os 
construtos  são  tratados  como  sendo  do  mesmo  tipo  (ou 
todos  exógenos  [mais  comuns],  ou  todos  endógenos). 


Na  Figura  11-1,  representa  o  construto  latente  Gastos 
de  Cliente,  corresponde  ao  construto  latente  Compro¬ 
misso  de  Cliente,  x^—x^  se  referem  às  variáveis  medidas, 
2  representam  as  relações  entre  os  construtos 
latentes  e  os  respectivos  itens  medidos  (ou  seja,  cargas 
fatoriais),  e  8j— 8^  é  o  erro. 


Programas  SEM,  incluindo  AMOS  e  LISREL,  se  refe¬ 
rem  a  essas  representações  visuais  como  diagramas  de  ca¬ 
minhos.  A  convenção  é  que  setas  apontam  de  uma  causa 
para  um  resultado.  Construtos  são  considerados  como  a 
causa  de  variáveis  medidas.  Setas  de  dois  sentidos  repre¬ 
sentam  covariância  não-causal  por  natureza. 

Expressão  com  equações 

Em  forma  matemática,  a  teoria  de  mensuração  pode  ser 
representada  por  uma  série  de  equações  da  forma: 

-^1  =K\A\  +^i 

Esta  equação  é  semelhante  a  uma  equação  de  regres¬ 
são  típica.  Lembre  do  Capítulo  4,  no  qual  apresentamos  a 
equação  de  regressão  como: 

Os  símbolos  a  seguir  substituem  aqueles  que  se  torna¬ 
ram  familiares  no  Capítulo  4.  O  símbolo  j  (como 
representa  a  relação  entre  o  fator  latente  (como  V^)  e  a 
variável  medida  que  ele  explica  (xj).  Como  ele  não  a  re¬ 
presenta  perfeitamente,  ôj  representa  o  erro  resultante  (ou 
seja,  gj).  Como  ocorre  em  análise  de  regressão,  as  técnicas 
SEM  fornecem  estimativas  de  parâmetros.  Um  parâmetro 
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FIGURA  11-1  Representação  visual  (diagrama  de  caminhos)  de 
uma  teoria  de  mensuração. 


é  uma  representação  numérica  de  alguma  característica  de 
uma  população.  Em  SEM,  essas  características  são  rela¬ 
ções.  Uma  estimativa  de  parâmetro  para  a  relação  entre 
um  construto  e  uma  variável  medida  (X)  é  de  particular 
interesse.  Em  CFA,  X  estima  uma  carga  fatorial.  Diferen¬ 
temente  de  regressão,  esta  equação  SEM  em  particular  é 
apenas  uma  de  várias  necessárias  para  estimar  um  modelo 
SEM  completo.  E  a  equação  fundamental  em  CFA. 

Resumo 

Em  CFA,  não  é  necessário  distinguir  construtos  exógenos 
de  endógenos  ou  variáveis  independentes  de  dependen¬ 
tes.  Nesse  sentido,  ela  é  uma  técnica  de  interdependência. 
Portanto,  a  equação  explica  as  variáveis  x  com  um  fator 
latente  (^j).  Poderíamos  expressar  cada  variável  medida 
com  um  y,  e  os  fatores  latentes,  com  um  t].  No  entanto, 
é  mais  comum  representar  um  modelo  de  mensuração 
usando  x  para  abreviar  as  variáveis  medidas,  e  ^  para  re¬ 
presentar  os  construtos. 

CFA  e  validade  de  construto 

Lembre  que,  no  Capítulo  3,  validade  foi  definida  como  o 
grau  em  que  a  pesquisa  é  precisa,  e  a  discussão  se  concen¬ 
trou  na  validação  de  escalas  múltiplas.  Freqüentemente, 
a  CFA  elimina  a  necessidade  de  escalas  múltiplas,  pois 
os  programas  SEM  computam  escores  fatoriais  para  cada 
respondente.  Este  processo  permite  que  relações  entre 
construtos  sejam  automaticamente  corrigidas  quanto  à 
quantia  de  variância  de  erro  que  existe  nas  medidas  de 
construto. 

Uma  das  maiores  vantagens  de  CF  A/SEM  é  sua  habi¬ 
lidade  para  avaliar  a  validade  de  construto  de  uma  teoria 
de  mensuração  proposta.  Validade  de  construto  é  o  grau 
em  que  um  conjunto  de  itens  medidos  realmente  reflete  o 
construto  latente  teórico  que  aqueles  itens  devem  medir. 
Assim,  ela  lida  com  a  precisão  de  mensuração.  Evidência 
de  validade  de  construto  oferece  segurança  de  que  me¬ 
didas  tiradas  de  uma  amostra  representam  o  verdadeiro 
escore  que  existe  na  população. 

Validade  de  construto  é  formada  por  quatro  compo¬ 
nentes  importantes.  Tais  componentes  foram  introdu¬ 
zidos  no  Capítulo  3  juntamente  com  escalas  múltiplas. 
Aqui,  expandimos  essas  idéias  e  as  discutimos  em  termos 
mais  adequados  para  CFA. 

Validade  convergente 

Os  itens  que  são  indicadores  de  um  construto  específico 
devem  convergir  ou  compartilhar  uma  elevada  proporção 
de  variância  em  comum,  conhecida  como  validade  con¬ 
vergente.  Há  diversas  maneiras  de  estimar  a  quantia  rela¬ 
tiva  de  validade  convergente  entre  medidas  de  itens. 

Cargas  fatoriais.  O  tamanho  da  carga  fatorial  é  uma 
consideração  importante.  No  caso  de  elevada  validade 
convergente,  cargas  altas  sobre  um  fator  indicariam  que 
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elas  convergem  para  algum  ponto  em  comum.  No  míni¬ 
mo,  todas  as  cargas  fatoriais  devem  ser  estatisticamente 
significantes  [1].  Como  uma  carga  significante  poderia 
ainda  ser  relativamente  fraca,  uma  boa  regra  prática  é  que 
estimativas  de  cargas  padronizadas  devem  ser  de  0,5  ou 
mais,  e  idealmente  de  0,7  para  cima. 

O  argumento  por  trás  dessa  regra  pode  ser  compreen¬ 
dido  no  contexto  da  comunalidade  de  um  item  (ver  Ca¬ 
pítulo  3).  O  quadrado  de  uma  carga  fatorial  padronizada 
representa  o  tanto  de  variação  em  um  item  que  é  expli¬ 
cado  por  um  fator  latente.  Assim,  uma  carga  de  0,71  ao 
quadrado  é  igual  a  0,5.  Resumidamente,  o  fator  está  ex¬ 
plicando  metade  da  variação  no  item,  com  a  outra  metade 
correspondendo  à  variância  de  erro.  Quando  cargas  ficam 
abaixo  de  0,7,  elas  ainda  podem  ser  consideradas  signi¬ 
ficantes,  mas  há  mais  variância  de  erro  do  que  variância 
explicada  na  variância  da  medida. 

Variância  extraída.  Com  CFA,  o  percentual  médio  de 
variância  extraída  (VE)  em  um  conjunto  de  itens  de  cons- 
trutos  é  um  indicador  resumido  de  convergência  [23].  Este 
valor  pode  ser  calculado  simplesmente  usando-se  cargas 
padronizadas: 

n 

VE  =  ^=^ 
n 

O  X  representa  a  carga  fatorial  padronizada  e  i  é  o 
número  de  itens.  Assim,  para  n  itens,  VE  é  calculada 
como  o  total  de  todas  as  cargas  fatoriais  padronizadas 
ao  quadrado  (correlações  múltiplas  quadradas)  dividido 
pelo  número  de  itens\  Em  outras  palavras,  é  a  carga  fa¬ 
torial  quadrática  média.  Usando  essa  mesma  lógica,  uma 
VE  de  0,5  ou  mais  é  uma  boa  regra  sugerindo  conver¬ 
gência  adequada.  Uma  VE  inferior  a  0,5  indica  que,  em 
média,  mais  erro  permanece  nos  itens  do  que  variância 
explicada  pela  estrutura  fatorial  latente  imposta  sobre  a 
medida.  Uma  medida  de  VE  deve  ser  computada  para 
cada  construto  latente  em  um  modelo  de  mensuração. 
Na  Figura  11-1,  uma  estimativa  de  VE  é  necessária  tanto 
para  o  construto  Gastos  de  Cliente  quanto  para  Compro¬ 
misso  de  Cliente. 

Na  maioria  dos  casos,  os  pesquisadores  devem  in¬ 
terpretar  estimativas  padronizadas  de  parâmetros.  Pro¬ 
gramas  SEM  geralmente  fornecem  essas  estimativas, 
apesar  de  esta  ser  usualmente  uma  opção  que  deva  ser 
solicitada. 

Confiabilidade.  Confiabilidade  também  é  um  indicador 
de  validade  convergente.  Há  um  considerável  debate  sobre 
qual  seria  a  melhor  alternativa  de  estimativa  de  confiabilida¬ 


'  Programas  SEM  oferecem  diferentes  tipos  de  padronização.  Quando 
usamos  o  termo  padronizado,  estamos  nos  referindo  a  estimativas 
completamente  padronizadas,  a  menos  que  digamos  o  contrário. 


de  [5].  O  coeficiente  alfa  ainda  é  uma  estimativa  freqüente- 
mente  aplicada,  apesar  de  ele  poder  subestimar  confiabilida¬ 
de.  Diferentes  coeficientes  de  confiabilidade  não  produzem 
resultados  dramaticamente  distintos,  mas  um  valor  de  con¬ 
fiabilidade  de  constrnto  (CR)  ligeiramente  diferente  é  usa¬ 
do  com  freqüência  em  parceria  com  modelos  SEM.  Ele  é 
facilmente  computado  a  partir  do  quadrado  da  soma  de  car¬ 
gas  fatoriais  (X,)  para  cada  construto  e  a  partir  da  soma  dos 
termos  de  variância  de  erro  para  um  construto  (§,): 


n 

SA, 

;=1 


2 

í  n  \ 

SA, 

-t 

Sd, 

/=! 

V  J 

/=1 

^  ) 

A  regra  para  qualquer  estimativa  de  confiabilidade  é 
que  0,7  ou  mais  sugere  um  bom  valor.  Confiabilidade  en¬ 
tre  0,6  e  0,7  pode  ser  aceitável  desde  que  outros  indicado¬ 
res  de  validade  de  construto  de  um  modelo  sejam  bons. 
Elevada  confiabilidade  de  construto  indica  a  existência 
de  consistência  interna,  o  que  significa  que  todas  as  me¬ 
didas  consistentemente  representam  o  mesmo  construto 
latente. 

Validade  discriminante 

Validade  discriminante  é  o  grau  em  que  um  construto  é 
verdadeiramente  diferentes  dos  demais.  Logo,  valida¬ 
de  discriminante  elevada  oferece  evidência  de  que  um 
construto  é  único  e  captura  alguns  fenômenos  que  outras 
medidas  não  conseguem.  A  CFA  fornece  duas  maneiras 
usuais  de  avaliar  validade  discriminante. 

•  Primeiro,  a  correlação  entre  dois  construtos  quaisquer 
pode  ser  especificada  (fixada)  como  sendo  1.  Essencial¬ 
mente,  isto  é  o  mesmo  que  especificar  que  os  itens  que 
compõem  dois  construtos  poderiam  perfeitamente  compor 
apenas  um.  Se  o  ajuste  do  modelo  de  dois  construtos  não 
for  significantemente  melhor  do  que  o  de  um  construto, 
então  a  validade  discriminante  é  insuficiente  [1,  6].  Na  prá¬ 
tica,  porém,  este  teste  nem  sempre  oferece  forte  evidência 
de  validade  discriminante,  pois  elevadas  correlações,  às 
vezes  na  faixa  de  0,9,  ainda  podem  produzir  diferenças  sig¬ 
nificantes  no  ajuste. 


Como  mostrado  na  Figura  11-1,  o  pesquisador  poderia 
examinar  um  modelo  que  exibisse  todos  os  itens  medi¬ 
dos  como  indicadores  de  apenas  um  construto  latente.  O 
pesquisador  poderia  testar  um  modelo  com  esta  especi¬ 
ficação  e  comparar  seu  ajuste  com  o  do  modelo  original, 
sugerindo  que  os  itens  correspondem  a  dois  construtos 
separados. 


•  Um  teste  melhor  é  comparar  os  percentuais  de  variância  ex¬ 
traída  para  dois  construtos  quaisquer  com  o  quadrado  da 
estimativa  de  correlação  entre  tais  construtos  [23].  As  es- 
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timativas  da  variância  extraída  devem  ser  maiores  do  que 
a  estimativa  quadrática  de  correlação.  O  argumento  aqui  é 
baseado  na  idéia  de  que  um  construto  latente  deve  expli¬ 
car  suas  medidas  de  itens  melhor  do  que  outro  construto. 
O  êxito  neste  teste  fornece  boa  evidência  de  validade  dis¬ 
criminante. 

Além  da  diferenciação  entre  construtos,  validade  dis¬ 
criminante  também  significa  que  itens  individuais  medi¬ 
dos  devem  representar  somente  um  construto  latente.  A 
presença  de  cargas  cruzadas  indica  um  problema  de  vali¬ 
dade  discriminante.  Se  elevadas  cargas  cruzadas  de  fato 
existem,  e  elas  não  são  representadas  pelo  modelo  de 
mensuração,  o  ajuste  CFA  não  deve  ser  bom. 

Validade  nomológica  e  validade  de  expressão 

Construtos  devem  também  ter  validade  de  expressão  e  va¬ 
lidade  nomológica.  Os  processos  para  testar  tais  proprie¬ 
dades  são  os  mesmos  em  CFA  ou  EFA,  portanto  o  leitor 
deve  consultar  o  Capítulo  3  para  um  esclarecimento  mais 
detalhado.  Validade  nomológica  é  testada  examinando- 
se  se  fazem  sentido  as  correlações  entre  os  construtos 
em  uma  teoria  de  mensuração.  A  matriz  de  correlações 
de  construtos  pode  ser  útil  nesta  avaliação.  Além  disso, 
acrescenta-se  o  fato  de  que  validade  de  expressão  deve 
ser  estabelecida  antes  de  qualquer  teste  teórico,  quando 
se  usa  CFA.  Sem  uma  compreensão  sobre  o  conteúdo  ou 
significado  de  cada  item,  fica  impossível  expressar  e  es¬ 
pecificar  corretamente  uma  teoria  de  mensuração.  Assim, 
sob  um  ponto  de  vista  realista,  validade  de  expressão  é  o 
mais  importante  teste  de  validade. 

Pesquisadores  freqüentemente  testam  uma  teoria  de 
mensuração  usando  construtos  medidos  por  múltiplas  es¬ 
calas  desenvolvidas  em  pesquisa  prévia.  Por  exemplo,  se 
a  HBAT  desejasse  medir  satisfação  de  cliente  com  seus 
serviços,  ela  poderia  fazer  isso  avaliando  e  selecionando 
uma  entre  diversas  escalas  de  satisfação  de  clientela  na 
literatura  de  marketing.  Existem  manuais  em  muitas  dis¬ 
ciplinas  de  ciências  sociais  que  catalogam  escalas  de  múl¬ 
tiplos  itens  [8,  47].  Analogamente,  se  a  HBAT  quisesse 


-  REGRAS  PRÁTICAS  11-1  - 

Validade  de  construto 

•  Estimativas  de  cargas  padronizadas  devem  ser  de  0,5  ou 
mais,  e,  idealmente,  maiores  ou  iguais  a  0,7 

•  VE  deve  ser  maior  ou  igual  a  0,5  para  sugerir  validade 
convergente  adequada 

•  Estimativas  de  VE  para  dois  fatores  também  devem 
ser  maiores  do  que  o  quadrado  da  correlação  entre 
os  dois  fatores,  para  fornecer  evidência  de  validade 
discriminante 

•  Confiabilidade  de  construto  deve  ser  de  0,7  ou  mais, 
para  indicar  convergência  adequada  ou  consistência 
interna 


examinar  a  relação  entre  dissonância  cognitiva  e  satisfa¬ 
ção  de  clientes,  poderia  ser  usada  uma  escala  de  dissonân¬ 
cia  cognitiva  anteriormente  aplicada. 

Sempre  que  escalas  previamente  utilizadas  estiverem 
no  mesmo  modelo,  mesmo  que  elas  tenham  sido  aplica¬ 
das  com  sucesso  com  adequada  confiabilidade  e  valida¬ 
de  em  outra  pesquisa,  o  pesquisador  deve  prestar  muita 
atenção  para  que  o  conteúdo  do  item  das  escalas  não  se 
sobreponha.  Em  outras  palavras,  quando  se  usam  escalas 
emprestadas,  o  pesquisador  ainda  deve  verificar  validade 
de  expressão.  E  muito  provável  que,  quando  duas  escalas 
emprestadas  são  usadas  juntas  em  um  único  modelo  de 
mensuração,  as  questões  de  validade  de  expressão  se  tor¬ 
nam  evidentes  -  coisa  que  não  era  percebida  quando  as 
escalas  eram  usadas  individualmente. 

Resumo 

A  análise  fatorial  confirmatória  é  um  tipo  especial  de  aná¬ 
lise  fatorial  e  é  a  primeira  parte  de  um  teste  completo  de 
um  modelo  estrutural.  Diferentemente  da  EFA,  o  pes¬ 
quisador  deve  ser  capaz  de  dizer  ao  programa  SEM  quais 
variáveis  pertencem  a  quais  fatores  antes  que  a  análise 
possa  ser  conduzida.  A  CFA  não  apenas  deve  fornecer 
ajuste  aceitável,  mas  também  deve  mostrar  evidência  de 
validade  de  construto.  Quando  um  modelo  CFA  se  ajusta 
e  demonstra  validade  de  construto,  a  teoria  de  mensura¬ 
ção  é  sustentada. 


ESTÁGIOS  SEM  PARA  TESTAR 
VALIDAÇÃO  DA  TEORIA 
DE  MEDIDA  COM  CEA 

Uma  teoria  de  medida  é  usada  para  especificar  como 
conjuntos  de  itens  medidos  representam  um  conjunto  de 
construtos.  As  relações  fundamentais  conectam  constru¬ 
tos  com  variáveis  (através  de  estimativas  de  cargas  ou  X) 
e  construtos  entre  si  (correlação  de  construtos  ou  «F).  A 
CFA  então  estima  essas  relações.  Um  processo  SEM  de 
seis  estágios  foi  apresentado  no  último  capítulo.  Os  está¬ 
gios  1-4  serão  discutidos  com  mais  detalhes  aqui  porque 
eles  envolvem  o  exame  da  teoria  de  mensuração.  Os  está¬ 
gios  5-6,  que  tratam  da  teoria  estrutural  que  liga  teorica¬ 
mente  os  construtos  entre  si,  serão  discutidos  no  próximo 
capítulo. 

Estágio  1:  Definição  de  construtos  individuais 

O  processo  começa  listando  os  construtos  que  compreen¬ 
derão  o  modelo  de  mensuração.  Se  o  pesquisador  tem  ex¬ 
periência  com  a  medição  de  um  desses  construtos,  então 
talvez  alguma  escala  anteriormente  usada  possa  ser  nova¬ 
mente  empregada.  A  literatura  contém  muitas  escalas  que 
mostram  como  um  conjunto  de  itens  pode  representar  um 
construto  [8,  47].  Quando  uma  escala  previamente  utili¬ 
zada  não  está  disponível,  o  pesquisador  pode  ter  que  de- 
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senvolver  uma  escala  como  descrito  no  Capítulo  10.  Uma 
breve  descrição  dos  passos  no  desenvolvimento  de  uma 
escala  de  múltiplos  itens  é  dada  aqui: 

1.  Definir  teoricamente  o  construto.  Para  fazer  isso,  o  pesqui¬ 
sador  deve  ser  capaz  de  escrever  uma  sentença  clara  e  con¬ 
cisa  que  defina  o  que  será  medido. 

2.  Desenvolver  uma  lista  de  potenciais  itens  de  escala  que 
correspondam  à  definição  no  passo  1.  Os  itens  devem  ser 
suficientes  em  quantia  para  capturar  completamente  o  do¬ 
mínio  do  construto.  Pesquisa  qualitativa  freqüentemente  é 
usada  para  desenvolver  itens  de  escala  para  representarem 
o  domínio  do  construto.  O  pesquisador  deve  também  de¬ 
terminar  qual  tipo  de  escala  será  usado  para  medir  os  itens. 
Será  em  um  formato  Likert,  diferencial  semântico,  alguma 
combinação,  ou  um  formato  alternativo? 

3.  Julgar  os  itens  quanto  a  conteúdo.  Este  processo  envolve 
solicitar  a  vários  juízes  (peritos)  para  avaliar  o  quão  bem  a 
definição  e  os  itens  correspondem  ao  construto.  Algumas 
maneiras  de  abordar  este  passo  incluem  as  seguintes: 

•  Uma  escala  de  avaliação  pode  ser  usada  para  solicitar 
aos  peritos  que  classifiquem  se  cada  item  de  escala  (a) 
não  corresponde  ao  construto,  (b)  corresponde  de  al¬ 
guma  forma  ao  construto,  ou  (c)  corresponde  muito 
bem  ao  construto.  Alternativamente,  se  diversos  cons- 
trutos  estão  sendo  julgados  ao  mesmo  tempo,  peritos 
podem  ser  solicitados  a  ordenar  um  conjunto  de  itens, 
relacionando-os  com  as  definições  apropriadas.  Em 
termos  gerais,  itens  que  obtêm  concordância  de  cada 
um  dos  três  ou  mais  peritos  correspondem  o  suficiente 
para  serem  mantidos.  Independentemente  do  número 
de  juízes  usados,  itens  que  recebem  menos  do  que  50% 
de  concordância  são  candidatos  para  exclusão  da  aná¬ 
lise. 

•  Peritos  também  podem  examinar  itens  quanto  à  redun¬ 
dância.  Se  dois  itens  são  tão  semelhantes  a  ponto  de  di¬ 
zerem  a  mesma  coisa,  um  item  deve  ser  eliminado.  Tal 
eliminação  ajudará  a  evitar  problemas  posteriores  com 
os  resultados  empíricos. 

4.  Conduzir  um  pré-teste  para  avaliar  os  itens.  O  pré-teste 
deve  ser  administrado  para  uma  amostra  que  deve  respon¬ 
der  analogamente  ãs  amostras  sobre  as  quais  a  escala  even¬ 
tualmente  será  aplicada. 

•  Depois  de  coletar  os  dados,  estatísticas  descritivas  de¬ 
vem  ser  analisadas  quanto  à  curtose  ou  à  assimetria  sig- 
nificantes.  Escalas  com  médias  próximas  de  seus  valores 
mínimo  ou  máximo  podem  estar  sofrendo  efeitos  de 
“piso”  ou  “teto”,  e  são  candidatas  para  modificação  ou 
eliminação. 

•  Escalas  múltiplas  podem  ser  criadas,  e  as  correlações  en¬ 
tre  itens  e  total  e  entre  item  e  item  podem  ser  analisadas. 
Itens  com  correlações  entre  itens  e  total  e  entre  itens  e 
itens  inferiores  a  0,5  e  0,3,  respectivamente,  são  candida¬ 
tos  à  eliminação. 

•  Análise  fatorial  exploratória  pode  ser  executada  para 
fornecer  uma  verificação  preliminar  sobre  o  número  de 
fatores  e  o  padrão  de  cargas.  Se  é  esperado  que  os  itens 
de  carga  indiquem  uma  só  dimensão,  evidências  supor¬ 
tando  uma  solução  de  um  fator  devem  ser  examinadas. 


por  exemplo,  por  meio  de  um  critério  de  raiz  latente 
(autovalor  >  1)  ou  uma  abordagem  semelhante.  Se  mais 
fatores  são  esperados,  então  a  análise  fatorial  deve  exibir 
alguma  evidência  de  que  este  número  de  fatores  pode  ser 
sustentado.  Cargas  fatoriais  individuais  também  devem 
ser  examinadas.  Itens  com  cargas  baixas  são  candidatos 
à  eliminação. 

5.  Modificações  de  escala  são  feitas  com  base  nesses  resulta¬ 
dos.  Antes  de  prosseguir,  o  pesquisador  deve  considerar  se 
existe  um  número  adequado  de  itens  para  cada  fator.  Uma 
regra  prática  é  que  um  construto  deve  ser  refletido  por  um 
mínimo  de  três  itens,  preferencialmente  quatro.  Recipro¬ 
camente,  nenhum  máximo  teórico  põe  limite  no  número 
de  itens  por  fator.  Contudo,  escalas  contendo  mais  de  uma 
dúzia  de  itens  tornam  a  análise  mais  complexa  e  freqüente¬ 
mente  conduzem  a  problemas  no  fornecimento  de  evidência 
de  unidimensionalidade. 

6.  Prosseguir  com  um  teste  confirmatório  da  teoria  de  mensu- 
ração  (ver  estágio  2  na  próxima  seção). 

O  processo  de  planejamento  de  medida  de  um  novo 
construto  envolve  vários  passos  por  meio  dos  quais  o  pes¬ 
quisador  traduz  a  definição  teórica  do  construto  em  um 
conjunto  de  variáveis  medidas  específicas.  Como  tal,  é  es¬ 
sencial  que  o  pesquisador  considere  não  apenas  as  exigên¬ 
cias  operacionais  (como  número  de  itens  e  dimensionali- 
dade),  mas  também  estabeleça  a  validade  de  construto  da 
escala  recentemente  delineada. 

Estágio  2:  Desenvolvimento  do 
modelo  de  medida  geral 

Neste  passo  o  pesquisador  deve  cuidadosamente  conside¬ 
rar  como  todos  os  construtos  individuais  se  reúnem  para 
formar  um  modelo  de  mensuração  geral.  Várias  questões 
importantes  devem  ser  destacadas  neste  ponto. 


-  REGRAS  PRÁTICAS  11-2  - 

Definição  de  construtos  individuais 

•  Todos  os  construtos  devem  exibir  validade  adequada, 
sejam  novas  escalas  ou  escalas  obtidas  de  pesquisa 
prévia;  mesmo  escalas  previamente  estabelecidas 
devem  ser  cuidadosamente  verificadas  quanto  a 
validade  de  conteúdo 

•  Peritos  devem  julgar  o  conteúdo  de  itens  quanto  a 
validade  nos  estágios  iniciais  de  desenvolvimento  de 
escala 

•  Quando  dois  itens  têm  conteúdo  virtualmente 
idêntico,  um  deles  deve  ser  eliminado 

•  Itens  sobre  os  quais  os  peritos  não  conseguem 
concordar  devem  ser  eliminados 

•  Um  pré-teste  deve  ser  usado  para  purificar  medidas 
antes  do  teste  confirmatório 
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Unidimensionalidade 

Unidimensionalidade  foi  primeiramente  apresentada  no 
Capítulo  3.  Medidas  unidimensionais  significam  que  um 
conjunto  de  variáveis  medidas  (indicadores)  tem  apenas 
um  construto  subjacente.  Unidimensionalidade  se  torna 
criticamente  importante  quando  mais  de  dois  construtos 
estão  envolvidos.  Em  tal  situação,  cada  variável  medida  se 
relaciona  com  apenas  um  único  construto.  Todas  as  cargas 
cruzadas  são  consideradas  como  sendo  0  quando  existem 
construtos  unidimensionais. 


A  Figura  11-1  presume  dois  construtos  unidimensionais, 
pois  nenhum  item  medido  é  determinado  por  mais  de 
um  construto  (tem  mais  do  que  uma  seta  de  um  constru¬ 
to  latente  para  ele).  Em  outras  palavras,  todas  as  cargas 
cruzadas  são  fixadas  em  0. 


Um  tipo  de  relação  entre  variáveis  que  impacta  uni¬ 
dimensionalidade  é  quando  pesquisadores  permitem  que 
uma  única  variável  medida  seja  causada  por  mais  de  um 
construto.  Esta  situação  é  representada  no  modelo  de  ca¬ 
minhos  por  setas  que  partem  de  um  construto  para  va¬ 
riáveis  indicadoras  associadas  com  construtos  separados. 
Lembre-se  que  o  pesquisador  está  procurando  por  um 
modelo  que  produza  um  bom  ajuste.  Quando  se  liberta 
outro  caminho  em  um  modelo  a  ser  estimado,  o  valor  do 
caminho  estimado  só  pode  tornar  o  modelo  mais  preciso. 
Ou  seja,  a  diferença  entre  as  matrizes  de  covariância  es¬ 
timada  e  observada  (X*.  —  S)  é  reduzida,  a  menos  que  as 
duas  variáveis  sejam  completamente  não-correlacionadas. 
Portanto,  a  estatística  x  será  quase  sempre  reduzida  pela 
liberação  de  caminhos  adicionais. 


A  Figura  11-2  é  semelhante  ao  modelo  original,  com  a 
exceção  de  que  diversas  relações  adicionais  são  assumi¬ 
das.  Em  contraste  com  o  modelo  original  de  mensura- 
ção,  este  não  é  considerado  unidimensional.  Relações 
adicionais  são  assumidas  entre  Xj,  uma  variável  medida, 
e  o  construto  latente  Compromisso  de  Cliente  (Çj),  e  en¬ 
tre  Xj  e  o  construto  latente  Gastos  de  Cliente  (^j).  Essas 
relações  são  representadas  por  ^  e  j,  respectiva¬ 
mente.  Logo,  a  variável  indicadora  Xj  de  gastos  de  clien¬ 
te  e  a  variável  indicadora  Xj  de  compromisso  de  cliente 
são  consideradas  com  cargas  sobre  ambos  os  construtos 
latentes. 


Como  regra,  mesmo  que  a  adição  desses  caminhos  leve 
a  um  ajuste  significativamente  melhor,  o  pesquisador  não 
deve  liberar  (teorizar)  cargas  cruzadas.  Por  quê?  Porque 
a  existência  de  cargas  cruzadas  significantes  é  evidência 
de  uma  falta  de  validade  de  construto.  Quando  uma  carga 
cruzada  significante  é  descoberta,  a  validade  menor  é  evi¬ 
denciada  em  melhor  ajuste.  Quando  cargas  cruzadas  são 
estimadas,  qualquer  melhora  potencial  de  ajuste  é  artifi¬ 


cial,  no  sentido  de  que  é  obtida  com  a  admissão  de  uma 
correspondente  falta  de  validade  de  construto. 

Qutra  forma  de  relações  entre  variáveis  é  a  cova¬ 
riância  entre  termos  de  erro  de  duas  variáveis  medidas. 
Dois  tipos  de  covariância  entre  termos  de  erro  incluem 
a  covariância  entre  termos  de  erro  de  itens  que  indicam 
o  mesmo  construto,  conhecida  como  covariância  inter¬ 
na  de  erro  de  constrnto.  Q  segundo  tipo  é  covariância 
entre  dois  termos  de  erro  de  itens  indicando  diferentes 
construtos,  conhecida  como  covariância  de  erro  entre 
constrntos. 


A  Figura  il-2  mostra  também  covariância  entre  alguns 
dos  termos  de  erro.  652  j  é  a  covariância  entre  as  variá¬ 
veis  medidas  Xj  e  Xj  (ou  seja,  covariância  interna  de  erro 
de  construto).  Podemos  também  perceber  covariância 
entre  dois  termos  de  erro  de  itens  que  indicam  constru¬ 
tos  distintos.  Aqui,  6574  é  um  exemplo  de  covariância  de 
erro  entre  construtos  envolvendo  as  variáveis  medidas 
X4  e  x-f. 


Liberar  esses  caminhos  pode  apenas  reduzir  o  x  ou 
deixá-lo  igual.  Quanto  maiores  ficam  essas  estimativas  de 
relação,  mais  os  resultados  sugerem  problemas  com  vali¬ 
dade  de  construto,  particularmente  no  caso  de  correlações 
entre  construtos.  Covariâncias  significantes  de  erro  entre 
construtos  sugerem  que  os  dois  itens  associados  com  esses 
termos  de  erro  são  mais  altamente  relacionados  entre  si 
do  que  o  modelo  de  mensuração  original  prevê.  Esta  é  ou¬ 
tra  maneira  de  sugerir  que  existe  uma  carga  cruzada  signi¬ 
ficante,  o  que  também  denuncia  uma  falta  de  validade  dis¬ 
criminante.  Assim,  novamente,  apesar  de  esses  caminhos 
poderem  ser  liberados  e  melhorarem  o  ajuste  do  modelo, 
fazer  isso  viola  as  suposições  de  boa  mensuração. 

Logo,  não  recomendamos  a  liberação  de  qualquer 
tipo  de  caminho  na  maioria  das  aplicações  de  CFA.  Em 
situações  relativamente  raras  e  específicas,  os  pesquisa- 
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FIGURA  11-2  Modelo  de  mensuração  com  cargas  cruzadas 
teorizadas  e  variância  de  erro  correlacionado. 

*  N.  de  R.T.:  A  notação  correta  seria  X„5,. 
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dores  podem  liberar  esses  caminhos  como  uma  maneira 
de  capturar  algum  aspecto  específico  de  mensuração  não 
representado  por  cargas  fatoriais  padrão.  Para  mais  infor¬ 
mações  sobre  este  tópico,  o  leitor  deve  consultar  outras 
fontes  [3]. 

Modelo  de  mensuração  congênere 

A  terminologia  de  SEM  freqüentemente  estabelece  que 
um  modelo  de  mensuração  é  restrito  pelas  hipóteses  do 
modelo.  As  restrições  se  referem  especificamente  ao 
conjunto  de  estimativas  paramétricas  fixadas.  Um  tipo 
de  restrição  comum  é  um  modelo  de  mensuração  supos¬ 
ta  consistir  em  diversos  construtos  unidimensionais  com 
todas  as  cargas  cruzadas  restritas  a  zero.  Além  disso, 
quando  um  modelo  de  mensuração  também  considera 
que  não  há  covariância  entre  ou  dentro  de  variâncias  in¬ 
ternas  de  erro  de  construtos,  significando  que  elas  são 
todas  fixadas  em  zero,  o  modelo  de  mensuração  é  dito 
congênere.  Modelos  de  mensuração  congêneres  são  con¬ 
siderados  suficientemente  restritos  para  representarem 
boas  propriedades  de  medição  [16].  Um  modelo  de  men¬ 
suração  congênere  que  atende  essas  exigências  é  consi¬ 
derado  com  validade  de  construto  e  é  consistente  com  a 
boa  prática  de  medição. 

Itens  por  construto 

Pesquisadores  têm  encarado  uma  espécie  de  dilema  na 
decisão  sobre  quantos  indicadores  são  necessários  por 
construto.  Por  um  lado,  pesquisadores  preferem  muitos 
indicadores  como  uma  tentativa  de  representar  comple¬ 
tamente  um  construto  e  maximizar  confiabilidade.  Por 
outro  lado,  parcimônia  encoraja  pesquisadores  a  usar  o 
menor  número  de  indicadores  para  adequadamente  re¬ 
presentar  um  construto. 

Mais  itens  (variáveis  medidas  ou  indicadores)  não  são 
necessariamente  melhores.  Ainda  que  mais  itens  produ¬ 
zam  estimativas  de  maior  confiabilidade  e  generalidade 
[5],  mais  itens  também  demandam  amostras  maiores  e 
podem  tornar  difícil  a  tarefa  de  produzir  fatores  verdadei¬ 
ramente  unidimensionais.  Por  exemplo,  mais  indicadores 
aumentam  a  possibilidade  de  que  fatores  artificiais  sejam 
produzidos.  Quando  pesquisadores  aumentam  o  núme¬ 
ro  de  itens  de  escala  (indicadores)  representando  um  só 
construto  (fator),  eles  podem  incluir  um  subconjunto  de 
itens  que  inadvertidamente  se  concentra  em  algum  aspec¬ 
to  específico  de  um  problema  e  cria  um  sub-fator.  Este 
problema  se  torna  particularmente  presente  quando  o 
conteúdo  dos  itens  não  foi  cuidadosamente  analisado  com 
antecedência. 


Por  exemplo,  pesquisadores  de  marketing  podem  que¬ 
rer  estudar  atitudes  de  clientela  perante  uma  loja  em 
especial.  Assim,  itens  como  “Sou  favorável  em  relação 
a  esta  loja”  mostrariam  elevada  validade  de  conteúdo. 


Em  um  esforço  de  aumentar  o  número  de  itens,  dois 
ou  três  que  se  concentrem  em  uma  linha  específica  de 
produtos  vendidos  nesta  loja  podem  ser  utilizados.  Tais 
itens  podem  empiricamente  induzir  um  subfator  distin¬ 
to  mas  relacionado. 


Na  prática,  você  pode  encontrar  CEA  conduzida  com 
apenas  um  item  representando  alguns  fatores.  Contudo,  a 
boa  prática  dita  um  mínimo  de  três  itens  por  fator,  sendo 
que  quatro  é  preferível. 

Itens  por  construto  e  identificação.  Uma  breve  intro¬ 
dução  ao  conceito  de  identificação  estatística  é  dada  aqui 
para  esclarecer  por  que  pelo  menos  três  ou  quatro  itens 
são  recomendados.  Discutimos  mais  detalhadamente  a 
questão  da  identificação  em  SEM  posteriormente.  O  pro¬ 
blema  da  identificação  é  se  existe  informação  suficiente 
para  identificar  uma  solução  para  um  conjunto  de  equa¬ 
ções  estruturais.  Informação  é  fornecida  pela  matriz  de 
covariância  da  amostra.  Um  parâmetro  pode  ser  estimado 
para  cada  variância  e  covariância  únicas  entre  p  itens  me¬ 
didos,  o  que  se  calcula  como  ll2\p{p+l)\.  Desse  modo,  um 
grau  de  liberdade  é  perdido  ou  usado  para  cada  parâme¬ 
tro  estimado  {k).  Como  discutido  na  próxima  seção,  isso 
indica  o  nível  de  identificação. 

Modelos  podem  ser  caracterizados  por  seu  grau  de 
identificação,  que  é  definido  pelos  graus  de  liberdade 
de  um  modelo  depois  que  todos  os  parâmetros  a  serem 
estimados  são  especificados.  Há  três  níveis  de  identifi¬ 
cação: 

Sub-identificado.  Um  modelo  snb-identificado 

(também  chamado  de  não-identificado)  é  aquele  que  tem 
mais  parâmetros  a  serem  estimados  do  que  variâncias  e 
covariâncias  de  itens  (ou  seja,  há  um  número  negativo  de 
graus  de  liberdade). 


Por  exemplo,  um  modelo  de  mensuração  com  apenas 
dois  itens  medidos  e  um  único  construto  está  sub-iden- 
tificado.  A  matriz  de  covariância  é  2  x  2  e  consiste  de 
uma  única  covariância  e  duas  variâncias  de  erro.  As¬ 
sim,  ela  inclui  três  valores  únicos.  Um  modelo  de  men¬ 
suração  deste  construto  requer,  no  entanto,  que  duas 
cargas  fatoriais  e  duas  variâncias  de  erro  sejam  esti¬ 
madas  (quatro  parâmetros).  Assim,  uma  solução  única 
não  pode  ser  determinada,  uma  vez  que  existem  mais 
parâmetros  a  serem  estimados  do  que  valores  únicos 
na  matriz  de  covariância. 


Exatamente-identificado.  Usando  a  mesma  lógi¬ 
ca,  um  modelo  de  três  itens  é  exatamente  identificado, 
o  que  significa  que  ele  inclui  apenas  o  número  suficiente 
de  graus  de  liberdade  para  estimar  todos  os  parâmetros 


CAPITULO  11  SEM:  Análise  Fatorial  Confirmatória  597 


livres.  Toda  a  informação  é  usada,  o  que  significa  que  a 
CFA  reproduzirá  a  matriz  de  covariância  de  amostra  uni¬ 
vocamente.  Por  esta  razão,  modelos  exatamente  identifi¬ 
cados  apresentam  ajuste  perfeito.  Para  ajudar  a  entender 
este  conceito,  você  pode  usar  a  equação  para  graus  de 
liberdade  dada  no  Capítulo  10  e  então  perceberá  que  o 
número  de  graus  de  liberdade  resultante  para  um  fator  de 
três  itens  também  seria  nulo: 

[3(3  +  l)/2]  -6  =  0 

Em  terminologia  de  SEM,  um  modelo  com  zero  graus 
de  liberdade  é  chamado  de  saturado.  A  estatística  resul¬ 
tante  de  qualidade  de  ajuste  de  x  também  é  0.  Modelos 
exatamente  identificados  não  testam  uma  teoria;  o  ajuste 
deles  é  determinado  pelas  circunstâncias.  Como  resulta¬ 
do,  eles  não  são  especialmente  interessantes. 

A  Figura  11-3  ilustra  modelos  sub  e  exatamente  iden¬ 
tificados.  Como  observado  na  figura,  o  número  de  variân- 
cias/covariâncias  únicas  é  excedido  pelo  número  de  parâ¬ 
metros  estimados  (modelo  sub-identificado)  ou  é  igual  a 
ele  (exatamente  identificado). 

Super-identificado.  Esses  modelos  têm  mais  ter¬ 
mos  únicos  de  covariância  e  variância  do  que  parâme¬ 
tros  a  serem  estimados.  Assim,  para  qualquer  modelo 
de  mensuração  dado  pode  ser  encontrada  uma  solução 
com  um  número  positivo  de  graus  de  liberdade  e  um 
correspondente  valor  de  qualidade  de  ajuste  2.  Um 
modelo  de  mensuração  unidimensional  de  quatro  itens 
produz  um  modelo  super-identificado  para  o  qual  um 
valor  de  ajuste  pode  ser  computado  [27].  O  aumento  do 
número  de  itens  medidos  apenas  reforça  este  resulta¬ 
do. 


A  Figura  11-4  ilustra  uma  situação  de  super-identifica- 
ção.  Ela  mostra  resultados  de  CFA  testando  um  fator  de 
sentimento  positivo  unidimensional  indicado  por  quatro 
itens  de  escala  auto-declarados  (Animado,  Estimulado, 
Alegre  e  Radiante).  Os  itens  medem  quanto  de  cada 
uma  das  quatro  emoções  (xj  -  X4)  foi  experimentado  por 
um  cliente.  A  amostra  inclui  mais  de  800  respondentes. 
Contando  o  número  de  itens  na  matriz  de  covariância, 
podemos  perceber  um  total  de  10  valores  únicos  da  ma¬ 
triz  de  covariância.  Podemos  também  contar  o  número 
de  parâmetros  de  medição  que  são  livres  para  serem  esti¬ 
mados.  Quatro  estimativas  de  cargas  (X.,^!  1,  n  n  ^^4 1) 
e  quatro  variâncias  de  erro  (Sgn,  05221  0533,  6544)  formam 
um  total  de  oito.  Logo,  o  modelo  resultante  tem  dois 
graus  de  liberdade  (10  -  8).  O  modelo  super-identificado 
produz  X  =  14,9,  com  2  graus  de  liberdade,  o  que  foi  de¬ 
terminado  usando-se  um  programa  de  SEM. 

Considere  o  que  aconteceria  se  somente  os  primeiros 
três  itens  fossem  usados  para  indicar  sentimento.  A  ma¬ 
triz  de  covariância  consistiria  de  apenas  seis  itens  para 
exatamente  seis  parâmetros  a  serem  estimados  (3  cargas 
e  3  variâncias  de  erro).  O  modelo  seria  exatamente  iden¬ 
tificado.  Finalmente,  se  somente  dois  itens  -  Animado 
e  Estimulado  -  fossem  usados,  quatro  estimativas  para¬ 
métricas  de  itens  (duas  cargas  e  duas  variâncias  de  erro) 
seriam  necessárias,  mas  a  matriz  de  covariância  conteria 
apenas  três  itens.  Portanto,  o  construto  seria  sub-iden- 
tificado. 


Deve  ser  observado  que  mesmo  que  um  construto  uni¬ 
dimensional  de  dois  itens  de  CFA  seja  sub-identificado 
por  si  só,  um  modelo  de  CFA  super-identificado  pode 
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Exatamente  identificado 


Quatro  parâmetros  para  estimar  Seis  parâmetros  para  estimar 


(mostrados  em  cinza) 


(mostrados  em  cinza) 
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X2 
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Três  termos  únicos 
(mostrados  em  negrito) 


Seis  termos  únicos 
(mostrados  em  negrito) 


FIGURA  11-3  Modelos  de  CFA  sub-identificado  e  exatamente  identificado. 
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Matriz  de  covariância  simétrica 


^2 

^3 

^4 

2,01 

X2 

1,43 

2,01 

X3 

1,31 

1,56 

2,24 

XA 

1,36 

1,54 

1,57 

2,00 

1 0  termos  de  variância/covariância  única 


Ajuste  do  modeio 

x^=  14,9 
df=2 


p=  0,001 


Oito  caminhos  para  estimar 

Itens  medidos  Estimativas  de  carga 

CFI  =  0,99 

Estimativas  de  variância  de  erro 

X,  =  Animado 

,  =  0,78 

081,1  =  0,39 

X2=  Estimulado 

^X2 1  ~  0,89 

®Ô2,2“  0,21 

X^=  Alegre 

^.*3,1  ”  0,83 

®Ô3,3“  0,31 

X^=  Radiante 

4x4,1  =  0,87 

084,4=0,24 

FIGURA  11-4  Modeio  de  um  fator  e  quatro  itens  é  super-identificado. 


resultar  quando  este  construto  é  integrado  ao  modelo  de 
mensuração  geral.  As  mesmas  regras  de  identificação  ain¬ 
da  se  aplicam  como  anteriormente  descrito.  Mas  os  graus 
de  liberdade  extras  de  alguns  dos  outros  construtos  po¬ 
dem  fornecer  os  graus  de  liberdade  necessários  para  iden¬ 
tificar  o  modelo  geral.  Isso  não  significa  que  os  problemas 
inerentes  com  medidas  de  um  ou  dois  itens  desapareçam 
completamente  quando  os  integramos  a  um  modelo  maior. 
Estritamente  falando,  unidimensionalidade  de  construtos 
com  menos  de  quatro  indicadores  de  itens  não  pode  ser 
determinada  separadamente  [1].  A  dimensionalidade  de 
qualquer  construto  com  apenas  um  ou  dois  itens  só  pode 
ser  estabelecida  relativamente  a  outros  construtos.  Cons¬ 
trutos  com  um  ou  dois  itens  também  aumentam  a  possibi¬ 
lidade  de  problemas  com  confusão  de  interpretação  [14]. 
Sob  o  enfoque  da  experiência  dos  autores,  medidas  de  um 
e  dois  itens  são  associadas  com  uma  maior  possibilida¬ 
de  de  problemas  de  estimação  encontrados  em  estágios 
posteriores  do  processo  SEM,  incluindo  problemas  com 
convergência  (a  identificação  de  uma  solução  matemática 
apropriada). 

Resumidamente,  quando  se  especifica  o  número  de  in¬ 
dicadores  por  construto,  o  que  se  segue  é  recomendado: 

•  Use  quatro  indicadores  sempre  que  possível. 

•  Ter  três  indicadores  por  construto  é  aceitável,  particular¬ 
mente  quando  outros  construtos  têm  mais  do  que  três. 

•  Construtos  com  menos  do  que  três  indicadores  deveriam  ser 
evitados. 

Modelos  fatoriais  reflexivos  \etsus  formativos 

A  questão  de  causalidade  afeta  a  teoria  de  mensuração. 
Pesquisadores  da  ciência  do  comportamento  geralmente 
estudam  fatores  latentes  que  são  considerados  causado¬ 
res  das  variáveis  medidas.  As  vezes,  porém,  a  causalidade 
pode  ser  revertida.  A  direção  contrastante  de  causalidade 
conduz  a  abordagens  contrastantes  de  mensuração  -  mo¬ 
delos  de  mensuração  reflexivos  versus  formativos. 


Fatores  indicadores  reflexivos.  Até  agora  nossa  discus¬ 
são  sobre  CEA  assumiu  uma  teoria  de  mensuração  refle¬ 
xiva.  Uma  teoria  reflexiva  de  mensuração  é  baseada  na 
idéia  de  que  construtos  latentes  são  a  causa  das  variáveis 
medidas  e  que  o  erro  resulta  de  uma  incapacidade  de 
explicar  por  completo  essas  medidas.  Logo,  as  setas  são 
esboçadas  de  construtos  latentes  para  variáveis  medidas. 
Assim,  medidas  reflexivas  são  consistentes  com  a  teoria 
clássica  de  teste  [42]. 


Em  nosso  exemplo  anterior,  acredita-se  que  o  construto 
Compromisso  de  Cliente  cause  indicadores  medidos  es¬ 
pecíficos,  como  a  disposição  de  obter  a  marca  X,  de  dizer 
aos  amigos  para  comprarem  a  marca  X,  e  de  continuar  a 
comprar  a  marca  X,  mesmo  que  ela  custe  mais. 


Em  contrapartida,  uma  teoria  formativa  de  mensura¬ 
ção  é  modelada  com  base  na  suposição  de  que  as  variáveis 
medidas  são  a  causa  do  construto.  O  erro  em  modelos  for¬ 
mativos  de  mensuração  é  uma  incapacidade  de  explicar 
por  completo  o  construto.  Uma  suposição  importante  é 
que  construtos  formativos  não  são  considerados  latentes. 
Ao  invés  disso,  eles  são  vistos  como  índices  nos  quais  cada 
indicador  é  uma  causa  do  construto. 


Um  exemplo  típico  seria  um  índice  de  classe  social  [21]. 
Classe  social  freqüentemente  é  vista  como  uma  compo¬ 
sição  do  nível  educacional  de  alguém  com  prestígio  ocu- 
pacional  e  renda  (ou,  às  vezes,  patrimônio).  Classe  social 
não  causa  esses  indicadores,  como  no  caso  reflexivo.  No 
lugar  disso,  qualquer  indicador  formativo  é  considerado 
como  uma  causa  do  índice. 


Diversas  diferenças  importantes  separam  os  cons¬ 
trutos  reflexivos  dos  formativos.  Muitas  dessas  diferen¬ 
ças  são  particularmente  importantes  em  um  referencial 
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SEM.  Por  exemplo,  quando  se  empregam  indicadores 
múltiplos  tradicionais  para  representar  construtos,  ge¬ 
ralmente  não  podemos  diferenciar  entre  constrntos  for¬ 
mativos  e  reflexivos,  pois  ambos  os  fatores  são  tratados 
da  mesma  maneira.  No  entanto,  a  SEM  nos  permite  di¬ 
ferenciar  modelos  indicadores  formativos  de  reflexivos 
mudando  a  direção  da  relação  entre  variáveis  medidas  e 
constrntos,  o  qne  muda  as  equações  que  representam  o 
modelo. 

Todos  os  elementos  de  validade  de  construto  são  im¬ 
portantes  com  indicadores  reflexivos.  Portanto,  para  qual¬ 
quer  construto  reflexivo,  a  suposição  é  que  todos  os  itens 
indicadores  são  causados  pelo  mesmo  construto  latente 
e  são  altamente  correlacionados  entre  si.  Teoricamente, 
então,  os  termos  individuais  são  permutáveis  e  qualquer 
item  pode  ser  deixado  de  lado  sem  mudar  o  construto, 
desde  que  duas  condições  sejam  atendidas:  (1)  o  constru¬ 
to  deve  ter  confiabilidade  suficiente;  e  (2)  pelo  menos  três 
itens  devem  ser  especificados  para  evitar  problemas  com 
identificação  [21].  Indicadores  reflexivos  podem  ser  vistos 
como  uma  amostra  de  todos  os  itens  possíveis  disponíveis 
dentro  do  domínio  conceituai  do  construto  [20].  Como 
conseqüência,  indicadores  reflexivos  de  um  dado  constru¬ 
to  devem  se  mover  juntos,  o  que  significa  que  mudanças 
em  um  são  associadas  com  mudanças  proporcionais  nos 
demais  indicadores. 

Modelos  indicadores  reflexivos  são  mais  comuns  nas 
ciências  sociais.  Construtos  típicos  de  ciências  sociais, 
como  atitudes,  personalidade  e  intenções  comportamen- 
tais,  se  ajustam  bem  ao  modelo  de  mensuração  reflexivo 
[12].  Analogamente,  um  estudo  de  sintomas  médicos  ti¬ 
picamente  seria  reflexivo.  Por  exemplo,  sintomas  como 
pouco  fôlego,  baixa  resistência  física,  dificuldade  respi¬ 
ratória  e  funcionamento  reduzido  dos  pulmões  seriam 
considerados  indicadores  que  refletiriam  o  fator  latente 
de  enfisema.  Os  sintomas  não  são  a  causa  da  doença.  Ao 
invés  disso,  a  doença  provoca  os  sintomas. 

Fatores  indicadores  formativos.  Em  um  modelo  de 
mensuração  formativo,  os  indicadores  são  a  causa  do  fa¬ 
tor  (construto)  [11].  Por  exemplo,  em  negócios,  investi¬ 
dores  freqüentemente  demonstram  interesse  em  um  fator 
(índice)  de  falência.  Em  outras  palavras,  quão  perto  uma 
pessoa  ou  empresa  está  da  falência?  Diversas  medidas 
financeiras  podem  ser  consideradas,  incluindo  o  total  de 
vendas,  patrimônio,  dívidas,  gastos,  ganhos  líquidos  e  ju¬ 
ros,  entre  outras.  Esses  fatores  podem  ser  considerados 
como  a  causa  da  falência  e,  assim,  eles  seriam  apropria¬ 
dos  como  indicadores  formativos.  Usando  o  exemplo  so¬ 
bre  saúde  já  mencionado,  um  fator  formativo  enfisema 
poderia  especificar  indicadores  como  fumo,  exposição 
a  toxinas,  bronquite  crônica  e  outros.  Esses  indicadores 
formariam,  ao  invés  de  refletirem,  a  probabilidade  de  um 
indivíduo  ter  enfisema. 


A  Figura  11-5  ilustra  um  modelo  indicador  formativo. 
Cada  indicador  (x)  é  um  item  de  índice  que  causa  o  cons¬ 
truto  composto  (tij).  Cada  ip  representa  uma  correlação 
entre  esses  itens  de  índice,  e  é  um  parâmetro  indican¬ 
do  a  variância  de  erro  no  índice.  Observe  que  o  erro  está 
agora  no  fator  e  não  nos  itens  medidos.  Analogamente, 
como  a  causalidade  é  dos  itens  para  o  fator  (construto), 
e  não  o  contrário,  o  fator  não  explica  as  correlações  en¬ 
tre  itens.  Essas  diferenças  levam  a  algumas  mudanças  no 
teste  e  uso  de  escala. 


Modelos  de  mensuração  formativos  demandam  um 
processo  diferente  de  validação.  Como  indicadores  for¬ 
mativos  não  têm  que  ser  altamente  correlacionados,  con¬ 
sistência  interna  não  é  um  critério  útil  de  validação  para 
eles.  De  fato,  itens  formativos  podem  até  mesmo  ser  mu¬ 
tuamente  excludentes  [28].  Como  o  erro  está  no  fator, 
os  critérios  de  validação  mais  importantes  se  referem  à 
validade  preditiva.  Assim,  os  itens  formativos  individuais 
reunidos  deveriam  explicar  a  maior  parte  da  variância  no 
fator  composto  (construto),  e  o  fator  deveria  se  relacio¬ 
nar  com  as  outras  medidas  de  uma  maneira  teoricamente 
consistente.  Além  disso,  cada  um  dos  itens  formativos  in¬ 
dividuais  pode  estar  correlacionado  com  alguma  variável 
externa  com  a  qual  o  fator  deveria  estar  fortemente  rela¬ 
cionado.  No  caso  de  classe  social,  todos  os  itens  de  índice 
deveriam  se  relacionar  com  o  valor  da  casa  de  alguém,  por 
exemplo.  Orientações  para  validar  fatores  formativos  não 
são  tão  facilmente  determinadas  quanto  para  modelos  re¬ 
flexivos  [21].  No  entanto,  itens  deveriam  se  correlacionar 
com  um  padrão  externo  de  uma  forma  razoavelmente  ele¬ 
vada  -  um  mínimo  de  0,5  ou  mais. 

Note  que  um  modelo  de  mensuração  formativo  é  não- 
identificado.  Logo,  um  só  modelo  de  mensuração  forma¬ 
tivo  não  pode  ser  testado  quanto  a  ajnste  nsando-se  SEM 
sem  algum  tipo  de  alteração.  As  alterações  requerem 
que  variáveis  medidas  adicionais  sejam  inclnídas.  Uma 
abordagem  comum  seria  a  inclusão  de  pelo  menos  duas 
variáveis  extras  que  sejam  resultados  do  fator  formati¬ 
vo.  Por  exemplo,  um  construto  latente  reflexivo  pode  ser 
adicionado  ao  modelo.  Deveria  ser  um  construto  que  seja 
teoricamente  relacionado  com  o  fator  formativo.  Desse 
modo,  o  fator  reflexivo  não  apenas  identifica  o  modelo. 
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FIGURA  11-5  Ilustração  de  um  modelo  Indicador  formativo. 


600  Análise  Multivariada  de  Dados 


mas  pode  ajudar  a  estabelecer  validade  nomológica.  Por 
conta  dessas  questões,  modelos  indicadores  formativos 
apresentam  maiores  dificuldades  com  identificação  esta¬ 
tística  [33]. 


A  Figura  11-6  ilustra  uma  abordagem  para  identificar 
um  modelo  com  um  fator  formativo.  O  construto  qj  re¬ 
presenta  um  fator  formativo,  exatamente  como  na  Fi¬ 
gura  11-5.  O  construto  tij  é  um  fator  reflexivo,  como  se 
mostra  na  Figura  11-4,  apesar  de  as  notações  serem  ligei¬ 
ramente  diferentes  por  motivos  que  ficam  claros  no  pró¬ 
ximo  capítulo.  O  mais  notável  é  que  y  é  usada  no  lugar 
de  X  para  indicar  os  itens  indicadores  medidos,  e  e  agora 
é  empregado  para  representar  variância  de  erro  no  item 
medido.  O  fator  formativo  poderia  representar  o  grau  de 
alguma  doença  que  um  indivíduo  contraiu,  com  base  nas 
causas  (xj  -Xj),  e  o  fator  reflexivo  poderia  corresponder 
à  evidenciada  da  doença  como  evidenciada  ou  refletida 
pelos  sintomas  -  y^).  Pj  i  representa  uma  relação  cau¬ 
sal  entre  os  dois  construtos. 


As  implicações  de  se  dispensar  itens  indicadores  são 
diferentes  em  modelos  reflexivos  e  formativos.  Itens  refle¬ 
xivos  são  considerados  representativos  do  mesmo  domí¬ 
nio  conceituai;  logo,  descartar  itens  não  muda  o  significa¬ 
do  do  construto  latente.  Itens  com  baixas  cargas  fatoriais 
podem  ser  dispensados  de  modelos  reflexivos  sem  sérias 
conseqüências,  desde  que  um  construto  retenha  um  nú¬ 
mero  suficiente  de  indicadores.  A  validade  de  uma  escala 
formativa  repousa  mais  sobre  a  suposição  de  que  todas 
as  variáveis  formam  o  índice  composto.  Conceitualmente, 
um  fator  formativo  deveria  ser  representado  pela  popu¬ 
lação  inteira  de  indicadores  que  o  formam  [28].  Portanto, 
itens  indicadores  não  deveriam  ser  dispensados  por  causa 
das  baixas  correlações  entre  itens  e  total. 

Além  disso,  elevada  colinearidade  entre  indicadores,  o 
que  não  é  uma  questão  com  indicadores  reflexivos,  pode 
apresentar  problemas  signiflcantes  em  um  modelo  forma¬ 
tivo,  pois  os  parâmetros  que  conectam  indicadores  forma¬ 
tivos  com  o  construto  podem  se  tornar  não-confiáveis  (ver 
discussão  sobre  multicolinearidade  no  Capítulo  4).  Se  tais 
parâmetros  não  são  confiáveis,  então  fica  impossível  va¬ 
lidar  o  item.  Assim,  o  pesquisador  pode  se  deparar  com 
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um  dilema.  Por  um  lado,  descartar  um  item  pode  tornar 
o  índice  incompleto,  mas  mantê-lo  pode  tornar  uma  esti¬ 
mativa  não-confiável.  Essas  questões  que  são  associadas 
com  modelos  indicadores  formativos  ainda  estão  por  ser 
resolvidas  de  maneira  completa  [21]. 

Diferença  entre  modelos  reflexivos  e  formativos 

Diferenças  significativas  podem  separar  modelos  de  men- 
suração  reflexivos  dos  formativos,  mas  distingui-los  nem 
sempre  é  fácil.  Modelos  reflexivos  são  geralmente  mais 
fáceis  de  se  trabalhar,  têm  sido  tradicionalmente  mais 
usados  em  ciências  sociais,  e  parecem  representar  melhor 
muitas  características  de  diferenças  individuais  e  medidas 
perceptuais.  No  entanto,  modelar  incorretamente  um  fa¬ 
tor  pode  provocar  má  interpretação  e  conduzir  a  conclu¬ 
sões  questionáveis.  A  decisão  final  sobre  o  tipo  de  modelo 
de  mensuração  deve  ser  sustentada  na  verdadeira  natu¬ 
reza  do  construto  sob  estudo.  A  lista  de  questões  a  seguir 
pode  ser  útil  para  resolver  tal  problema  [28]. 

1.  Qual  é  a  direção  de  causalidade  entre  os  indicadores  múlti¬ 
plos  e  o  fator  (construto)? 

•  Itens  reflexivos  são  causados  pelo  fator. 

•  Itens  formativos  causam  o  fator. 

2.  Qual  é  a  natureza  da  covariância  entre  os  itens  indicadores? 

•  Se  é  esperado  que  os  itens  tenham  covariância  entre  si, 
então  o  modelo  reflexivo  é  mais  adequado.  Se  um  indica¬ 
dor  não  deve  ser  muito  relacionado  com  os  demais,  você 
provavelmente  deve  eliminá-lo.  Assim,  um  ponto-chave 
é  que,  com  modelos  reflexivos,  todos  os  indicadores  ten¬ 
dem  a  se  mover  juntos,  o  que  significa  que  mudanças  em 
um  serão  associadas  com  mudanças  nos  outros.  Eleva¬ 
da  covariância  entre  itens  fornece  evidência  consistente 
com  indicadores  reflexivos. 

•  Indicadores  formativos  de  um  fator  não  devem  exibir  co¬ 
variância  elevada.  Assim,  um  índice  pode  ser  composto 
de  diversas  medidas  que  não  compartilham  uma  base  co¬ 
mum.  Como  resultado,  itens  indicadores  formativos  não 
devem  se  mover  juntos. 

3.  Há  elevada  duplicidade  no  conteúdo  dos  itens? 

•  Se  todos  os  itens  indicadores  compartilham  uma  base 
conceituai  em  comum,  o  que  significa  que  todos  indicam 
a  mesma  coisa,  então  é  melhor  considerar  o  modelo  de 
mensuração  como  reflexivo.  Quando  todos  os  itens  re- 


FIGURA  11-6  Fator  formativo  com  um  fator  latente  adicionado  que  identifica  o  modelo. 
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presentam  o  mesmo  conceito,  eliminar  um  deles  não 
muda  substancialmente  o  significado  de  um  construto. 

•  Itens  formativos  não  precisam  compartilhar  uma  base 
conceituai.  Logo,  parece  que  os  indicadores  causam  o 
construto  formativo,  mas  eles  nada  têm  em  comum  do 
ponto  de  vista  conceituai,  então  eles  ainda  são  aceitáveis 
como  indicadores  formativos. 

•  Com  modelos  indicadores  formativos,  descartar  um  item 
produz  uma  mudança  importante  no  construto. 

4.  Como  os  indicadores  se  relacionam  com  outras  variáveis? 

•  Todos  os  indicadores  de  um  só  construto  se  relacionam 
com  outras  variáveis  de  uma  maneira  semelhante  com 
um  modelo  de  mensuração  reflexivo. 

•  Os  indicadores  de  um  construto  formativo  não  precisam 
se  relacionar  com  outras  variáveis  de  uma  maneira  seme¬ 
lhante.  Para  modelos  de  mensuração  formativos,  o  pes¬ 
quisador  espera  que  um  indicador  produza  um  padrão 
diferente  de  relações  com  uma  variável  externa  do  que 
aconteceria  com  outro  indicador. 

Responder  essas  questões  pode  ajudar  a  resolver  o 
problema  de  distinguir  indicadores  reflexivos  e  formati- 
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Desenvolvimento  do  modelo 
de  mensnração  geral 

•  Em  aplicações  padrão  de  CFA  que  testam  uma  teoria 
de  mensuração,  termos  de  covariância  de  erro  (interna 
e  entre  itens)  devem  ser  fixados  em  zero  e  não  devem 
ser  estimados 

•  Em  aplicações  padrão  de  CFA  que  testam  uma  teoria 
de  mensuração,  todas  as  variáveis  medidas  devem  ser 
livres  para  carregarem  apenas  sobre  um  construto 

•  Construtos  latentes  devem  ser  indicados  por,  pelo 
menos,  três  variáveis  medidas,  sendo  preferível  que 
sejam  quatro  ou  mais;  em  outras  palavras,  fatores 
latentes  devem  ser  estatisticamente  identificados 

•  Fatores  formativos  não  são  latentes  e  não  são  validados 
como  os  fatores  reflexivos  convencionais  (consistência 
interna  e  confiabilidade  não  são  importantes) 

•  As  variáveis  que  constituem  um  fator  formativo  devem 
explicar  a  maior  porção  de  variação  no  construto 
formativo  em  si  e  devem  se  relacionar  fortemente  com 
outros  construtos  que  são  conceitualmente  relacionados 
entre  si  (correlação  mínima  de  0,5) 

•  Fatores  formativos  apresentam  maiores  dificuldades 
com  identificação  estatística 

•  Variáveis  ou  construtos  adicionais  devem  ser 
incluídos  juntamente  com  um  construto  formativo,  a 
fim  de  se  alcançar  um  modelo  super-identificado 

•  Um  fator  formativo  deve  ser  representado  por  toda 
a  população  de  itens  que  o  formam;  logo,  itens  não 
devem  ser  descartados  por  conta  de  uma  carga  baixa 

•  Com  modelos  reflexivos,  qualquer  item  que  não 
se  espera  estar  altamente  correlacionado  com  os 
demais  indicadores  de  um  fator  deve  ser  eliminado 


vos.  No  entanto,  deve  ser  tomado  cuidado,  pois  a  primeira 
questão  é  a  mais  importante.  Se  você  sabe  a  direção  cau¬ 
sal  dos  caminhos  de  mensuração,  mas  as  outras  condições 
são  inconsistentes  com  o  modelo  correspondente,  você 
pode  precisar  reavaliar  a  natureza  conceituai  do  construto 
ou  os  passos  necessários  para  formar  uma  medida  válida 
de  seu  construto. 

Estágio  3:  Planejamento  de  nm  estndo 
para  prodnzir  resnitados  empíricos 

O  terceiro  estágio  envolve  o  delineamento  de  um  estu¬ 
do  que  produzirá  resultados  confirmatórios.  Em  outras 
palavras,  a  teoria  de  mensuração  do  pesquisador  será 
testada.  Aqui,  todas  as  regras  e  procedimentos  padrões 
que  produzem  pesquisa  descritiva  válida  se  aplicam  [25]. 
Se  tudo  vai  bem  com  o  modelo  de  mensuração  (CFA), 
a  mesma  amostra  será  usada  para  testar  o  modelo  es¬ 
trutural  (SEM).  Devemos  observar  que  os  procedimen¬ 
tos  iniciais  de  análise  de  dados  descritos  no  Capítulo  2 
devem  ser  primeiramente  executados  para  identificar 
quaisquer  problemas  com  os  dados,  incluindo  questões 
como  erros  na  entrada  de  informações.  Após  conduzir 
essas  análises  preliminares,  o  pesquisador  deve  tomar 
algumas  decisões  cruciais  sobre  o  planejamento  do  mo¬ 
delo  de  CFA. 

Escalas  de  mensuração  em  CFA 

Modelos  de  CFA  geralmente  contêm  indicadores  reflexi¬ 
vos  medidos  com  uma  escala  ordinal  ou  melhor.  Escalas 
que  contêm  mais  de  quatro  categorias  de  resposta  podem 
ser  tratadas  como  intervalares,  ou  pelo  menos  como  se  as 
variáveis  fossem  contínuas.  Todos  os  itens  indicando  um 
fator  não  precisam  ser  do  mesmo  tipo  de  escala,  e  valores 
de  diferentes  escalas  também  não  precisam  ser  padroni¬ 
zados  (matematicamente  transformados  para  uma  am¬ 
plitude  comum  de  escala)  antes  da  SEM  ser  usada.  Não 
obstante,  às  vezes  a  combinação  de  escalas  com  diferen¬ 
tes  amplitudes  pode  exigir  um  tempo  de  processamento 
significativamente  maior.  Padronização  pode  tornar  mais 
fácil  a  interpretação  de  coeficientes  e  de  valores  de  res¬ 
posta,  de  modo  que  isso  é  feito  em  certas  ocasiões,  antes 
de  se  estimar  o  modelo.  Logo,  um  levantamento  típico 
pode  fornecer  dados  adequados  para  testar  um  modelo 
CFA  usando  SEM. 


Por  exemplo,  a  medida  Gastos  de  Clientes,  introduzi¬ 
da  no  começo  deste  capítulo,  consiste  de  quatro  itens, 
sendo  que  cada  um  tem  um  número  diferente  de  poten¬ 
ciais  valores  de  escala  (10  pontos,  100  pontos  etc.).  Se  o 
pesquisador  quiser,  todos  eles  podem  ser  transformados 
para  uma  escala  em  comum  (p.ex.,  de  100  pontos)  antes 
de  se  estimar  o  modelo,  para  facilitar  a  interpretação; 
mas  este  é  um  procedimento  desnecessário. 
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SEM  e  amostragem 

Questões  relativas  a  tamanho  amostrai  e  SEM  em  geral 
foram  tratadas  no  Capítulo  10.  Mas,  muitas  vezes,  CFA 
requer  o  emprego  de  múltiplas  amostras.  Testar  teoria  de 
mensuração  geralmente  demanda  múltiplos  estudos  e/ou 
amostras.  Uma  amostra  inicial  pode  ser  examinada  com 
EFA,  e  os  resultados  podem  ser  usados  para  purificação 
posterior.  Mesmo  depois  que  os  resultados  de  CFA  foram 
obtidos,  porém,  resultados  ao  longo  de  múltiplas  amostras 
e  contextos  podem  fornecer  evidência  de  estabilidade  e 
generalidade  do  modelo. 

Especificação  do  modelo 

CFA  é  usada  para  testar  o  modelo  de  mensuração.  Como 
anteriormente  observado,  uma  distinção  crítica  entre 
CFA  e  EFA  é  a  habilidade  de  o  pesquisador  executar  um 
teste  exato  da  teoria  de  mensuração  pela  especificação  da 
correspondência  entre  indicadores  e  construtos.  A  especi¬ 
ficação  usando  CFA  é  diferente  de  EFA.  EFA  não  testa 
uma  teoria  e,  portanto,  este  passo  não  é  exigido  para  va¬ 
lidar  uma  teoria  de  mensuração.  Como  será  ilustrado  nas 
discussões  a  seguir,  o  pesquisador  especifica  (libera  para 
estimação)  os  indicadores  associados  com  cada  construto, 
bem  como  as  correlações  entre  construtos. 

Uma  característica  ímpar  na  especificação  dos  indica¬ 
dores  para  cada  construto  é  o  processo  de  “estabelecer 
uma  escala”  de  um  fator  latente.  Por  ser  não-observado, 
um  fator  latente  não  tem  qualquer  escala  métrica,  o  que 
significa  que  não  tem  intervalo  de  valores.  Assim,  uma  es¬ 
cala  deve  ser  fornecida  conforme  uma  das  duas  maneiras 
dadas  a  seguir: 

1.  Uma  escala  pode  ser  estabelecida  fixando-se  uma  das  cargas 
fatoriais  e  atribuindo-lhe  um  valor  (1  é  um  bom  valor). 

2.  A  variância  do  construto  pode  ser  fixada  com  um  valor. 
Novamente,  1  é  uma  boa  opção.  Usar  o  valor  1,  por  exem¬ 
plo,  resulta  em  uma  matriz  de  correlação  das  relações  entre 
construtos. 

Com  CFA,  se  você  usar  o  programa  AMOS,  ele  fixará 
automaticamente  uma  das  estimativas  de  cargas  fatoriais 
como  sendo  1.  Se  você  usar  FISREF,  pode  especificar 
esta  carga  fatorial  com  comandos  do  programa.  Em  certos 
momentos,  um  pesquisador  pode  querer  impor  restrições 
adicionais  sobre  um  modelo  CFA.  Por  exemplo,  às  vezes 
é  útil  colocar  dois  ou  mais  parâmetros  como  sendo  iguais, 
ou  considerar  um  parâmetro  específico  com  um  valor  es¬ 
pecífico.  Informações  sobre  a  imposição  de  restrições  adi¬ 
cionais  podem  ser  encontradas  na  documentação  para  o 
programa  SEM  de  escolha. 

Questões  sobre  identificação 

Uma  vez  que  o  modelo  de  mensuração  seja  especificado, 
o  pesquisador  deve  rever  as  questões  relativas  à  falta  de 
um  modelo  identificado,  ou  seja,  deve  reconhecer  proble¬ 
mas  de  identificação  e  potenciais  ações  corretivas.  Ante¬ 
riormente  sugerimos  que  super-identificação  é  o  estado 


desejado  para  CFA  e  modelos  SEM  em  geral.  Ainda  que 
a  comparação  dos  graus  de  liberdade  com  o  número  de 
parâmetros  a  serem  estimados  pareça  simples,  na  prática, 
estabelecer  a  identificação  de  um  modelo  pode  ser  compli¬ 
cado  e  frustrante.  Esta  complexidade  se  deve,  em  parte,  ao 
fato  de  que  uma  vasta  gama  de  problemas  e  idiossincrasias 
de  dados  podem  se  manifestar  em  mensagens  de  erros,  su¬ 
gerindo  uma  falta  de  convergência  ou  de  identificação. 

Durante  o  processo  de  estimação,  o  motivo  mais  pro¬ 
vável  da  pane  no  programa  ou  da  produção  de  resultados 
sem  sentido  é  um  problema  com  identificação  estatística. 
No  entanto,  à  medida  que  modelos  SEM  se  tornam  mais 
complexos,  garantir  que  um  modelo  seja  identificado  pode 
ser  problemático  [13].  Uma  vez  que  o  problema  seja  diag¬ 
nosticado,  ações  corretivas  devem  ainda  ser  aplicadas. 

Prevenção  contra  problemas  de  identificação.  Diversas 
orientações  podem  ajudar  a  determinar  o  status  de  iden¬ 
tificação  de  um  modelo  SEM  [44]  e  ajudar  o  pesquisador 
a  evitar  problemas  com  identificação.  As  condições  de  or¬ 
dem  e  classificação  para  identificação  são  as  duas  regras 
mais  básicas  [11],  mas  elas  podem  ser  suplementadas  por 
regras  básicas  na  especificação  do  construto. 

•  As  condições  de  ordem  e  classificação  representam  condi¬ 
ções  necessárias  e  suficientes  para  identificação.  A  condição 
de  ordem  se  refere  à  exigência  discutida  anteriormente  de 
que  os  graus  de  liberdade  resultantes  para  um  modelo  sejam 
maiores  que  zero.  Ou  seja,  o  número  de  termos  únicos  de 
covariância  e  variância  menos  o  número  de  estimativas  de 
parâmetros  livres  deve  ser  positivo.  Esta  condição  pode  ser 
verificada  calculando-se  os  graus  de  liberdade  para  o  mode¬ 
lo  proposto. 

Em  contrapartida,  a  condição  de  classificação  pode  ser 
difícil  de  verificar,  e  uma  discussão  detalhada  demanda¬ 
ria  um  conhecimento  razoável  de  álgebra  linear.*  O  leitor 
pode  consultar  qualquer  livro  de  álgebra  linear  para  uma 
descrição  matemática  detalhada.  Apesar  de  ser  difícil  de 
apresentar  em  termos  simples,  a  condição  de  classificação 
requer  que  cada  parâmetro  estimado  seja  unívoca  e  alge- 
bricamente  definido.  Se  você  pensar  em  um  conjunto  de 
equações  que  possa  definir  qualquer  variável  dependente, 
a  condição  de  classificação  é  violada  se  duas  equações  são 
duplicatas  matemáticas.  A  condição  de  classificação  pode 
ser  muito  mais  difícil  de  estabelecer  do  que  a  condição  de 
ordem.  Uma  mensagem  de  um  programa  SEM  referente  à 
dependência  linear  pode  ser  associada  com  uma  violação  da 
condição  de  classificação. 

•  As  condições  de  classificação  e  de  ordem  podem  ser  neces¬ 
sárias  e  suficientes  para  identificação,  mas,  dada  a  dificulda¬ 
de  de  estabelecer  a  condição  de  classificação,  pesquisadores 
se  voltam  para  diretrizes  mais  gerais.  Tais  diretrizes  incluem 
a  regra  de  três  indicadores.  Ela  é  satisfeita  quando  todos  os 
fatores  em  um  modelo  congênere  têm  pelo  menos  três  indi¬ 
cadores  significantes.  Uma  regra  de  dois  indicadores  tam- 


*  N.  de  T.;  O  autor  está  se  referindo,  na  verdade,  a  sistemas  de  equa¬ 
ções  lineares,  assunto  que  normalmente  é  estudado  em  álgebra  li¬ 
near.  No  entanto,  o  leitor  não  precisa  se  aprofundar  significativa¬ 
mente  em  álgebra  linear  para  compreender  este  assunto. 
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bém  estabelece  que  um  modelo  fatorial  congênere  com  dois 
itens  significantes  por  fator  será  identificado  desde  que  cada 
fator  tenha  também  uma  relação  significante  com  algum  ou¬ 
tro.  Fatores  de  um  item  causam  a  maioria  dos  problemas 
com  identificação. 

Reconhecimento  de  problemas  de  identificação.  Ape¬ 
sar  de  questões  de  identificação  serem  a  fonte  de  muitos 
problemas  de  estimação  encontrados  em  SEM,  há  poucos 
indicadores  da  existência  e  origem  de  tais  questões.  Des¬ 
se  modo,  o  pesquisador  deve  considerar  uma  vasta  gama 
de  sintomas  que  devem  ajudar  a  reconhecer  o  problema 
de  identificação.  Deve  ser  observado  que  ocasionalmen¬ 
te  avisos  ou  mensagens  de  erro  sugerem  que  apenas  um 
parâmetro  não  é  identificado,  o  que  é  possivelmente  as¬ 
sociado  com  violação  da  condição  de  classificação.  A  des¬ 
peito  de  o  pesquisador  poder  tentar  resolver  o  problema 
eliminando  a  variável  transgressora,  muitas  vezes  isso  não 
contorna  a  causa  inerente  e  o  problema  acaba  persistindo. 
Infelizmente,  os  programas  SEM  fornecem  medidas  diag¬ 
nósticas  mínimas  para  problemas  de  identificação.  Assim, 
o  pesquisador  deve  geralmente  confiar  em  outras  manei¬ 
ras  para  reconhecer  problemas  de  identificação  a  partir 
dos  sintomas  descritos  na  lista  a  seguir. 

•  Erros  padrão  muito  grandes  para  um  ou  mais  coeficientes. 

•  Incapacidade  de  o  programa  inverter  a  matriz  de  informa¬ 
ção  (nenhuma  solução  pode  ser  encontrada). 

•  Estimativas  evidentemente  sem  sentido  ou  impossíveis, 
como  variâncias  negativas  de  erro  ou  estimativas  paramétri¬ 
cas  muito  grandes,  incluindo  cargas  fatoriais  e  correlações 
entre  os  construtos  de  11,01*  (valor  absoluto  de  1,0). 

•  Modelos  que  resultam  em  diferentes  estimativas  de  parâ¬ 
metros  com  base  no  uso  de  diferentes  valores  iniciais.  Em 
programas  SEM,  o  pesquisador  pode  especificar  um  valor 
inicial  para  qualquer  parâmetro  estimado  como  um  ponto 
inicial  para  o  processo  de  estimação.  No  entanto,  estimativas 
de  modelo  devem  ser  comparáveis,  dado  qualquer  conjunto 
de  valores  iniciais  razoáveis.  Quando  ocorrem  questões  so¬ 
bre  identificação  de  qualquer  parâmetro,  um  segundo  teste 
pode  ser  executado.  Você  primeiramente  estima  um  mode¬ 
lo  CEA  e  obtém  a  estimativa  paramétrica.  Em  seguida,  fixa 
o  coeficiente  em  seu  valor  estimado  e  processa  novamente 
o  modelo.  Se  o  ajuste  geral  do  modelo  variar  consideravel¬ 
mente,  problemas  de  identificação  são  apontados. 

Como  podemos  ver,  problemas  de  identificação  po¬ 
dem  ser  manifestados  em  resultados  SEM  de  muitas 
maneiras  diferentes.  O  pesquisador  jamais  deve  confiar 
apenas  no  programa  computacional  para  reconhecer  pro¬ 
blemas  de  identificação,  mas  deve  também  diligentemen¬ 
te  examinar  os  resultados  para  garantir  que  não  existe 
qualquer  problema. 

Origens  e  ações  corretivas  para  problemas  de  identificação. 

Como  vimos,  problemas  de  identificação  podem  ter  mui¬ 
tos  efeitos  distintos  sobre  resultados  SEM.  Mas  quais  são 


*  N.  de  R.  T.:  Na  realidade,  a  expressão  correta  seria  l±  1,01,  significan¬ 
do  que  correlações  muito  altas,  em  módulo,  seriam  um  dos  sintomas. 


as  causas  inerentes?  Às  vezes,  os  problemas  são  realmente 
causados  por  um  erro  na  especificação  feita  pelo  pesqui¬ 
sador.  Mas  problemas  de  identificação  surgem  de  muitas 
outras  fontes  também.  Na  discussão  que  se  segue,  não 
apenas  discutimos  os  tipos  comuns  de  fontes  para  proble¬ 
mas  de  identificação,  mas  também  oferecemos  sugestões 
para  lidar  com  os  problemas,  sempre  que  possível.  Alguns 
dos  comentários  se  referem  a  questões  sobre  a  maneira 
de  escrever  comandos  de  programa,  como  normalmente 
se  faz  em  LISREL  ou  EQS.  Algumas  das  questões  mais 
comuns  que  levam  a  problemas  com  identificação  incluem 
as  seguintes: 

1.  O  pesquisador  indicou  para  o  modelo  um  número  diferente 
de  variáveis  em  relação  ao  número  selecionado  para  com¬ 
por  a  matriz  de  covariância.  Por  exemplo,  o  pesquisador 
pode  escolher  as  variáveis  até  P®'"®  análise,  mas  er¬ 
roneamente  especificar  o  número  de  variáveis  y  como  11. 
Quando  a  saída  fornece  uma  mensagem  indicando  que  a 
matriz  de  covariância  não  é  identificada,  então  este  é  um 
ponto  importante  para  se  verificar. 

2.  Eventualmente,  por  engano,  pesquisadores  incluem  a  mes¬ 
ma  variável  duas  vezes,  o  que  pode  facilmente  acontecer 
com  qualquer  programa  SEM.  Por  exemplo,  um  comando 
Select  (Escolha)  é  usado  em  alguns  programas  SEM  para 
indicar  quais  variáveis  de  um  banco  de  dados  maior  serão 
incluídas  em  uma  análise  específica.  Um  comando  Select 
de  LISREL  pode  receber  equivocadamente  a  seguinte  en¬ 
trada: 

SE 

Y1  Y2  Y3  Y4  Y5  Y5  Y7  Y8  Y9  YIO  Yll  Y12  / 

Com  ^5  entrando  duas  vezes,  a  matriz  de  covariância 
resultante  será  não-positiva  definida  e  nenhuma  solução 
única  pode  ser  encontrada.  Se  tal  mensagem  for  recebida,  é 
importante  procurar  por  esta  forma  de  erro.  Este  problema 
não  é  exclusivo  de  LISREL.  Uma  variação  dele  com  a  inter¬ 
face  gráfica  de  AMQS  acontece  quando  uma  variável  (ou 
uma  duplicata)  é  erroneamente  designada  a  um  construto 
mais  de  uma  vez. 

3.  A  matriz  de  covariância  é  pequena  comparada  com  o  nú¬ 
mero  de  parâmetros  estimados.  Este  problema  é  prova¬ 
velmente  acompanhado  de  uma  violação  da  regra  de  três 
indicadores.  Amostras  pequenas  (menos  de  200)  aumen¬ 
tam  a  possibilidade  de  problemas  nesta  situação.  A  solu¬ 
ção  mais  simples  é  evitar  esta  situação,  incluindo  medidas 
o  suficiente  para  evitar  a  violação  dessas  regras.  Caso  não 
seja  possível,  o  pesquisador  pode  tentar  acrescentar  algu¬ 
mas  restrições  que  liberarão  graus  de  liberdade  [26].  Uma 
restrição  potencial  que  pode  ajudar  a  obter  uma  solução 
CEA  é  impor  suposições  de  equivalência-tau,  as  quais 
demandam  que  as  cargas  fatoriais  para  cada  fator  sejam 
iguais.  Equivalência-tau  pode  ser  feita  para  um  ou  mais 
fatores.  Uma  segunda  possibilidade  é  fixar  as  variâncias 
de  erro  em  um  valor  conhecido  ou  especificado.  Tercei¬ 
ro,  as  correlações  entre  construtos  podem  ser  fixadas  se 
algum  valor  teórico  pode  ser  designado.  Em  alguns  casos, 
porém,  dois  construtos  podem  ser  sabidos  como  indepen¬ 
dentes. 
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A  emergência  de  um  problema  de  identificação  deve 
ser  resolvida  antes  que  os  resultados  possam  ser  aceitos. 
Apesar  de  uma  cuidadosa  especificação  do  modelo  usan¬ 
do  as  orientações  discutidas  anteriormente  poder  ajudar  o 
pesquisador  a  evitar  muitos  desses  problemas,  ele  sempre 
deve  estar  alerta  para  analisar  os  resultados  com  o  obje¬ 
tivo  de  reconhecer  problemas  de  identificação  onde  quer 
que  eles  ocorram. 

Problemas  com  estimação 

Outro  tipo  de  problema  encontrado  em  modelos  SEM 
envolve  a  estimação  de  parâmetros  que  são  logicamente 
impossíveis.  Com  isto  queremos  dizer  que  os  valores  es¬ 
timados  carecem  de  sentido.  Ao  invés  de  não  fornecerem 
resultados,  a  maioria  dos  programas  SEM  completará  o 
processo  de  estimação  apesar  desses  problemas.  Passa 
então  a  ser  responsabilidade  do  pesquisador  a  identifica¬ 
ção  dos  resultados  ilógicos  e  a  correção  do  modelo  para 
obter  resultados  aceitáveis.  Discutimos  os  dois  tipos  mais 
comuns  de  problemas  de  estimação,  bem  como  potenciais 
causas  e  soluções. 

Casos  Heywood.  Uma  solução  fatorial  que  produz  uma 
estimativa  de  variância  de  erro  inferior  a  zero  (negativa) 
é  chamada  de  caso  Heywood.  Tal  resultado  é  logicamen¬ 
te  impossível  porque  implica  um  erro  menor  que  0%  em 
um  item  e,  por  inferência,  significa  que  mais  de  100%  da 
variância  em  um  item  é  explicada.  Casos  Heywood  são 
particularmente  problemáticos  em  modelos  CEA  com  pe¬ 
quenas  amostras  ou  quando  a  regra  de  três  indicadores 
não  é  seguida  [41].  Modelos  com  amostras  com  mais  de 
300  que  atendem  à  regra  de  três  indicadores  dificilmente 
produzem  casos  Heywood.  Programas  SEM  podem  gerar 
uma  solução  imprópria  quando  um  caso  Heywood  está 
presente.  Uma  solução  imprópria  é  aquela  para  a  qual  o 
programa  SEM  não  converge  completamente,  geralmen¬ 
te  acompanhada  por  um  aviso  ou  mensagem  de  erro  que 
indica  que  uma  estimativa  de  variância  de  erro  não  é  iden¬ 
tificada,  advertindo  que  a  solução  pode  não  ser  confiável. 

Diversas  opções  são  possíveis  quando  surgem  casos 
Heywood.  Uma  solução  é  fixar  a  estimativa  transgressora 
em  um  valor  muito  pequeno,  como  0,005  [22].  Apesar  de 
este  valor  poder  identificar  o  parâmetro,  ele  pode  levar  a 
um  ajuste  menor,  pois  o  valor  dificilmente  será  o  verda¬ 
deiro  valor  da  amostra.  Outra  solução  é  eliminar  a  variá¬ 
vel  transgressora.  Esta  alternativa  pode  não  ser  atraente, 
caso  a  eliminação  de  um  item  reduza  o  número  de  itens 
por  construto  para  algo  menor  que  três.  Outras  restrições 
também  podem  ser  adicionadas  aos  indicadores  fatoriais. 
Por  exemplo,  poderia  ser  acrescentada  a  suposição  de  que 
todas  as  cargas  fatoriais  são  iguais.  Esta  opção  pode  ser 
teoricamente  mais  interessante  do  que  fixar  as  cargas  ou 
variâncias  de  erro  em  um  valor  específico.  Também  pode 
diminuir  o  ajuste  na  medida  em  que  a  igualdade  não  vale. 
No  entanto,  esta  é  uma  abordagem  que  tem  demonstrado 
ser  útil  para  os  autores. 


Parâmetros  padronizados  ilógicos.  Outro  problema 
de  estimação  com  resultados  de  SEM  é  que  eles  podem 
produzir  estimativas  de  correlação  entre  construtos  que 
excedam  11,01  ou  mesmo  coeficientes  padronizados  de 
caminhos  que  sejam  maiores  que  11,01.  Novamente,  es¬ 
sas  estimativas  são  teoricamente  impossíveis  e  provavel¬ 
mente  indicam  algum  outro  problema  nos  dados.  Muitas 
vezes,  problemas  de  identificação  são  a  causa,  apesar  de 
outras  questões  sobre  dados  (como  indicadores  alta¬ 
mente  correlacionados  ou  violações  das  suposições  es¬ 
tatísticas  inerentes)  também  serem  causas  em  potencial. 
Muitas  vezes,  um  dos  métodos  já  discutidos  corrigirá 
problemas  de  identificação  que  se  relacionam  com  esta 
situação. 

Resumo 

Como  ocorre  com  outras  técnicas  multivariadas  discuti¬ 
das  neste  texto,  conseguir  uma  solução  é  apenas  o  pas¬ 
so  inicial  para  uma  solução  final.  Modelos  CEA  devem 
ser  examinados  quanto  a  quaisquer  sintomas  que  sejam 
indicadores  de  problemas  inerentes  de  identificação  ou 
de  qualidade  dos  dados.  Somente  quando  o  pesquisador 
está  convencido  que  o  processo  de  estimação  evitou  tais 
complicações  é  que  o  processo  pode  prosseguir  para  o 
próximo  estágio. 

Estágio  4:  Avaliação  da  validade 
do  modelo  de  medida 

Uma  vez  que  o  modelo  de  mensuração  seja  corretamen¬ 
te  especificado,  um  modelo  SEM  é  estimado  para  forne¬ 
cer  uma  medida  empírica  das  relações  entre  variáveis  e 
construtos  representados  pela  teoria  de  mensuração.  Os 
resultados  nos  permitem  comparar  a  teoria  com  a  reali- 


-  REGRAS  PRÁTICAS  11-4  - 

Planejamento  de  nm  estndo  para  fornecer 
resnltados  empíricos 

•  A  escala  de  um  construto  latente  pode  ser  determinada 
da  seguinte  maneira: 

•  Fixando  uma  carga  e  atribuindo  seu  valor  como  1,  ou 

•  Fixando  a  variância  do  construto  e  atribuindo  seu 
valor  como  1 

•  Modelos  de  mensuração  reflexivos  congêneres 
nos  quais  todos  os  construtos  têm  pelo  menos  três 
indicadores  de  item  devem  ser  estatisticamente 
identificados 

•  O  pesquisador  deve  verificar  erros  na  especificação 
do  modelo  de  mensuração  quando  problemas  de 
identificação  são  indicados 

•  Modelos  com  amostras  grandes  (mais  de  300)  que 
atendem  à  regra  de  três  indicadores  geralmente  não 
produzem  casos  Heywood 
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dade  representada  pelos  dados  da  amostra.  Em  outras 
palavras,  percebemos  o  quão  bem  a  teoria  se  ajusta  aos 
dados. 

Avaliação  de  ajuste 

Ajuste  foi  discutido  detalhadamente  no  Capítulo  10. 
Lembre-se  que  os  dados  da  amostra  são  representados 
por  uma  matriz  de  covariância  de  itens  medidos,  en¬ 
quanto  a  teoria  corresponde  ao  modelo  de  mensuração 
proposto.  Equações  são  implicadas  por  este  modelo, 
como  discutido  no  início  deste  capítulo  e  no  Capítulo 
10.  Essas  equações  nos  permitem  estimar  a  realidade 
computando  uma  matriz  de  covariância  estimada  com 
base  em  nossa  teoria.  O  ajuste  compara  as  duas  matrizes 
de  covariância. 

Orientações  para  qualidade  de  ajuste  dadas  no  Capítu¬ 
lo  10  se  aplicam.  Aqui  o  pesquisador  tenta  examinar  todos 
os  aspectos  de  validade  de  construto  por  meio  de  várias 
medidas  empíricas.  O  resultado  é  que  a  CEA  viabiliza  um 
teste  ou  confirmação  sobre  a  validade  do  modelo  teórico 
de  mensuração.  E  muito  diferente  da  EFA,  a  qual  explora 
dados  para  identificar  potenciais  construtos.  Muitos  pes¬ 
quisadores  conduzem  EFA  sobre  uma  ou  mais  amostras 
separadas  antes  de  atingirem  o  ponto  de  tentarem  confir¬ 
mar  um  modelo.  A  EFA  é  a  ferramenta  apropriada  para 
identificar  fatores  entre  múltiplas  variáveis.  Como  tal,  os 
resultado  de  EFA  podem  ser  úteis  no  desenvolvimento  de 
teoria  que  conduzirá  a  um  modelo  proposto  de  mensura¬ 
ção.  E  aqui  que  a  CEA  entra  em  jogo.  Ela  pode  confirmar 
a  mensuração  desenvolvida  usando-se  EFA. 

Diagnóstico  de  problemas 

Ainda  que  a  meta  principal  de  CEA  seja  responder  se  um 
dado  modelo  de  mensuração  é  válido,  o  processo  de  tes¬ 
te  usando  CEA  fornece  informação  diagnóstica  adicional 
que  pode  sugerir  modificações  para  se  tratar  de  proble¬ 
mas  não  resolvidos  ou  mesmo  melhorar  o  teste  da  teoria 
de  mensuração  do  modelo. 

Reespecificação  de  modelo,  por  qualquer  motivo, 
sempre  causa  impacto  na  teoria  subjacente  sobre  a  qual 
o  modelo  foi  formulado.  Se  as  modificações  forem  peque¬ 
nas,  então  a  integridade  teórica  de  um  modelo  de  mensu¬ 
ração  pode  não  ser  severamente  danificada  e  a  pesquisa 
pode  prosseguir  usando  o  modelo  e  os  dados  prescritos 
depois  de  fazer  as  mudanças  sugeridas.  Se  as  modificações 
forem  mais  significativas,  o  pesquisador  deve  estar  dispos¬ 
to  a  modificar  a  teoria  de  mensuração,  o  que  resultará  em 
um  novo  modelo  de  mensuração  e  a  princípio  exigirá  uma 
nova  amostra  de  dados.  Dada  a  forte  base  teórica  para 
CEA,  o  pesquisador  deve  evitar  mudanças  baseadas  so¬ 
mente  em  critérios  empíricos,  como  os  diagnósticos  forne¬ 
cidos  por  CEA.  Outras  preocupações  devem  ser  levadas 
em  conta  antes  de  se  fazer  qualquer  alteração,  incluindo  a 
integridade  teórica  dos  construtos  individuais,  do  modelo 
de  mensuração  geral,  e  das  suposições  e  orientações  que 
acompanham  a  boa  prática,  assuntos  já  discutidos. 


Quais  sinais  diagnósticos  são  conseguidos  quando  se 
usa  CEA?  Eles  incluem  índices  de  ajuste,  como  aqueles 
já  discutidos,  e  análises  de  resíduos,  bem  como  alguma  in¬ 
formação  diagnóstica  específica  fornecida  na  maioria  dos 
resultados  de  CEA.  Muitos  sinais  diagnósticos  são  forne¬ 
cidos,  e  nos  concentramos  aqui  naqueles  que  são  úteis  e 
fáceis  de  aplicar.  Algumas  áreas  que  podem  ser  usadas 
para  identificar  problemas  com  medidas  são: 

1.  Estimativas  de  caminhos 

2.  Resíduos  padronizados 

3.  índices  de  modificação 

4.  Busca  de  especificação 

Estimativas  de  caminhos.  Um  dos  jeitos  mais  fáceis 
para  identificar  um  problema  potencial  com  uma  teoria 
de  mensuração  é  a  comparação  das  cargas  estimadas  -  as 
estimativas  de  caminhos  conectando  construtos  com  variá¬ 
veis  indicadoras.  Anteriormente,  fornecemos  regras  prá¬ 
ticas  que  sugerem  que  cargas  devem  ser  de  pelo  menos 
0,5  e,  idealmente,  de  0,7  ou  mais.  Quando  testa  um  mo¬ 
delo  de  mensuração,  o  pesquisador  deve  esperar  encon¬ 
trar  cargas  relativamente  elevadas.  Afinal  de  contas,  uma 
vez  que  CEA  é  usada,  deve  existir  uma  boa  compreensão 
conceituai  dos  construtos  e  seus  itens.  Este  conhecimento, 
com  resultados  empíricos  preliminares  de  estudos  explo¬ 
ratórios,  deve  fornecer  essas  expectativas. 

Diretrizes  se  fazem  necessárias  para  ajudar  na  inter¬ 
pretação  das  estimativas  de  cargas  fornecidas  por  pro¬ 
gramas  SEM.  Primeiro,  as  regras  práticas  se  aplicam  a 
estimativas  completamente  padronizadas  de  cargas.  Tais 
estimativas  removem  efeitos  decorrentes  da  escala  das 
medidas,  como  as  diferenças  entre  correlações  e  covari- 
âncias.  Assim,  o  pesquisador  deve  se  certificar  de  que  elas 
estão  incluídas  no  resultado  final.  A  saída  padrão  geral¬ 
mente  mostra  as  estimativas  de  máxima  verossimilhança 
não-padronizadas,  as  quais  são  mais  difíceis  de  interpretar 
com  relação  a  essas  orientações. 

Testes  paramétricos  da  significância  de  cada  coefi¬ 
ciente  estimado  (livre)  também  são  dados.  Estimativas 
insignificantes  sugerem  que  um  item  deveria  ser  elimina¬ 
do.  Reciprocamente,  uma  carga  significante  por  si  só  não 
indica  que  um  item  está  desempenhando  adequadamente; 
uma  carga  pode  ser  significante  a  níveis  marcantes  de  sig¬ 
nificância  (ou  seja,  p  <  0,01),  mas  ainda  estar  considera¬ 
velmente  abaixo  de  10,51.  Cargas  baixas  sugerem  que  uma 
variável  é  candidata  para  eliminação  do  modelo. 

Cargas  também  devem  ser  examinadas  quanto  a  indi¬ 
cações  de  problemas  gerais.  Uma  estimativa  transgressora 
pode  se  desenvolver  de  diversas  maneiras.  Uma  estimati¬ 
va  transgressora  sugere  que  algum  problema  sério  pode 
residir  nos  dados.  Por  exemplo,  cargas  completamente 
padronizadas  acima  de  1,0  ou  abaixo  de  -1,0  estão  fora 
do  intervalo  possível  e  são  um  importante  indicador  de 
um  problema  com  os  dados.  Q  leitor  pode  consultar  a  dis¬ 
cussão  sobre  problemas  em  estimação  de  parâmetros  para 
examinar  o  que  esta  situação  pode  significar  para  o  mode- 
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lo  geral.  É  importante  mostrar  que  o  problema  pode  não 
estar  somente  na  variável  com  a  carga  fora  do  intervalo. 
Assim,  simplesmente  eliminar  este  item  pode  não  ser  a 
melhor  solução.  Analogamente,  o  pesquisador  deve  exa¬ 
minar  se  as  cargas  fazem  sentido.  Por  exemplo,  itens  com 
a  mesma  valência  (p.ex.,  textos  positivos  ou  negativos) 
devem  produzir  o  mesmo  sinal.  Se  uma  escala  de  atitu¬ 
de  consiste  de  respostas  a  quatro  itens  -  bom,  favorável, 
não-favorável,  ruim  -  então  dois  itens  devem  ter  cargas 
positivas  e  dois  devem  ter  cargas  negativas  (a  menos  que 
eles  tenham  sido  previamente  recodificados).  Se  os  sinais 
das  cargas  não  forem  opostos,  o  pesquisador  não  deve  ter 
confiança  nos  resultados. 

Uma  saída  típica  também  mostra  as  correlações  qua¬ 
dradas  múltiplas  para  cada  variável  medida.  Em  um  mo¬ 
delo  CFA,  este  valor  representa  o  grau  em  que  a  variân¬ 
cia  da  variável  medida  é  explicada  por  um  fator  latente. 
Sob  uma  perspectiva  de  medição,  isso  representa  o  quão 
bem  um  item  mede  um  construto.  Correlações  quadradas 
múltiplas  são,  às  vezes,  referidas  como  confiabilidade  de 
item.  Não  fornecemos  regras  específicas  para  interpretar 
esses  valores  aqui  porque  em  um  modelo  de  mensuração 
congênere  elas  são  uma  função  das  estimativas  de  carga. 
Lembre-se  que  um  modelo  congênere  é  aquele  no  qual 
nenhuma  variável  medida  carrega  sobre  mais  de  um  cons¬ 
truto.  As  regras  dadas  para  as  estimativas  de  cargas  fato¬ 
riais  tendem  a  produzir  o  mesmo  diagnóstico. 

Para  resumir,  as  estimativas  de  cargas  podem  sugerir 
que  se  descarte  um  item  particular  ou  que  alguma  estima¬ 
tiva  transgressora  indica  um  problema  geral  maior. 

Resíduos  padronizados.  A  saída  padrão  produzida  pela 
maioria  dos  programas  SEM  inclui  resíduos.  Resíduos  se 
referem  às  diferenças  individuais  entre  termos  de  cova- 
riância  observada  e  os  termos  de  covariância  ajustada. 
Anteriormente,  computamos  os  resíduos  individuais  para 
a  CFA  mostrada  na  Figura  11-4.  Quanto  melhor  o  ajuste, 
menores  os  resíduos.  Assim,  um  termo  residual  exclusivo 
é  associado  com  cada  item  exclusivo  da  matriz  de  cova¬ 
riância  observada  usada  como  entrada.  Resíduos  padro¬ 
nizados  também  são  dados  pela  maioria  dos  programas 
SEM.  Os  resíduos  padronizados  são  simplesmente  os 
resíduos  originais  divididos  pelo  erro  padrão  do  resíduo. 
Assim,  eles  não  são  dependentes  do  real  intervalo  da  es¬ 
cala  de  medição,  o  que  os  torna  úteis  no  diagnóstico  de 
problemas  com  um  modelo  de  mensuração. 

Resíduos  podem  ser  positivos  ou  negativos,  depen¬ 
dendo  se  a  covariância  estimada  está  abaixo  ou  acima  da 
correspondente  covariância  observada.  Pesquisadores 
podem  usar  esses  valores  para  identificar  pares  de  itens 
para  os  quais  o  modelo  especificado  de  mensuração  não 
recria  com  precisão  a  covariância  observada  entre  aqueles 
dois  itens.  Tipicamente,  resíduos  padronizados  menores 
que  12,51  não  sugerem  um  problema.  Reciprocamente,  re¬ 
síduos  maiores  que  14,01  sinalizam  um  alerta  vermelho  e 


sugerem  um  grau  de  erro  potencialmente  inaceitável.  A 
resposta  mais  provável,  mas  não  automática,  é  eliminar 
um  dos  itens  associados  com  um  resíduo  maior  que  14,01. 
Resíduos  padronizados  entre  12,51  e  14,01  merecem  certa 
atenção,  mas  podem  não  sugerir  quaisquer  mudanças  no 
modelo  se  nenhum  outro  problema  for  associado  com 
aqueles  dois  itens. 

índices  de  modificação.  Uma  típica  saída  SEM  também 
lista  índices  de  modificação.  Um  índice  de  modificação  é 
calculado  para  cada  relação  possível  que  não  é  livre  para 
ser  estimada.  Ele  mostra  quanto  que  o  valor  x  do  modelo 
geral  seria  reduzido  pela  liberação  daquele  caminho  em 
especial.  índices  de  modificação  de  aproximadamente  4  ou 
mais  sugerem  que  o  ajuste  poderia  ser  melhorado  signifi¬ 
cativamente  pela  liberação  do  caminho  correspondente. 

Promover  mudanças  de  modelo  com  base  somente  em 
índices  de  modificação  não  é  recomendado,  pois  quan¬ 
do  múltiplas  modificações  se  fazem  necessárias,  algumas 
combinações  de  mudanças  entre  itens  podem  levar  a  um 
modelo  melhor  do  que  mudanças  que  resultariam  com 
base  no  maior  índice  de  modificação.  Além  disso,  mudan¬ 
ças  jamais  devem  ser  feitas  baseadas  apenas  no  índice  de 
modificação.  Fazer  isso  seria  inconsistente  com  a  base  teó¬ 
rica  de  CFA  e  SEM  em  geral.  Pesquisadores  devem  con¬ 
sultar  outros  diagnósticos  de  resíduos  para  uma  mudança 
sugerida  por  um  índice  de  modificação  e  então  tomar  uma 
ação  adequada,  se  justificada  pela  teoria. 

Buscas  de  especificação.  Uma  busca  de  especificação 

é  uma  abordagem  empírica  de  tentativa  e  erro  que  usa 
diagnóstico  de  modelo  para  sugerir  mudanças  no  modelo. 
Na  realidade,  quando  realizamos  mudanças  com  base  em 
qualquer  indicador  diagnóstico,  estamos  executando  uma 
busca  de  especificação  [46].  Programas  SEM  como  AMOS 
e  LISREL  podem  executar  automaticamente  buscas  de 
especificação.  Essas  buscas  podem  encontrar  o  conjunto 
de  relações  que  melhor  ajusta  uma  matriz  de  covariância 
com  base  em  um  processo  de  ajuste  iterativo.  Este  proces¬ 
so  é  conduzido  por  mudanças  seqüenciais  que  se  apóiam 
na  liberação  de  elementos  fixados  com  o  maior  índice  de 
modificação.  Buscas  de  especificação  são  razoavelmente 
fáceis  de  implementar. 

Apesar  de  poder  ser  tentador  confiar  amplamente  em 
buscas  de  especificação  como  uma  maneira  de  encontrar 
um  modelo  com  um  bom  ajuste,  esta  abordagem  não  é  re¬ 
comendada  [32,  34].  Numerosos  problemas  podem  surgir 
se  resultados  puramente  empíricos  são  empregados  para 
obter  melhor  ajuste.  O  maior  problema  é  sua  inconsis¬ 
tência  com  o  propósito  pretendido  e  com  o  uso  de  pro¬ 
cedimentos  como  CFA.  Em  primeiro  lugar,  CFA  testa  a 
teoria  e  é  menos  aplicável  como  ferramenta  exploratória. 
Segundo,  os  resultados  para  um  parâmetro  dependem  dos 
resultados  da  estimativa  de  outros  parâmetros,  o  que  tor¬ 
na  difícil  se  certificar  de  que  o  verdadeiro  problema  com 
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um  modelo  é  isolado  nas  variáveis  sugeridas  por  um  ín¬ 
dice  de  modificação.  Em  terceiro  lugar,  a  busca  empírica 
que  usa  dados  simulados  tem  mostrado  que  buscas  me¬ 
cânicas  de  especificação  não  são  confiáveis  na  identifica¬ 
ção  de  um  verdadeiro  modelo  e,  assim,  podem  conduzir 
a  resultados  enganosos.  Portanto,  buscas  de  especificação 
de  CFA  envolvem  a  identificação  apenas  de  um  pequeno 
número  de  problemas  importantes.  Um  pesquisador  no 
modo  exploratório  pode  usar  buscas  de  especificação  em 
maior  escala  na  ajuda  da  identificação  de  uma  teoria  de 
mensuração  plausível.  Novas  estruturas  de  construtos  que 
são  sugeridas  com  base  em  buscas  de  especificação  devem 
ser  confirmadas  usando-se  um  novo  conjunto  de  dados. 

Advertências  na  reespecificação  do  modelo.  Que  ti¬ 
pos  de  modificação  são  mais  relevantes?  A  resposta  a 
esta  questão  não  é  simples  ou  clara.  Se  diagnósticos  de 
um  modelo  indicam  a  existência  de  algum  fator  novo  não 
sugerido  pela  teoria  original  de  mensuração,  verificar  tal 
mudança  requer  um  novo  conjunto  de  dados.  Quando 
mais  de  duas  de  cada  15  variáveis  medidas  são  eliminadas 
ou  modificadas  em  relação  ao  fator  que  elas  indicam,  um 
novo  conjunto  de  dados  deve  ser  utilizado  para  mais  in¬ 
vestigações.  Em  contrapartida,  eliminar  um  ou  dois  itens 
de  uma  grande  bateria  de  itens  é  menos  conseqüente  e  o 
teste  confirmatório  pode  não  ser  ameaçado. 

Como  CFA  testa  uma  teoria  de  mensuração,  mudan¬ 
ças  no  modelo  devem  ser  feitas  somente  após  cuidadosa 
consideração.  A  modificação  mais  comum  seria  a  elimi¬ 
nação  de  um  item  que  não  desempenhe  bem  em  relação 
à  integridade  do  modelo,  ao  ajuste  dele  ou  à  validade  de 
construto.  As  vezes,  porém,  um  item  pode  ser  mantido 
mesmo  que  a  informação  diagnóstica  sugira  que  ele  é  pro¬ 
blemático.  Por  exemplo,  considere  um  item  com  elevada 
validade  de  conteúdo  (como  “Eu  estava  muito  satisfeito” 
em  uma  escala  de  satisfação)  dentro  de  um  modelo  geral 
CFA  com  bom  ajuste  geral  e  forte  evidência  de  validade 
de  construto.  Eliminá-lo  não  parece  ser  um  bom  negócio. 
Pode-se  ganhar  um  pouco  de  ajuste  com  sacrifício  de  cer¬ 
ta  consistência  conceituai.  Além  disso,  um  item  de  desem¬ 
penho  ruim  pode  ser  mantido,  às  vezes,  para  satisfazer 
exigências  de  identificação  estatística  ou  para  atender  à 
consideração  do  número  mínimo  de  itens  por  fator.  No  fi¬ 
nal,  porém,  a  teoria  sempre  deveria  ser  proeminentemen¬ 
te  levada  em  conta  ao  se  fazer  modificações  no  modelo. 


Ilustração  resumo.  Usamos  agora  uma  ilustração  sim¬ 
ples  não  apenas  para  avaliar  ajuste  geral  de  um  modelo 
de  CFA,  mas  também  para  mostrar  o  uso  de  diversas 
medidas  diagnósticas,  incluindo  resíduos,  resíduos  pa¬ 
dronizados  e  índices  de  modificação.  A  Figura  11-7  exi¬ 
be  saídas  selecionadas  do  teste  de  um  modelo  CFA  que 
estende  aquele  mostrado  na  Figura  11-4.  Um  novo  cons¬ 
truto,  chamado  de  VALOR  (FIV),  foi  acrescentado.  Ele 


representa  o  quanto  de  valor  de  prazer  o  consumidor 
recebeu  de  sua  experiência  no  setor  de  compra.  O  ajus¬ 
te  do  modelo,  como  indicado  pelo  CFI  e  pela  RMSEA, 
parece  bom.  O  x  do  modelo  é  significante,  o  que  é  de  se 
esperar,  dado  o  grande  tamanho  da  amostra  {N  =  800). 

Diversas  observações  complementares  são  possíveis 
baseadas  na  avaliação  de  medidas  diagnósticas.  Come¬ 
çamos  olhando  as  cargas  completamente  padronizadas. 
Três  das  estimativas  para  FIV  ficam  abaixo  do  corte  de 
0,7,  apesar  de  apenas  uma  ficar  abaixo  do  corte  menos 
conservador  de  0,5  (FIV5).  Assim,  FIV5  se  torna  um 
principal  candidato  à  eliminação.  FIV4  é  suspeita,  mas  a 
menos  que  alguma  outra  evidência  sugira  que  ela  é  pro¬ 
blemática,  provavelmente  ela  será  mantida.  Para  todos 
os  fins  práticos,  a  carga  de  HV3  é  adequada,  dado  que 
ela  é  de  apenas  0,01  a  menos  de  0,70. 

A  seguir,  examinamos  os  resíduos  padronizados.  Neste 
caso,  todos  os  resíduos  padronizados  maiores  do  que  12,51 
são  mostrados.  Dois  resíduos  se  aproximam,  mas  não  exce¬ 
dem,  4,0.  O  maior,  entre  RADIANTE  e  ALEGRE  (3,90), 
sugere  que  a  estimativa  de  covariância  entre  os  itens  “ra¬ 
diante”  e  “alegre”  poderia  ser  mais  precisa.  Neste  caso, 
nenhuma  mudança  será  feita  com  base  neste  resíduo,  pois 
o  ajuste  se  mantém  bom  a  despeito  do  elevado  resíduo. 
Eliminar  radiante  ou  alegre  deixaria  menos  do  que  qua¬ 
tro  itens  neste  construto.  Além  disso,  liberar  o  parâmetro 
correspondente  à  covariância  de  erro  entre  esses  dois  seria 
inconsistente  com  as  propriedades  congêneres  do  modelo 
de  mensuração.  Desse  modo,  parece  que  por  enquanto  po¬ 
demos  viver  com  este  resíduo  de  alguma  forma  elevado. 

O  segundo  resíduo  alto  está  entre  HVl  e  FIV5  (-3,76). 
Ele  oferece  mais  evidência  (além  de  sua  baixa  carga  pa¬ 
dronizada)  de  que  HV5  pode  precisar  ser  descartado. 

O  terceiro  diagnóstico  que  examinamos  é  o  índice  de 
modificação  associado  com  cada  caminho  restrito.  Aqui  a 
informação  é  consistente  com  aquela  obtida  a  partir  dos 
resíduos  certamente  conduzindo  à  mesma  conclusão.  O 
índice  de  modificação  para  o  fermo  de  erro  de  radiante- 
alegre  é  15,17.  No  entanto,  dadas  as  elevadas  estimativas 
de  carga  para  cada,  nenhuma  modificação  é  feifa.  Além 
disso,  não  apenas  há  um  elevado  resíduo  padronizado  as¬ 
sociado  com  FIV5  (-3,76),  mas  um  alto  índice  de  modifi¬ 
cação  também  é  encontrado  entre  FíV5  e  Hl*  (14,15),  e 
sua  carga  está  abaixo  de  0,5.  Com  base  nesses  resultados, 
a  única  mudança  que  seria  feita  é  a  eliminação  de  HV5. 

As  vezes,  diagnósticos  sugerem  substanciais  mudanças 
em  um  modelo  de  mensuração.  Quando  as  mudanças  são 
marcantes,  novos  dados  são  necessários  para  validar  tal 
modelo.  Modificações  significativas  realmente  produzem 
um  novo  modelo  de  mensuração. 


*  N.  de  R.  T.:  A  expressão  correta  seria  HVl. 


608  Análise  Multivariada  de  Dados 


\x  (Cargas  completamente  padronizadas) 


SENTIMENTO 

VALOR 

ANIMADO 

0,78 

-  - 

ESTIMULADO 

0,89 

-  - 

ALEGRE 

0,83 

-  - 

RADIANTE 

0,87 

-  - 

HVl 

-  - 

0,58 

HV2 

-  - 

0,71 

HV3 

-  - 

0,69 

HV4 

-  - 

0,52 

HV5 

-  - 

0,46 

=  68,0  com  24  graus  de  iiberdade  (p  = 
CFi  =  0,99 

RMSEA  =  0,04 

0,000013) 

MAIORES  RESÍDUOS 

PADRONIZADOS 

NEGATIVOS 

RESÍDUO  PARA 

ALEGRE  E 

ANIMADO 

RESÍDUO  PARA 

RADIANTE  E 

ESTIMULADO 

RESÍDUO  PARA 

HV2  E 

RADIANTE 

RESÍDUO  PARA 

HV5  E 

HVl 

MAIORES  RESÍDUOS 

:  PADRONIZADOS 

POSITIVOS 

RESÍDUO  PARA 

ESTIMULADO  E 

ANIMADO 

RESÍDUO  PARA 

RADIANTE  E 

ALEGRE 

RESÍDUO  PARA 

HVl  E 

ANIMADO 

RESÍDUO  PARA 

HVl  E 

ESTIMULADO 

índices  de  modificação  para  estimativas  de 

SENTIMENTO 

VALOR 

ANIMADO 

-  - 

0,00 

ESTIMULADO 

-  - 

5,04 

ALEGRE 

-  - 

0,01 

RADIANTE 

-  - 

5,29 

HVl 

4,09 

-  - 

HV2 

2,72 

-  - 

HV3 

0,04 

-  - 

HV4 

2,30 

-  - 

HV5 

2,06 

-  - 

Novo  construto  HV  tem  cinco 
variáveis  indicadoras 


'  Índices  de  ajuste 


-3,12 
-3,04 
-2 , 70 
-3,76 


Maiores  resíduos  padronizados 


negativos  e  positivos 


3,05 
3,90 
3,08 
2 , 72 


cargas  cruzadas 


Lces  de  modificação  para 

estimativas  de 

termos 

de  erro 

ANIMADO 

ESTIMULADO 

ALEGRE 

RADIANTE 

HVl 

HV2 

ANIMADO 

-  - 

ESTIMULADO 

9,30 

-  - 

ALEGRE 

9,72 

0,90 

-  - 

RADIANTE 

0,01 

9,26 

15,17 

-  - 

HVl 

10,04 

2 ,40 

2,62 

1,86 

-  - 

HV2 

0,28 

0,00 

1,40 

2,73 

0,86 

-  - 

HV3 

2 , 04 

0,09 

0,17 

0,28 

0,16 

0,07 

HV4 

0,00 

0,84 

3,82 

0,06 

6,62 

0,26 

HV5 

0,78 

0,08 

2 , 14 

0,00 

14,15 

4,98 

FIGURA  11-7  Cargas,  resíduos  padronizados  e  índices  de  modificação  em  CFA. 
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-  REGRAS  PRÁTICAS  11-5  - 

Avaliação  da  validade  do  modelo  de  mensuração 

•  Estimativas  de  carga  podem  ser  estatisticamente 
significantes,  mas  ainda  serem  muito  pequenas  para 
se  qualificarem  como  bons  itens  (cargas  padronizadas 
abaixo  de  10,51);  em  CFA,  itens  com  cargas  pequenas  se 
tornam  candidatos  à  eliminação. 

•  Cargas  completamente  padronizadas  acima  de  1,0  ou 
abaixo  de  -1,0  estão  fora  do  intervalo  viável  e  podem 
ser  um  importante  indicador  de  algum  problema  com 
os  dados 

•  Tipicamente,  resíduos  padronizados  menores  do  que 
12,51  não  sugerem  um  problema: 

•  Resíduos  padronizados  maiores  do  que  14,01  sugerem 
um  grau  de  erro  potencialmente  inaceitável  que 
pode  pedir  a  eliminação  de  um  item  transgressor 

•  Resíduos  padronizados  entre  12,51  e  14,01  merecem 
alguma  atenção,  mas  podem  não  sugerir  qualquer 
mudança  no  modelo  se  nenhum  outro  problema 
estiver  associado  com  os  dois  itens 

•  O  pesquisador  deve  usar  os  índices  de  modificação 
somente  como  orientação  para  melhoramentos  no 
modelo  daquelas  relações  que  podem  ser  teoricamente 
justificadas 

•  Buscas  de  especificação  sustentadas  somente  em 
bases  empíricas  são  desencorajadas,  pois  elas  são 
inconsistentes  com  a  base  teórica  de  CFA  e  SEM 

•  Resultados  CFA  que  sugerem  modificações  relevantes 
devem  ser  reavaliados  com  um  novo  conjunto  de  dados 
(p.ex.,  se  mais  de  duas  entre  15  variáveis  medidas 

são  descartadas,  as  modificações  não  podem  ser 
consideradas  irrelevantes) 


ILUSTRAÇÃO  DA  CFA 

Agora,  ilustramos  a  CFA.  Nesta  seção,  aplicamos  o  pro¬ 
cedimento  de  seis  estágios  em  um  problema  defrontado 
pela  administração  de  HBAT.  Em  uma  seção  posterior, 
cobrimos  alguns  dos  tópicos  avançados  estendendo  a  aná¬ 
lise  desses  mesmos  dados.  Começamos  introduzindo  bre¬ 
vemente  o  contexto  para  este  novo  estudo  da  HBAT. 


A  HBAT  emprega  milhares  de  pessoas  em  diferentes 
operações  ao  redor  do  mundo.  Como  em  muitas  firmas, 
um  de  seus  maiores  problemas  administrativos  é  atrair 
e  manter  empregados  produtivos.  O  custo  para  substi¬ 
tuir  e  treinar  empregados  é  alto.  No  entanto,  a  pessoa 
recém  contratada  trabalha  para  a  HBAT  menos  de  três 
anos  em  média.  Na  maioria  dos  empregos,  o  primeiro 
ano  não  é  produtivo,  o  que  significa  que  o  empregado 
não  está  contribuindo  tanto  quanto  os  custos  associados 
com  sua  contratação.  Depois  do  primeiro  ano,  a  maioria 
dos  empregados  se  torna  produtiva.  A  administração  da 
HBAT  gostaria  de  entender  os  fatores  que  contribuem 


para  a  manutenção  de  empregados.  Uma  melhor  com¬ 
preensão  pode  ser  conseguida  aprendendo  como  medir 
os  construtos  fundamentais.  Assim,  a  HBAT  está  inte¬ 
ressada  em  desenvolver  e  testar  um  modelo  de  mensura¬ 
ção  formado  por  construtos  que  afetam  as  atitudes  e  os 
comportamentos  dos  empregados  sobre  a  permanência 
na  HBAT. 


Estágio  1:  Definição  de  construtos  individuais 

Com  a  questão  geral  de  pesquisa  definida,  o  pesquisador 
volta  sua  atenção  para  a  seleção  dos  construtos  específicos 
que  representam  a  estrutura  teórica  a  ser  testada  e  que 
devem  ser  incluídos  na  análise.  Os  indicadores  específicos 
usados  para  operacionalizar  tais  construtos  podem  vir  de 
pesquisa  prévia  ou  podem  ser  desenvolvidos  especifica¬ 
mente  para  a  análise  em  mãos. 


A  HBAT  iniciou  um  projeto  de  pesquisa  para  estudar 
o  problema  de  rotatividade  de  empregados.  Pesquisas 
preliminares  descobriram  que  muitos  empregados  estão 
somando  opções  de  trabalho  com  a  intenção  de  sair  da 
HBAT  assim  que  uma  oferta  aceitável  seja  conseguida 
com  outra  empresa.  Para  conduzir  o  estudo,  a  HBAT 
contratou  consultores  que  têm  um  conhecimento  profis¬ 
sional  da  teoria  de  comportamento  organizacional  refe¬ 
rente  à  retenção  de  empregados.  Com  base  em  litera¬ 
tura  publicada  e  algumas  entrevistas  preliminares  com 
empregados,  um  estudo  foi  planejado,  focalizando  cinco 
construtos  fundamentais.  A  equipe  de  consultores  e  a 
administração  da  HBAT  também  concordaram  com  as 
definições  de  construtos  com  base  em  como  eles  foram 
usados  no  passado.  Os  cinco  construtos,  com  uma  defini¬ 
ção  operacional,  são  os  seguintes: 

•  Satisfação  com  o  emprego  (JS).  Reações  resultantes  de 
uma  avaliação  da  situação  empregatícia  de  alguém. 

•  Compromisso  organizacional  ( OC).  O  grau  em  que  um 
empregado  se  identifica  e  se  sente  parte  da  HBAT. 

•  Intenções  de  ficar  (SI).  O  grau  em  que  um  empregado 
pretende  continuar  trabalhando  para  a  HBAT  e  não 
está  participando  de  atividades  que  tornam  o  pedido  de 
demissão  algo  provável. 

•  Percepções  ambientais  (EP).  Crenças  que  um  emprega¬ 
do  tem  sobre  o  dia-a-dia,  sobre  as  condições  físicas  de 
trabalho. 

•  Atitudes  em  relação  a  colegas  (AC).  Atitudes  que  um 
empregado  tem  em  relação  aos  colegas  com  os  quais  ele 
normalmente  interage. 

Os  consultores  propuseram  um  conjunto  de  escalas 
reflexivas  de  múltiplos  itens  para  medir  cada  construto. 
A  validade  de  expressão  parece  evidente,  e  as  defini¬ 
ções  conceituais  correspondem  bem  com  a  descrição  dos 
itens.  Além  disso,  um  pré-teste  simples  foi  executado,  no 
qual  três  especialistas  independentes  ligaram  itens  com 

_ (Continua) 
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(Continuação) 

OS  nomes  dos  construtos.  Nenhum  perito  teve  dificulda¬ 
de  para  ligar  itens  com  construtos,  fornecendo  grande 
confiança  de  que  as  escalas  contêm  validade  de  expres¬ 
são.  Tendo  estabelecido  validade  de  expressão,  a  HBAT 
prosseguiu  para  finalizar  as  escalas.  A  purificação  de 
escalas  baseada  em  correlações  entre  itens  e  total  e  re¬ 
sultados  de  EFA  (como  no  Capítulo  3)  de  um  pré-teste 
envolvendo  100  empregados  da  HBAT  resultaram  nas 
medidas  mostradas  na  Tabela  11-1.  A  escala  de  satisfa¬ 
ção  com  emprego  contém  múltiplas  medidas,  com  cada 
uma  avaliando  o  grau  de  satisfação  sentido  pelos  respon- 
dentes  com  um  tipo  diferente  de  escala.  Um  apêndice  no 
final  do  capítulo  mostra  o  questionário  para  este  estudo. 


Estágio  2:  Desenvolvimento  do 
modelo  de  medida  geral 

Com  os  construtos  especificados,  o  pesquisador  deve  a 
seguir  especificar  o  modelo  de  mensuração  a  ser  testado. 
Fazendo  isso,  não  apenas  relações  entre  construtos  são 


definidas,  mas  também  a  natureza  de  cada  construto  (re¬ 
flexiva  versus  formativa)  é  especificada. 


Um  diagrama  visual  descrevendo  o  modelo  de  mensu¬ 
ração  é  exibido  na  Figura  11-8.  O  modelo  retrata  21  va¬ 
riáveis  indicadoras  medidas  e  cinco  construtos  latentes. 
Sem  motivo  para  pensar  que  os  construtos  são  indepen¬ 
dentes,  todos  eles  são  considerados  como  correlaciona¬ 
dos  entre  si.  Todos  os  itens  medidos  podem  ter  cargas 
sobre  apenas  um  construto  cada;  logo,  os  termos  de  erro 
(não  mostrados  na  ilustração)  não  devem  se  relacionar 
com  qualquer  outra  variável  medida,  e  o  modelo  de 
mensuração  é  congênere.  Quatro  construtos  são  indica¬ 
dos  por  quatro  itens  medidos,  e  um  (JS)  é  indicado  por 
cinco  itens  medidos.  Cada  construto  individual  é  identi¬ 
ficado.  O  modelo  geral  tem  mais  graus  de  liberdade  do 
que  caminhos  a  serem  estimados.  Portanto,  de  uma  ma¬ 
neira  consistente  com  a  regra  prática  que  recomenda  um 
mínimo  de  três  indicadores  por  construto  mas  que  enco- 

(Coníinua) 


FIGURA  11-8  Modelo  de  teoria  de  mensuração  para  empregados  da  HBAT. 

Nota'.  Variáveis  medidas  são  mostradas  com  uma  caixa  por  rótulos  correspondentes  àqueles  exibidos  no  questionário.  Construtos  latentes  são 
mostrados  com  um  oval.  Cada  variável  medida  tem  um  termo  de  erro  (6)  associado  com  ela.  Esses  termos  de  erro  não  são  exibidos  na  figura  para  fins 
de  simplificação.  Conexões  em  dois  sentidos  indicam  covariância  entre  construtos  (<I>).  Conectores  de  um  só  sentido  indicam  um  caminho  causal  de  um 
construto  para  um  indicador. 


*  N.  de  R.  T.:  A  notação  correta  seria  X 
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TABELA  11-1  Indicadores  observados  usados  em  CFA  de  comportamento  de  empregados  da  HBAT 


Item 

Tipo  de  escala 

Descrição 

Construto 

JS1 

Likert  de  0-10 
Discorda-concorda 

Levando  tudo  em  conta,  sinto-me  muito  satisfeito  quando  penso  em  meu  emprego. 

JS 

0C1 

Likert  de  0-10 
Discorda-concorda 

Meu  trabalho  na  HBAT  me  dá  uma  sensação  de  realização. 

QC 

0C2 

Likert  de  0-10 
Discorda-concorda 

Estou  disposto  a  fazer  um  esforço  maior,  além  do  normalmente  esperado,  para 
ajudar  a  HBAT  a  ter  sucesso. 

QC 

EP1 

Likert  de  0-10 
Discorda-concorda 

Estou  confortável  com  meu  ambiente  físico  de  trabalho  na  HBAT 

EP 

0C3 

Likert  de  0-10 
Discorda-concorda 

Sinto  lealdade  para  com  a  HBAT. 

QC 

0C4 

Likert  de  0-10 
Discorda-concorda 

Sinto  orgulho  de  dizer  aos  outros  que  trabalho  para  a  HBAT. 

QC 

EP2 

Likert  de  0-10 
Discorda-concorda 

O  local  onde  trabalho  é  planejado  para  me  ajudar  a  fazer  meu  trabalho  melhor. 

EP 

EP3 

Likert  de  0-10 
Discorda-concorda 

Há  poucos  obstáculos  que  podem  me  tornar  menos  produtivo  em  meu  local  de 
trabalho 

EP 

AC1 

Likert  de  5  pontos 

O  quão  feliz  você  está  com  o  trabalho  de  seus  colegas? 

Nada  feliz  Um  pouco  feliz  Feliz  Muito  feliz  Extremamente  feliz 

AC 

EP4 

Diferencial  semântico  de  7 
pontos 

Qual  termo  melhor  descreve  seu  ambiente  de  trabalho  na  HBAT? 

Muito  frenético  muito  calmo 

EP 

JS2 

Diferencial  semântico 
de  7  pontos 

Quando  você  pensa  em  seu  trabalho,  quão  satisfeito  você  fica? 

Nada  satisfeito  Muito  satisfeito 

JS 

JS3 

Diferencial  semântico  de  7 
pontos 

0  quão  satisfeito  você  está  com  seu  atual  trabalho  na  HBAT? 

Muito  insatisfeito  Muito  satisfeito 

JS 

AC2 

Diferencial  semântico  de  7 
pontos 

Como  você  se  sente  em  relação  aos  seus  colegas? 

Nada  favorável  muito  favorável 

AC 

SI1 

Likert  de  5  pontos 

Discordo  -  concordo 

Atualmente  não  estou  procurando  outro  emprego. 

Discordo  fortemente  Concordo  fortemente 

SI 

JS4 

Likert  de  5  pontos 

Como  empregado,  o  quão  satisfeito  você  está  com  a  HBAT? 

Nem  um  pouco  um  pouco  médio  bastante  muitíssimo 

JS 

SI2 

Likert  de  5  pontos 

Discordo  -  concordo 

Raramente  olho  lista  de  empregos  na  internet 

Discordo  fortemente  concordo  fortemente 

SI 

JS5 

Percentual  de  satisfação 

Indique  sua  satisfação  com  seu  emprego  atual  na  HBAT  preenchendo  a  lacuna  com 
um  percentual,  sendo  que  0%  =  Nada  satisfeito  e  1 00%  =  muitíssimo  satisfeito 

JS 

AC3 

Likert  de  5  pontos 

Com  que  frequência  você  faz  coisas  com  seus  colegas  em  dias  de  folga? 

Nunca  Raramente  Ocasionalmente  Freqüentemente  Quase  sempre 

AC 

SI3 

Likert  de  5  pontos 

Discordo  -  concordo 

Não  tenho  interesse  em  procurar  por  um  emprego  no  próximo  ano. 

Discordo  fortemente  Concordo  fortemente 

SI 

AC4 

Diferencial  semântico  de  6 
pontos 

Geralmente,  o  quanto  seus  colegas  se  parecem  com  você? 

Muito  diferentes  Muito  oarecidos 

AC 

SI4 

Likert  de  5  pontos 

Qual  a  possibilidade  de  que  você  estará  trabalhando  na  HBAT  pelos  próximos  12 
meses? 

Muito  imorovável  Imorovável  É  possível  Provável  Altamente  orovável 

SI 

(Continuação) 

raja  pelo  menos  quatro,  a  condição  de  ordem  é  satisfei¬ 
ta.  Em  outras  palavras,  o  modelo  é  super-identificado. 
Dado  o  número  de  indicadores  e  um  tamanho  suficiente 
da  amostra,  nenhum  problema  com  a  condição  de  classi¬ 
ficação  é  esperado  também.  Quaisquer  problemas  dessa 
natureza  deveriam  surgir  durante  a  análise. 

No  modelo  proposto,  todas  as  medidas  são  reflexivas. 
Ou  seja,  a  direção  de  causalidade  é  do  construto  laten¬ 
te  para  os  itens  medidos.  Por  exemplo,  o  desejo  de  um 


empregado  em  pedir  demissão  tenderia  a  causar  baixos 
escores  em  cada  um  dos  quatro  indicadores  que  carre¬ 
gam  sobre  o  construto  de  Intenções  de  Ficar  (SI).  Cada 
construto  também  apresenta  uma  série  de  indicadores 
que  compartilham  uma  base  conceituai  semelhante,  e 
empiricamente  eles  tenderiam  a  caminhar  juntos.  Isto 
é,  esperaríamos  que  quando  um  mudar,  uma  mudança 
sistemática  ocorrerá  no  outro.  Logo,  o  modelo  de  men- 
suração  é  teoricamente  considerado  como  reflexivo. 
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Estágio  3:  Planejamento  de  nm  estndo 
para  prodnzir  resnltados  empíricos 

O  próximo  passo  demanda  que  o  estudo  seja  planejado  e 
executado  para  coletar  dados  para  testar  o  modelo  de  men- 
suração.  O  pesquisador  deve  considerar  questões  como 
tamanho  amostrai  e  especificação  do  modelo,  particular¬ 
mente  na  hora  de  estabelecer  a  identificação  do  modelo. 


A  seguir,  a  HBAT  planejou  um  estudo  para  testar  o  mo¬ 
delo  de  mensuração.  O  interesse  da  HBAT  estava  em 
seus  empregados  horistas,  e  não  na  sua  equipe  adminis¬ 
trativa.  Logo,  o  departamento  de  pessoal  da  HBAT  for¬ 
neceu  uma  amostra  aleatória  de  500  empregados.  Os  500 
representam  empregados  de  cada  uma  das  divisões  da 
HBAT,  incluindo  suas  operações  nos  Estados  Unidos, 
Europa,  Ásia  e  Austrália.  Quatrocentas  respostas  com¬ 
pletas  foram  obtidas. 

Se  o  modelo  é  super  identificado,  então,  com  base  em 
pré-testes,  espera-se  que  as  comunalidades  excedam  0,5, 
e  podem  exceder  0,6,  e  o  tamanho  da  amostra  deve  ser 
adequado.  Se  o  modelo  tivesse  alguns  fatores  sub-identi- 
ficados,  ou  se  algumas  comunalidades  ficassem  abaixo  de 
0,5,  então  uma  amostra  maior  seria  necessária.  O  tama¬ 
nho  da  amostra  é  também  suficiente  para  viabilizar  es¬ 
timação  de  máxima  verossimilhança.  Diversas  variáveis 
de  classificação  também  foram  coletadas  com  o  questio¬ 
nário.  Foi  permitido  aos  empregados  responderem  os 
questionários  no  horário  do  expediente  e  devolverem 
os  mesmos  em  anonimato.  O  exame  inicial  não  mos¬ 
trou  quaisquer  problemas  com  dados  perdidos.  Apenas 
duas  respostas  incluíram  dados  perdidos.  Em  um  caso, 
uma  resposta  fora  do  intervalo  foi  dada,  a  qual  é  tratada 
como  uma  resposta  perdida.  Usando  nossa  regra  prática 
do  capítulo  anterior,  o  tamanho  amostrai  efetivo  usan¬ 
do  PD  (eliminação  aos  pares,  também  conhecida  como 
tratamento  totalmente  disponível)  é  de  399,  pois  este  é  o 
número  mínimo  de  observações  para  qualquer  covariân- 
cia  observada. 


Especificação  do  modelo 

Dependendo  do  programa  computacional  que  você  usa, 
diferentes  abordagens  são  necessárias  neste  ponto.  Dois 
dos  pacotes  computacionais  mais  populares  serão  discuti¬ 
dos,  apesar  de  muitos  outros  poderem  ser  utilizados  para 
obter  resultados  idênticos. 


Se  você  escolher  o  AMOS,  então  você  começa  usando 
a  interface  gráfica  para  desenhar  o  modelo  descrito  na 
Figura  11-8.  Uma  vez  que  o  modelo  é  esboçado,  você 
pode  transportar  as  variáveis  medidas  para  o  modelo  e 
processar  o  programa.  Em  contrapartida,  se  você  optar 
por  LISREL,  pode  então  usar  os  menus  drop-down  para 


gerar  a  sintaxe  que  corresponde  ao  modelo  de  mensu¬ 
ração,  ou  esboçar  tal  modelo  usando  um  diagrama  de 
caminhos,  ou  escrever  o  código  apropriado  em  uma  ja¬ 
nela  de  sintaxe.  Se  uma  das  duas  primeiras  alternativas 
é  escolhida,  LISREL  pode  gerar  a  sintaxe  do  programa 
automaticamente . 


Identificação 

Uma  vez  que  o  modelo  de  mensuração  é  especificado,  o 
pesquisador  está  pronto  para  estimar  o  modelo.  O  progra¬ 
ma  SEM  fornecerá  uma  solução  para  o  modelo  especifica¬ 
do  se  tudo  estiver  adequadamente  especificado.  O  proce¬ 
dimento  de  estimação  padrão  é  máxima  verossimilhança, 
a  qual  será  usada  neste  caso  porque  uma  análise  prelimi¬ 
nar  dos  dados  leva  a  HBAT  a  acreditar  que  as  proprie¬ 
dades  de  distribuição  dos  dados  são  aceitáveis  para  esta 
abordagem.  O  pesquisador  agora  deve  escolher  as  demais 
opções  que  são  necessárias  para  analisar  adequadamente 
os  resultados.  Exemplos  de  algumas  opções  disponíveis 
para  os  programas  LISREL  e  AMOS  são  apresentados 
nos  apêndices  no  final  deste  capítulo. 


A  Tabela  11-2  mostra  uma  parte  inicial  de  uma  saída 
dos  resultados  CFA  para  este  modelo.  Ela  fornece  uma 
maneira  fácil  para  rapidamente  examinar  quantos  graus 
de  liberdade  serão  usados  pelo  modelo.  Neste  caso,  52 
parâmetros  são  livres  para  serem  estimados.  Dos  52  pa¬ 
râmetros  livres,  16  são  cargas  fatoriais,  15  representam 
termos  de  variância  e  covariância  fatorial,  e  21  corres¬ 
pondem  a  termos  de  variância  de  erro.  O  número  total 
de  termos  de  variância  e  covariância  únicos  é: 

(21  X  22)/2  =  231 

Como  231  é  maior  que  52,  o  modelo  é  identificado 
com  respeito  à  condição  de  ordem.  Ele  inclui  mais  graus 
de  liberdade  do  que  parâmetros  livres.  Nenhum  proble¬ 
ma  surge  com  a  condição  de  classificação  para  identifi¬ 
cação,  pois  temos  pelo  menos  quatro  indicadores  para 
cada  construto.  Além  disso,  nosso  tamanho  amostrai  é 
suficiente,  e  assim  acreditamos  que  o  modelo  convergirá 
e  produzirá  resultados  confiáveis.  Esta  é  uma  maneira 
importante  de  verificar  a  especificação  para  evitar  ou  de¬ 
tectar  potenciais  problemas  de  identificação. 


Estágio  4:  Avaliação  da  validade 
do  modelo  de  medida 

Examinamos  agora  os  resultados  do  teste  dessa  teoria  de 
mensuração  pela  comparação  do  modelo  de  mensura¬ 
ção  teórico  com  a  realidade,  como  representada  por  esta 
amostra.  Tanto  o  ajuste  do  modelo  geral  quanto  os  cri¬ 
térios  para  validade  de  construto  devem  ser  examinados. 
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TABELA  11-2  Parâmetros  livres  no  modelo  CFA  da  HBAT 


Especificações  de  parâmetros 
(X,  LAMBDA-X 


íiJS 

O 

n 

^3  SI 

^4  EP 

AC 

JSl 

0 

0 

0 

0 

0 

JS2 

1 

0 

0 

0 

0 

JS3 

2 

0 

0 

0 

0 

JS4 

3 

0 

0 

0 

0 

JS5 

4 

0 

0 

0 

0 

OGl 

0 

0 

0 

0 

0 

OC2 

0 

5 

0 

0 

0 

OC3 

0 

6 

0 

0 

0 

OC4 

0 

7 

0 

0 

0 

SIl 

0 

0 

0 

0 

0 

SI2 

0 

0 

8 

0 

0 

SI3 

0 

0 

9 

0 

0 

SI4 

0 

0 

10 

0 

0 

EPl 

0 

0 

0 

0 

0 

EP2 

0 

0 

0 

11 

0 

EP3 

0 

0 

0 

12 

0 

EP4 

0 

0 

0 

13 

0 

ACl 

0 

0 

0 

0 

0 

AC2 

0 

0 

0 

0 

14 

AC3 

0 

0 

0 

0 

15 

AC4 

0 

0 

0 

0 

16 

(f)  PHI 

JS 

OC 

SI 

EP 

AC 

JS 

17 

OC 

18 

19 

SI 

20 

21 

22 

EP 

23 

24 

25 

26 

AC 

27 

28 

29 

30  ' 

31 

04  THETA-DELTA 

(Diagonal ) 

X12 

XI 

X17 

X15 

Xll 

32 

33 

34 

35 

36 

THETA- 

■DELTA 

X6 

X5 

X2 

X14 

X19 

38 

39 

40 

41 

42 

THETA-DELTA 

X21 

44 


X7 

45 


X8 

46 


XIO 

47 


X4 

48 


X3 

37 


X16 

43 


X9 

49 


1 6  cargas  fatoriais 
a  serem  estimadas, 
como  mostrado  pela 
contagem  (números) 
1-16. 


15  termos  de  covariân- 
cia  fatorial  a  serem  esti¬ 
mados,  como  mostrado 
pelos  números  17-31. 


21  termos  de  variância  de  erro 
serão  estimados,  como  mos¬ 
trado  pelos  números  32-52. 


THETA-DELTA 

X18 

50 


Número  total  de  parâmetros  livres 
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Logo,  revemos  aqui  estatísticas  importantes  de  ajuste  e  as 
estimativas  paramétricas. 

Ajuste  geral 

A  saída  de  CFA  inclui  muitos  índices  de  ajuste.  Não  pe¬ 
dimos  todos  os  possíveis  índices  de  ajuste.  Ao  invés  disso, 
nos  concentramos  nos  valores  GOF  estratégicos  usando 
nossas  regras  práticas  para  fornecer  alguma  avaliação  de 
ajuste.  Cada  programa  SEM  (AMOS,  LISREL,  EQS  etc.) 
inclui  um  conjunto  ligeiramente  diferente,  mas  todos  eles 
contêm  os  valores  importantes  como  a  estatística  x^,  o 
CFI  e  a  RMSEA.  Eles  podem  aparecer  em  uma  ordem  di¬ 
ferente  ou  talvez  em  um  formato  tabular,  mas  você  pode 
achar  informação  suficiente  para  avaliar  o  ajuste  de  seu 
modelo  em  qualquer  programa  SEM. 


A  Figura  11-9  mostra  o  resumo  do  ajuste  geral  forne¬ 
cido  na  saída  de  CFA.  Números  de  linhas  foram  acres¬ 
centados  para  fins  de  referência.  O  x  do  modelo  geral  é 
229,95  com  179  graus  de  liberdade.  O  valor-p  associado 
com  este  resultado  é  0,0061.  Este  valor-p  é  significante 
usando  uma  taxa  de  erro  Tipo  I  de  0,05.  Assim,  a  esta¬ 
tística  de  qualidade  de  ajuste  não  indica  que  a  ma¬ 
triz  de  covariância  observada  combina  com  a  matriz  de 
covariância  estimada  dentro  da  variância  amostrai.  No 
entanto,  dados  os  problemas  associados  com  o  emprego 


deste  teste  sozinho  e  o  tamanho  efetivo  da  amostra  de 
399,  examinamos  detalhadamente  outras  estatísticas  de 
ajuste  também. 

Nossa  regra  prática  sugere  que  confiemos  em  pelo 
menos  um  índice  de  ajuste  absoluto  e  um  incremental, 
além  do  resultado  de  x^-  O  valor  para  RMSEA,  um  índi¬ 
ce  de  ajuste  absoluto,  é  de  0,027.  Este  valor  parece  bas¬ 
tante  pequeno  e  está  abaixo  da  orientação  de  0,08  para 
um  modelo  de  21  variáveis  medidas  e  uma  amostra  de 
399.  Usando  o  intervalo  de  confiança  de  90%  para  esta 
RMSEA,  concluímos  que  o  verdadeiro  valor  de  RM¬ 
SEA  está  entre  0,015  e  0,036.  Assim,  até  mesmo  o  limite 
superior  de  RMSEA  é  baixo  neste  caso. 

O  CFI  é  um  índice  de  ajuste  incremental.  Ele  é  de 
0,99,  o  que,  assim  como  a  RMSEA,  excede  as  diretrizes 
de  CFI  para  um  modelo  dessa  complexidade  e  com  esse 
tamanho  amostrai.  Assim,  este  resultado  sustenta  o  mo¬ 
delo  também. 

Os  resultados  CFA  sugerem  que  o  modelo  de  mensu- 
ração  da  HBAT  fornece  um  ajuste  razoavelmente  bom. 
Além  disso,  o  uso  de  RMSEA  e  CFI  satisfaz  nossa  regra 
prática  de  que  um  índice  de  má  qualidade  de  ajuste  e  um 
índice  de  qualidade  de  ajuste  sejam  avaliados.  Soma-se  a 
isso  o  fato  de  que  os  outros  valores  de  índices  anterior¬ 
mente  discutidos  também  sustentam  o  modelo.  Por  exem¬ 
plo,  a  SRMR  é  0,035,  o  GFI  é  0,95,  e  o  AGFI  é  0,93. 


Estatística  de  qualidade  de  ajuste 
Graus  de  liberdade  =  179 

Função  qui-quadrado  de  ajuste  mínimo  =  229,95  (P  =  0,0061) 
Parâmetro  de  não-centralidade  estimado  (NCP)  =  50,95 
Intervalo  de  confiança  de  90%  para  NCP  =  (15,98;  94,04) 

Raiz  do  erro  quadrático  médio  de  aproximação  (RMSEA)  =  0,027 
Intervalo  de  confiança  de  90%  para  RMSEA  =  (0,015;  0,036) 
Valor-p  para  teste  de  ajuste  próximo  (RMSEA  <  0,05)  =  1,00 

índice  de  validação  cruzada  esperado  (ECVI)  =  0,84 
Intervalo  de  confiança  de  90%  para  ECVI  =  (0,75;  0,95) 

ECVI  para  modelo  saturado  =  1,16 

ECVI  para  modelo  de  independência  =  20,28 


Qui-quadrado  para  modelo  de  independência  com  210  graus  de  liberdade  =  8030,24 
AIC  de  independência  =  8072,24 
AIC  do  modelo  =  333,95 
AIC  saturado  =  462,00 


índice  de 
índice  de 
índice  de 
índice  de 
índice  de 
índice  de 
N  crítico 


ajuste  normado  (NFI)  =  0,97 
ajuste  não-norraado  (NNFI)  =  0,99 
ajuste  normado  de  parcimônia  (PNFI) 
ajuste  comparativo  (CFI)  =  0,99 
ajuste  incremental  (IFI)  =  0,99 
ajuste  relativo  (RFI)  =  0,97 
(CN)  =  381,03 


0,83 


Raiz  do  resíduo  quadrático  médio  (RMR*)  =  0,086 
Raiz  padronizada  do  resíduo  médio  (SRMR)  =  0,035 
índice  de  qualidade  de  ajuste  (GFI)  =  0,95 
índice  ajustado  de  qualidade  de  ajuste  (AGFI)  =  0,93 


FIGURA  11-9  Resumo  do  ajuste  geral  do  CFA  da  HBAT. 


*  N.  de  R.  T.:  A  notação  correta  seria  RMSR. 
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Validade  de  construto 

Para  avaliar  validade  de  construto,  examinamos  valida¬ 
de  convergente,  discriminante  e  nomológica.  Validade 
de  expressão,  como  anteriormente  observado,  foi  esta¬ 
belecida  com  base  no  conteúdo  dos  itens  corresponden¬ 
tes. 

Validade  convergente.  A  CFA  provê  um  domínio  de 
informação  usado  na  avaliação  de  validade  convergen¬ 
te.  Ainda  que  estimativas  de  carga  fatorial  de  máxima 
verossimilhança  não  sejam  associadas  com  um  intervalo 
especificado  de  valores  aceitáveis  ou  inaceitáveis,  suas 
magnitudes,  direções  e  significância  estatística  devem  ser 
avaliadas. 


Começamos  examinando  as  estimativas  de  cargas  fato¬ 
riais.  A  Tabela  11-3  retrata  as  estimativas  originais  de 
carga  de  máxima  verossimilhança  e  seus  valores-f  asso¬ 
ciados.  Observe  que  alguns  programas  (AMOS)  podem 
se  referir  a  cargas  fatoriais  como  pesos  de  regressão,  e 
depende  do  usuário  o  reconhecimento  de  seus  status 
como  cargas  fatoriais.  Estimativas  de  cargas  que  são  sig- 
nificantes  fornecem  um  começo  útil  na  avaliação  da  va¬ 
lidade  convergente  do  modelo  de  mensuração.  Todas  as 
cargas  são  altamente  significantes,  como  foi  exigido  para 
validade  convergente. 


Estimativas  de  máxima  verossimilhança  são  a  opção 
padrão  para  a  maioria  dos  programas  SEM,  incluindo 
AMOS  e  LISREL.  Sugere-se  que  cargas  padronizadas 
também  sejam  requisitadas.  Usando  esta  informação,  po¬ 
demos  avaliar  as  cargas  fatoriais  individuais  com  relação 
aos  critérios  para  validade  de  construto.  Nossas  orienta¬ 
ções  são  que  todas  as  cargas  devem  ser  de  pelo  menos  0,5, 
e  preferencialmente  0,7,  e  que  as  medidas  de  variância 
extraída  devam  igualar  ou  exceder  50%,  enquanto  70% 
é  considerado  como  referência  para  confiabilidade  de  um 
construto. 


A  Tabela  11-4  retrata  cargas  completamente  padroniza¬ 
das  (pesos  de  regressão  padronizados,  usando  termino¬ 
logia  AMOS).  Quando  nos  referimos  a  estimativas  de 
cargas  nesses  capítulos,  nos  referimos  aos  valores  com¬ 
pletamente  padronizados,  exceto  quando  dissermos  o 
contrário.  A  menor  carga  obtida  é  0,58,  conectando  com¬ 
promisso  organizacional  (OC)  com  o  item  OCl.  Duas 
outras  estimativas  de  carga  ficam  abaixo  do  padrão  0,7. 
As  estimativas  de  variância  extraída  e  as  confiabilidades 
de  construtos  são  mostradas  na  parte  de  baixo  da  Tabe¬ 
la  11-4.  As  estimativas  de  variância  extraída  oscilam  de 
51,9%  para  JS  a  68,1%  para  AC.  Todas  excedem  a  regra 
prática  de  50%.  Confiabilidades  de  construto  variam  de 
0,83  para  OC  a  0,89  para  SI  e  AC.  Novamente,  elas  exce¬ 
dem  0,7,  sugerindo  confiabilidade  adequada.  Esses  valo¬ 


res  foram  computados  usando-se  as  fórmulas  mostradas 
anteriormente  no  capítulo  quando  validade  convergente 
foi  discutida.  Até  o  presente  momento,  programas  SEM 
não  fornecem  rotineiramente  tais  valores. 

Deste  modo,  a  evidência  sustenta  a  validade  conver¬ 
gente  do  modelo  de  mensuração.  Apesar  de  essas  três 
estimativas  de  cargas  estarem  abaixo  de  0,7,  duas  delas 
estão  pouco  abaixo  de  0,7,  e  a  outra  não  parece  ser  sig¬ 
nificativamente  danosa  para  o  ajuste  do  modelo  ou  para 
a  consistência  interna.  Todas  as  estimativas  de  variância 
extraída  excedem  0,5*  e  todas  as  estimativas  de  confia¬ 
bilidade  excedem  0,7.  Além  disso,  o  modelo  se  ajusta 
relativamente  bem.  Logo,  todos  os  itens  são  mantidos 
neste  ponto  e  uma  evidência  adequada  de  validade  con¬ 
vergente  é  fornecida. 


Validade  discriminante.  Agora  nos  voltamos  para  a  va¬ 
lidade  discriminante.  Primeiro,  examinamos  a  covariância 
entre  construtos.  Após  a  padronização,  as  covariâncias 
são  expressas  como  correlações.  A  abordagem  conserva¬ 
dora  para  estabelecer  validade  discriminante  compara  as 
estimativas  de  variância  extraída  para  cada  fator  com  as 
correlações  quadradas  entre  construtos  associadas  com 
aquele  fator. 


Todas  as  estimativas  de  variância  extraída  da  Tabela 
11-4  são  maiores  do  que  as  estimativas  correspondentes 
de  correlação  quadrada  entre  construtos  na  Tabela  11-5 
(acima  da  diagonal).  Portanto,  este  teste  não  sugere  pro¬ 
blemas  com  validade  discriminante. 


Todos  os  programas  SEM  fornecem  as  correlações  de 
construtos,  sempre  que  resultados  padronizados  são  exi¬ 
gidos.  Alguns  (LISREL)  terão  um  texto  de  saída  padrão 
que  as  imprime  como  uma  matriz  de  correlação  real.  Ou¬ 
tros  (como  AMOS)  podem  simplesmente  listá-las  no  tex¬ 
to  de  saída.  A  informação  é  a  mesma. 


O  modelo  de  mensuração  congênere  também  sustenta 
validade  discriminante,  pois  ele  não  contém  quaisquer 
cargas  cruzadas  entre  as  variáveis  medidas  ou  entre  os 
termos  de  erro.  Este  modelo  congênere  de  mensuração 
oferece  um  bom  ajuste  e  mostra  pouca  evidência  de  car¬ 
gas  cruzadas  substanciais.  Tomados  juntos,  esses  resul¬ 
tados  sustentam  a  validade  discriminante  do  modelo  de 
mensuração  da  HBAT. 


Validade  nomológica.  A  avaliação  de  validade  nomo¬ 
lógica  é  baseada  na  abordagem  delineada  no  Capítulo  3 
sobre  EFA.  A  matriz  de  correlação  fornece  um  começo 
útil  neste  esforço  no  sentido  de  que  se  espera  que  cons¬ 
trutos  se  relacionem  entre  si.  Pesquisas  anteriores  sobre 


*  N.  de  R.  T.:  A  expressão  correta  seria  50%. 
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TABELA  11-3  Estimativas  de  cargas  fatoriais  de  CFA  da  HBAT  e  valores-í 


JSl 

JS2 


JS3 


JS4 


JS5 


OCl 

OC2 


OC3 


OC4 


511 

512 


SI3 


SI4 


EPl 

EP2 


EP3 


EP4 


ACl 

AC2 


AC3 


AC4 


LAMBDA -X 

Estimativas  de  máxima  verossimilhança 
JS  OC  SI  EP  AC 

1,00 
1,03 

(0,08)  < - 

13,65 

0,90 

(0,07) 

12 ,49 
0,91 
(0,07) 

12,93 

1,14  --  --  --  -- 

(0,09) 

13,38 

--  1,00  --  --  -- 

-  -  1,31 

(0,11) 

12 , 17 

-  -  0,78 

(0,08) 

10,30 

-  -  1,17  -  -  -  -  -  - 

(0,10) 

11, 94 

--  --  1,00  --  -- 

--  --  1,07  --  -- 

(0,07) 

16, 01 

--  --  1,06  --  -- 

(0,07) 

16, 01 

--  --  1,17  --  -- 

(0,06) 

19,18 

1,00  -  - 

1,03  -  - 

(0,07) 

14,31 

0,80  -  - 

(0,06) 

13,68 

0,90  -  - 

(0,06) 

14,48 

--  --  --  --  1,00 

--  --  --  --  1,24 

(0,06) 

18,36 

--  --  --  --  1,04 

(0,06) 

18,82 

--  --  --  --  1,15 

(0,06) 

18,23 


Para  cada  parâmetro  livre,  uma  estimati¬ 
va  da  relação  é  dada.  A  primeira  linha  é 
a  estimativa,  a  segunda  é  o  erro  padrão, 
e  a  terceira  é  o  valor-f  para  a  estimativa. 
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TABELA  11-4  Cargas  fatoriais  completamente  padronizadas  da  HBAT  e  estimativas  de  variância  extraída,  e  de  confiabilidade 

JS  OC  SI  EP  AC 

JS1  0,74 

JS2  0,75 

JS3  0,68 

JS4  0,70 

JS5  0,73 

OC1  0,58 

OC2  0,88 

OC3  0,66 

OC4  0,84 


TABELA  11-5  Matriz  de  correlações  de  construtos  da  HBAT  (padronizada) 


JS 

OC 

SI 

EP 

AC 

JS 

1,00 

0,04 

0,05 

0,06 

0,00 

8,02 

OC 

0,21 

1,00 

0,30 

0,25 

0,09 

3,38 

6,04 

SI 

0,23 

0,55 

1,00 

0,31 

0,10 

3,82 

7,17 

9,50 

EP 

0,24 

0,50 

0,56 

1,00 

0,06 

3,88 

6,47 

7,75 

7,54 

AC 

0,05 

0,30 

0,31 

0,25 

1,00 

0,87 

4,83 

5,15 

4,20 

9,64 

Nota:  Valores  abaixo  da  diagonal  são  estimativas  de  correlação  com  valores-í  mostrados  em  itálico  na  linha  abaixo.  Os  valores-í  para  os  elementos  da  diagonal  são 
aqueles  para  os  termos  de  variância  de  construto.  Valores  acima  da  diagonal  são  correlações  quadradas. 


comportamento  organizacional  sugerem  que  geralmen¬ 
te  espera-se  que  avaliações  mais  favoráveis  de  todos  os 
construtos  produzam  resultados  positivos  de  emprega¬ 
dos.  Por  exemplo,  espera-se  que  esses  construtos  sejam 
positivamente  relacionados  se  um  empregado  deseja 
ficar  na  HBAT.  Além  disso,  é  mais  provável  que  empre¬ 
gados  satisfeitos  continuem  a  trabalhar  para  a  mesma 
companhia.  Mais  importante,  essa  relação  simplesmente 
faz  sentido. 


Correlações  entre  os  escores  fatoriais  para  cada  cons¬ 
truto  são  mostrados  na  Tabela  11-5.  Os  resultados  sus¬ 
tentam  a  previsão  de  que  esses  construtos  são  positiva¬ 
mente  relacionados  entre  si.  Especificamente,  satisfação, 
compromisso  organizacional,  percepções  ambientais  e 
atitudes  para  com  colegas  apresentam  correlações  po¬ 
sitivas  significantes  com  intenções  de  permanência.  Na 
verdade,  apenas  uma  correlação  é  inconsistente  com 

{Continua) 
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{Conlimmção) 

esta  previsão.  A  estimativa  de  correlação  entre  AC  e 
JS  é  positiva,  mas  não  significante  (í  =  0,87).  Como  as 
demais  correlações  são  consistentes,  esta  única  exceção 
não  é  uma  preocupação  importante. 


A  validade  nomológica  também  pode  ser  sustentada 
pela  demonstração  de  que  os  construtos  são  relacionados 
com  outros  construtos  não  incluídos  no  modelo  de  uma 
maneira  que  sustenta  a  estrutura  teórica.  Aqui  o  pesqui¬ 
sador  deve  escolher  construtos  adicionais  que  descrevam 
relações  fundamentais  na  estrutura  teórica  em  estudo. 


Além  das  variáveis  medidas  usadas  como  indicadores 
para  os  construtos,  diversas  variáveis  de  classificação  fo¬ 
ram  coletadas,  como  idade  do  empregado,  sexo  e  anos 
de  experiência.  Além  disso,  o  desempenho  de  cada  em¬ 
pregado  foi  avaliado  pela  administração  em  uma  escala 
de  5  pontos  que  varia  de  1  =  “Desempenho  Fraquíssi¬ 
mo”  a  5  =  “Desempenho  Excelente”.  A  administração 
forneceu  esta  informação  aos  consultores  que,  em  segui¬ 
da,  as  inseriram  no  banco  de  dados. 

As  demais  medidas  são  úteis  para  estabelecer  va¬ 
lidade  nomológica.  Pesquisa  anterior  sugere  que  de¬ 
sempenho  no  emprego  é  determinado  pelas  condições 
de  trabalho  de  um  empregado  [2,  43].  A  relação  entre 
desempenho  e  satisfação  com  o  trabalho  é  geralmente 
positiva,  mas  usualmente  não  é  uma  relação  forte.  Uma 
relação  positiva  entre  compromisso  e  desempenho  tam¬ 
bém  é  esperada.  Em  contrapartida,  a  relação  entre  de¬ 
sempenho  e  permanência  na  empresa  não  é  tão  clara. 
Empregados  com  melhor  desempenho  tendem  a  ter 
mais  oportunidades  de  trabalho  que  podem  cancelar  os 
efeitos  de  “empregados  com  melhor  desempenho  estão 
mais  confortáveis  com  o  trabalho”.  Uma  relação  positiva 
entre  percepção  ambiental  e  desempenho  no  trabalho  é 
esperada,  pois  as  condições  de  trabalho  de  alguém  con¬ 
tribuem  diretamente  em  como  este  alguém  desempenha 
uma  função.  Também  esperamos  que  experiência  seja 
associada  com  intenções  de  permanência.  Assim,  quan¬ 
do  intenções  de  permanência  são  maiores,  um  empre¬ 
gado  está  mais  propenso  a  ficar  em  uma  organização. 
Idade  e  intenções  de  permanência  provavelmente  não 


se  relacionam  fortemente.  Empregados  que  se  aproxi¬ 
mam  da  aposentadoria  são  relativamente  mais  velhos  e 
poderiam  possivelmente  relatar  intenções  menores  de 
permanecer.  Este  resultado  interfere  com  uma  relação 
positiva  entre  idade  e  intenções  de  permanência  que  po¬ 
deria,  porventura,  existir. 

Correlações  entre  esses  três  itens  e  os  escores  fato¬ 
riais  para  cada  construto  do  modelo  de  mensuração  fo¬ 
ram  computadas  usando-se  SPSS.  A  Tabela  f  1-6  mostra 
os  resultados.  Correlações  correspondendo  às  previsões 
feitas  no  parágrafo  anterior  podem  ser  comparadas  com 
os  resultados.  Esta  comparação  mostra  que  as  correla¬ 
ções  são  consistentes  com  as  expectativas  teóricas  des¬ 
critas.  Logo,  tanto  a  análise  das  correlações  entre  os 
construtos  do  modelo  de  mensuração  quanto  a  análise 
de  correlações  entre  esses  construtos  e  demais  variáveis 
sustentam  a  validade  nomológica  do  modelo. 


Modificação  do  modelo  de  medida 

Além  de  avaliar  estatísticas  de  qualidade  de  ajuste,  o  pes¬ 
quisador  deve  verificar  também  diversos  diagnósticos  de 
modelo.  Eles  podem  sugerir  alguma  forma  de  melhorar 
o  modelo  ou,  talvez,  alguma  área  específica  de  problema 
não  revelada  até  então.  As  seguintes  medidas  diagnósti¬ 
cas  de  CFA  devem  ser  verificadas. 

1.  Estimativas  de  caminho 

2.  Resíduos  padronizados 

3.  índices  de  modificação 

Estimativas  de  caminho 

A  SEM  fornece  estimativas  de  cada  caminho  especificado. 
Neste  caso,  a  ênfase  é  dada  nas  cargas  de  cada  indicador 
sobre  um  construto. 


Resultados  são  positivos  neste  ponto.  No  entanto,  mes¬ 
mo  com  boas  estatísticas  de  ajuste,  a  análise  da  HBAT  é 
bem  orientada  para  verificar  os  diagnósticos  de  modelo. 
As  estimativas  de  caminho  já  foram  examinadas.  Uma 
estimativa  de  carga  -  o  0,58  associado  com  OCl  -  foi 
notada  porque  ela  ficou  abaixo  do  corte  de  carga  de  0,7. 
Não  parecia  causar  problemas,  porém,  pois  o  ajuste  se 
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TABELA  11-6  Correlações  entre  construtos  e  idade,  experiência  e  desempenho  no  trabalho 


JS 

oc 

SI 

EP 

AC 

Desempenho  no  trabalho  (JP) 

0,15 

0,27 

0,10 

0,29 

0,06 

(0,003) 

(0,000) 

(0,041) 

(0,000) 

(0,216) 

Idade 

0,14 

0,12 

0,06 

-0,01 

0,15 

(0,005) 

(0,021) 

(0,233) 

(0,861) 

(0,003) 

Experiência  (EXP) 

0,08 

0,07 

0,15 

0,01 

0,12 

(0,110) 

(0,159) 

(0,004) 

(0,843) 

(0,018) 

Nota:  Valores-p  mostrados  entre  parênteses. 
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manteve  elevado.  Se  outra  informação  diagnóstica  suge¬ 
rir  um  problema  com  esta  variável,  alguma  ação  pode 
ser  necessária. 


Resíduos  padronizados 

O  resultado  de  SEM  pode  produzir  uma  lista  de  todos  os 
resíduos  e  resíduos  padronizados.  No  entanto,  esta  opção 
deve  geralmente  ser  requisitada  na  maioria  dos  programas 
de  SEM.  O  resultado  padrão  mostra  apenas  os  maiores 
resíduos,  ainda  que  um  termo  de  resíduo  seja  computado 
para  cada  termo  de  covariância  e  variância  na  matriz  de 
covariância  observada. 


Este  exemplo  inclui  231  resíduos.  Resíduos  padroni¬ 
zados  são  produzidos  para  cada  termo  de  covariância, 
resultando  em  210  resíduos  deste  tipo.  Não  mostramos 
todos  eles  aqui.  A  saída  padrão  convenientemente  exibe 
na  tela  os  resíduos  e  fornece  uma  lista  em  separado  dos 
maiores  resíduos  padronizados.  No  exemplo  da  HBAT, 
os  resíduos  padronizados  a  seguir  foram  identificados: 


Maiores  resíduos 

padronizados 

negativos : 

Resíduos  para 

SI3  e 

OCl 

-2,68 

Resíduos  para 

SI4  e 

OCl 

-2 , 74 

Resíduos  para 

EP3  e 

OCl 

-2 , 59 

Maiores  resíduos 

padronizados 

positivos : 

Resíduos  para 

SI2  e 

Sll 

3,80 

Resíduos  para 

SI4  e 

SI3 

3,07 

Resíduos  para 

EP2  e 

0C3 

2,98 

Resíduos  para 

EP4  e 

OC3 

2,88 

Resíduos  para 

EP4  e 

EP3 

3,28 

A  lista  inclui  todos  os  resíduos  padronizados  cujos 
valores  absolutos  excedem  12,51.  Nenhum  resíduo  padro¬ 
nizado  tem  seu  valor  absoluto  excedendo  14,01,  o  valor 
de  referência  que  pode  indicar  um  problema  com  uma 
das  medidas.  Aqueles  cujos  valores  absolutos  estiverem 
entre  12,51  e  14,01  também  podem  merecer  atenção  se  os 
outros  diagnósticos  igualmente  apontarem  um  proble¬ 
ma.  O  maior  resíduo  é  de  3,80  para  a  covariância  entre 
S12  e  Sll.  Ambas  as  variáveis  têm  uma  estimativa  de  car¬ 
ga  maior  do  que  0,8  sobre  o  SI.  Este  resíduo  pode  ser 
explicado  pelo  conteúdo  dos  itens.  Neste  caso,  SI2  e  Sll 
podem  ter  um  pouco  mais  em  comum  entre  si  em  termos 
de  conteúdo  do  que  cada  uma  em  relação  a  SI3  e  SI4,  os 
outros  dois  itens  que  representam  SI. 

O  analista  da  HBAT  decide  não  agir  neste  caso,  dada 
a  alta  confiabilidade  e  elevada  variância  extraída  para  o 
construto.  Além  disso,  o  ajuste  do  modelo  não  sugere 
uma  grande  necessidade  de  melhora.  Três  dos  mais  altos 
resíduos  negativos  são  associados  com  a  variável  OCl, 
a  qual  também  é  a  variável  com  a  menor  estimativa  de 
carga  (0,58).  Novamente,  nenhuma  ação  é  assumida  até 
este  ponto,  dados  os  resultados  positivos  gerais.  No  en¬ 
tanto,  se  o  valor  absoluto  de  um  resíduo  associado  com 


OCl  excedesse  4,0,  ou  se  o  ajuste  do  modelo  fosse  mar¬ 
ginal,  OCl  seria  um  forte  candidato  para  ser  descartado 
do  modelo.  Neste  caso,  a  representação  congênere,  que 
atende  aos  padrões  da  prática  da  boa  medição,  parece 
ajustar-se  bem. 


índices  de  modificação 

Se  a  opção  de  índice  de  modificação  (MI)  é  solicitada,  a 
saída  incluirá  uma  lista  de  índices  de  modificação,  com 
um  índice  para  cada  parâmetro  fixado.  Assim,  índices  de 
modificação  são  dados  para  cada  carga  fatorial  possível 
para  a  qual  nenhuma  estimativa  foi  obtida.  Analoga¬ 
mente,  um  índice  de  modificação  é  fornecido  para  cada 
elemento  de  variância-covariância  de  erro  fora  da  diago¬ 
nal,  com  todos  fixados  em  zero,  como  é  padrão  na  con¬ 
dução  da  CEA.  A  saída  inclui  também  uma  “mudança 
esperada”  para  cada  índice  de  modificação,  mostrando 
quanto  da  estimativa  do  parâmetro  mudaria  se  ele  fosse 
liberado.  Você  pode  perceber  que  muito  da  saída  é  pro¬ 
duzido  de  forma  rápida.  Não  obstante,  convenientemen¬ 
te,  a  maioria  dos  programas  SEM  lista  o  maior  índice  de 
modificação. 


Em  nosso  exemplo,  a  informação  a  seguir  é  dada: 

Máximo  índice  de  modificação  é  14,44  para 
elemento  (12  10)  de  THETA-DELTA 

Isso  é  associado  com  uma  covariância  de  erro  espe¬ 
cífica  (Sll  e  SI2).  Aqui,  a  fonte  da  melhora  potencial  é 
identificada  como  associada  com  THETA-DELTA,  a 
covariância  entre  termos  de  erro.  LISREL  identifica  a 
fonte  de  cada  MI  dessa  maneira.  AMOS  simplesmente 
lista  todos  os  MIs  associados  com  qualquer  covariância 
em  uma  só  lista.  Novamente,  MIs  são  fornecidos  para 
cada  parâmetro  fixado.  Isso  pode  então  ajudar  a  locali¬ 
zar  este  valor  específico  na  lista  de  MIs,  sendo  que  uma 
pequena  parte  disso  é  mostrada  aqui: 

índices  de  modificação  para  THETA-DELTA 


OC2 

OC3 

OC4 

Sll 

SI2 

SI3 

OC2 

-  - 

OG3 

6,10 

- 

- 

0C4 

0,28 

1 

,41 

- 

- 

Sll 

0,28 

2 

,56 

0 

,30 

-  - 

SI2 

3,57 

0 

,  08 

1 

,72 

14,44 

-  - 

SI3 

0,00 

0 

,29 

0 

,44 

1, 97 

1,82 

-  - 

SI4 

0, 01 

0 

,  91 

1 

,69 

5,77 

3,08 

9,42 

Um  índice  de  modificação  grande  assim  sugere  que  o 
ajuste  pode  ser  melhorado  liberando-se  o  parâmetro  de 
covariância  de  erro  correspondente  entre  os  termos  de 
erro  para  as  variáveis  medidas  SH  e  SI2.  O  tamanho  da 
estimativa  de  parâmetro  que  resultaria  se  este  elemento 

(Continua) 
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(Continuação) 

fosse  liberado  é  mostrado  nas  listas  de  mudanças  espera¬ 
das.  Uma  pequena  parte  é  dada  aqui: 


Mudança  esperada  completamente  padronizada 
para  THETA-DELTA 


OC2 

OC3 

OC4 

SIl 

SI2 

SI3 

OC2 

-  - 

OC3 

-0,31 

-  - 

OC4 

-0 , 11 

0, 

,  14 

-  - 

SIl 

0,02 

-0, 

,  06 

0  , 

,  02 

-  - 

SI2 

0 , 07 

0, 

,  01 

-0, 

,  05 

0,08 

-  - 

SI3 

0,00 

-0, 

,03 

-0, 

,  03 

-0,03 

-0,03 

-  - 

SI4 

0,00 

-0, 

,  04 

0, 

,  05 

-0,05 

1 

O 

O 

0, 08 

A  mudança  esperada  mostra  que  liberar  o  parâmetro 
entre  SIl  e  SI2  produziria  uma  mudança  na  estimativa 
completamente  padronizada  de  0,08.  Como  é  fixada  em 
zero  em  nosso  modelo  CFA,  a  mudança  esperada  tam¬ 
bém  significa  que  a  estimativa  do  parâmetro  seria  de 
0,08.  Logo,  é  muito  pequena  relativamente  às  estimati¬ 
vas  de  carga  para  SIl  e  SI2.  Além  disso,  não  recomenda¬ 
mos  a  liberação  de  termos  de  covariância  de  erro,  pois 
isso  viola  os  princípios  da  boa  medição.  O  fato  de  que  o 
ajuste  é  bom,  junto  com  a  evidência  de  validade  de  cons- 
truto,  sugere  que  nenhuma  mudança  se  faz  necessária. 

Uma  busca  de  especificação  posterior  também  é 
desnecessária.  Além  disso,  uma  busca  de  especificação 
automática  não  é  necessária  porque  o  modelo  tem  uma 
sólida  fundamentação  teórica,  e  porque  a  CFA  está 
testando,  e  não  desenvolvendo  um  modelo.  Se  o  ajuste 
fosse  ruim,  porém,  uma  busca  de  especificação  poderia 
ser  feita,  como  anteriormente  descrito  neste  capítulo. 
Tal  esforço  se  valeria  consideravelmente  dos  diagnósti¬ 
cos  combinados  fornecidos  pelas  estimativas  de  cargas 
fatoriais,  pelos  resíduos  padronizados  e  pelos  índices 
de  modificação.  Entre  esses,  os  resíduos  padronizados 
freqüentemente  se  mostram  muito  úteis.  Neste  ponto,  a 
HBAT  pode  prosseguir  com  a  confiança  de  que  o  ques¬ 
tionário  mede  bem  esses  construtos  fundamentais. 


Resumo 


Quatro  estágios  de  SEM  estão  completos.  Os  resultados 
de  CFA,  em  geral,  sustentam  o  modelo  de  mensuração. 
A  estatística  é  significante  acima  do  nível  de  0,01,  o 
que  não  é  incomum,  dada  uma  amostra  total  de  400  (com 
um  tamanho  amostrai  efetivo  de  399  usando  a  aborda¬ 
gem  totalmente  disponível).  Tanto  CFI  quanto  RMSEA 
parecem  bastante  bons.  No  geral,  as  estatísticas  de  ajuste 
sugerem  que  o  modelo  estimado  reproduz  a  matriz  de 
covariância  amostrai  razoavelmente  bem.  Além  disso, 
há  evidência  de  validade  de  construto  em  termos  de  va¬ 
lidade  convergente,  discriminante  e  nomológica.  Assim, 
a  HBAT  pode  estar  razoavelmente  confiante,  neste  pon¬ 


to,  de  que  as  medidas  se  comportam  como  deveriam  em 
termos  de  unidimensionalidade  das  cinco  medidas  e  na 
maneira  como  os  construtos  se  relacionam  com  outras 
medidas.  Lembre-se,  porém,  que  mesmo  um  bom  ajus¬ 
te  não  é  garantia  de  que  alguma  outra  combinação  das 
21  variáveis  medidas  não  forneceria  um  ajuste  igual  ou 
melhor.  O  fato  de  que  os  resultados  são  conceitualmente 
consistentes  é  até  mesmo  de  maior  importância  do  que 
os  resultados  de  ajuste  em  si. 


TÓPICOS  AVANÇADOS  EM  CFA 

Esta  seção  cobre  alguns  tópicos  importantes  que  estão 
além  do  teste  de  um  modelo  convencional  de  mensuração. 
Os  assuntos  incluem  modelos  fatoriais  de  ordem  superior, 
testes  de  diferenças  ao  longo  de  múltiplos  grupos,  viés  de 
mensuração,  e  parcelamento  de  itens.  Essas  discussões 
são  então  seguidas  de  várias  ilustrações  empíricas  dos  tó¬ 
picos,  utilizando  a  base  de  dados  HBAT_SEM. 

Análise  fatorial  de  ordem  superior 

O  modelo  CFA  descrito  na  Figura  11-4  é  um  modelo  fato¬ 
rial  de  primeira  ordem.  Temos  um  modelo  fatorial  de  pri¬ 
meira  ordem  quando  as  covariâncias  entre  itens  medidos 
são  explicadas  com  uma  única  camada  de  fatores  latentes. 
Por  enquanto,  pense  em  uma  camada  como  um  nível  de 
construtos  latentes. 

Pesquisadores  cada  vez  mais  empregam  análises  fato¬ 
riais  de  ordem  superior,  apesar  de  este  aspecto  da  teoria 
de  mensuração  não  ser  novo  [29].  CF  As  de  ordem  superior 
freqüentemente  testam  uma  estrutura  fatorial  de  segunda 
ordem  que  contém  duas  camadas  de  construtos  latentes. 
Elas  introduzem  um  fator  latente  de  segunda  ordem  que 
é  a  causa  de  múltiplos  fatores  latentes  de  primeira  ordem, 
os  quais,  por  sua  vez,  são  a  causa  das  variáveis  medidas 
(x).  Teoricamente,  este  processo  pode  ser  estendido  para 
qualquer  quantia  de  camadas.  Daí  o  termo  análise  fatorial 
de  ordem  superior.  Pesquisadores  raramente  investigam 
teorias  além  de  um  modelo  de  segunda  ordem.  A  Figura 
11-10  contrasta  os  diagramas  de  caminhos  de  um  modelo 
fatorial  convencional  de  primeira  ordem  com  uma  cama¬ 
da  na  parte  (a)  e  com  um  modelo  fatorial  de  segunda  or¬ 
dem  com  duas  camadas  na  parte  (b)  [4]. 

Preocupações  de  ordem  empírica 

Tanto  considerações  teóricas  quanto  empíricas  estão  as¬ 
sociadas  com  CFA  de  ordem  superior.  Todos  os  modelos 
CFA  devem  explicar  relações  entre  construtos.  Empiri¬ 
camente,  fatores  de  ordem  superior  podem  ser  pensados 
como  uma  maneira  de  explicar  covariância  entre  constru¬ 
tos  da  mesma  forma  que  fatores  de  primeira  ordem  expli¬ 
cam  covariação  entre  variáveis  observadas  [4].  A  Figura 
11-lOa  mostra  um  modelo  fatorial  convencional  com  seis 
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(b)  Modelo  de  segunda  ordem 


Legenda: 

Fatores  de  primeira  ordem: 

T]  =  R&T  (Percepções  de  responsabilidade  e  confiança) 

T]'  =  PB  (Percepções  comportamentais  de  colegas) 

=  EN  (Percepções  de  normas  éticas) 

Tl“  =  SP  (Percepções  de  práticas  de  vendas) 

4 

Fatores  de  segunda  ordem: 

=  EC  (Clima  ético) 

FIGURA  11-10  Contraste  de  diagramas  de  caminhos  para  uma  teoria  de  mensuração  de  primeira  e  de  segunda  ordem. 

Nota:  Termos  de  erro  não  são  mostrados  para  fins  de  simplificação.  Cada  caminho  de  um  fator  de  primeira  ordem  para  um  item  medido  também  tem  uma 
estimativa  correspondente  de  carga  (X),  que  não  é  exibida. 


covariâncias  entre  quatro  fatores  latentes  (<l>2  j .  .  .  <&4.3)- 
Em  um  modelo  CFA  de  primeira  ordem,  esses  termos  de 
covariância  deveriam  ser  livres  (estimados),  a  não  ser  que 
o  pesquisador  tenha  uma  forte  razão  para  teorizar  dimen¬ 
sões  independentes.  O  pressuposto  básico  é  de  relações 
entre  construtos.  Essas  relações  se  tornam  o  principal  in¬ 
teresse  quando  passamos  de  CFA  para  SEM  no  Capítulo 
12.  Um  modelo  de  mensuração  de  primeira  ordem  explica 
essas  relações  simplesmente  estimando  cada  uma  direta¬ 
mente  via  elementos  livres  em  uma  matriz  de  covariância/ 
correlação  de  construtos  (setas  em  dois  sentidos). 

Em  contrapartida,  um  modelo  fatorial  de  segunda  or¬ 
dem  explica  covariação  entre  construtos  especificando  ou¬ 
tro  fator  de  ordem  superior  ou  fatores  que  causam  fatores 
de  primeira  ordem.  Em  outras  palavras,  os  fatores  de  pri¬ 
meira  ordem  agora  atuam  como  indicadores  do  fator  de 
segunda  ordem.  A  Figura  11-lOb  descreve  um  fator  de  se¬ 
gunda  ordem  (EC)  que  explica  quatro  fatores  de  primeira 
ordem  (R&T,  PB,  EN  e  SP),  cada  um  indicado  por  quatro 


itens  reflexivos.  Todas  as  considerações  e  regras  práticas 
(itens  por  fator,  identificação,  escala  etc.)  se  aplicam  a  fa¬ 
tores  de  segunda  ordem,  assim  como  se  faz  com  os  de  pri¬ 
meira  ordem;  só  que  agora  o  pesquisador  deve  considerar 
os  construtos  de  primeira  ordem  como  indicadores  do  de 
segunda  ordem. 

Preocupações  de  caráter  teórico 

Teoricamente,  às  vezes  construtos  podem  ser  operaciona- 
lizados  em  diferentes  níveis  de  abstração.  Cada  camada 
na  Figura  11-lOb  se  refere  a  um  nível  diferente  de  abs¬ 
tração.  Discutimos  dois  exemplos  que  ilustram  o  papel  de 
fatores  de  segunda  ordem. 


Muitos  construtos  psicológicos  podem  ser  representados 
em  diferentes  níveis  de  abstração.  Personalidade  pode 
ser  representada  por  numerosos  fatores  de  primeira  or¬ 
dem  relacionados  entre  si.  Cada  um  pode  ser  medido 
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usando-se  dúzias  de  escalas  de  múltiplos  itens  que  fazem 
uso  de  uma  dimensão  específica  de  personalidade.  Cons- 
trutos  psicológicos  incluem  escalas  para  ansiedade,  pes¬ 
simismo,  criatividade,  imaginação  e  auto-estima,  entre 
muitas  outras.  Alternativamente,  os  fatores  de  primeira 
ordem  podem  ser  vistos  como  indicadores  de  um  con¬ 
junto  menor  de  fatores  de  ordem  superior  mais  abstratos 
que  refletem  orientações  de  personalidade  mais  abstra¬ 
tas  e  amplas,  como  extroversão,  neurose,  consciência, 
concordância  e  intelecto  [10,  45].  Estes  construtos  mais 
abstratos  de  personalidade  são,  às  vezes,  conhecidos 
como  os  “cinco  grandes”  fatores  de  personalidade. 

Analogamente,  pode-se  imaginar  que  muitos  fatores 
distintos  podem  indicar  o  desempenho  de  alguém  em 
um  curso  de  pós-graduação.  Múltiplos  indicadores  de 
um  teste  padronizado  poderiam  ser  usados  para  repre¬ 
sentar  desempenhos  verbal  e  quantitativo,  entre  outras 
características  de  exames.  Múltiplos  itens  também  po¬ 
deriam  ser  utilizados  para  avaliar  o  desempenho  de  um 
candidato  na  escola,  incluindo  GPAs  no  ensino  superior, 
GPAs  no  ensino  médio,  e  talvez  outros  instrumentos  de 
avaliação  que  fazem  uso  de  notas.  Poderíamos  usar  tam¬ 
bém  escalas  de  múltiplos  itens  para  avaliarmos  a  motiva¬ 
ção  de  uma  pessoa  para  ser  bem  sucedida  na  pós-gradu¬ 
ação.  Uma  vez  que  concluímos  isso,  podemos  finalizar 
com  umas  poucas  dúzias  de  variáveis  indicadoras  para 
diversos  fatores  como  compreensão  de  leituras,  habili¬ 
dade  quantitativa,  resolução  de  problemas,  desempenho 
escolar  e  desejo.  Cada  um  desses  aspectos  é  por  si  só  um 
fator.  Contudo,  todos  eles  podem  ser  conduzidos  por  um 
fator  de  ordem  superior  que  poderíamos  rotular  como 
“Possibilidade  de  sucesso”.  Pode  ser  difícil  olhar  as  cre¬ 
denciais  de  alguém  e  avaliar  diretamente  a  possibilidade 
de  sucesso.  No  entanto,  isso  pode  ser  muito  bem  indica¬ 
do  por  fatores  mais  tangíveis,  como  a  habilidade  de  re¬ 
solver  problemas.  No  final,  decisões  importantes  podem 
ser  tomadas  com  base  no  fator  de  sucesso  mais  abstrato, 
e,  espera-se,  tais  decisões  serão  melhores  do  que  confiar 
nos  fatores  individuais  mais  específicos.  Assim,  os  fato¬ 
res  individuais  são  de  primeira  ordem,  e  Possibilidade 
de  Sucesso  poderia  ser  considerado  como  um  fator  de 
segunda  ordem.  Este  tipo  de  situação  requer  o  teste  de 
um  modelo  CFA  de  segunda  ordem. 


Jamais  é  exagerado  afirmar  que  o  critério  final  para 
decidir  formar  um  modelo  de  mensuração  de  segunda  or¬ 
dem  é  teoria.  Isso  faz  sentido  teórico?  Quais  são  as  razões 
lógicas  que  nos  levam  a  esperar  por  camadas  de  constru¬ 
tos?  O  crescente  número  de  modelos  fatoriais  de  segunda 
ordem  percebidos  na  literatura  é  parcialmente  o  resultado 
de  mais  pesquisadores  aprendendo  a  usar  SEM  para  re¬ 
presentar  e  testar  uma  estrutura  fatorial  de  ordem  supe¬ 
rior.  A  habilidade  de  conduzir  um  teste  de  segunda  ordem 
não  é  justificativa  para  fazê-lo.  A  necessidade  de  teoria  é 
particularmente  verdadeira  quando  se  tenta  decidir  entre 


uma  configuração  fatorial  de  primeira  e  de  segunda  or¬ 
dem  para  uma  dada  teoria  de  mensuração. 

Uso  de  teorias  de  mensuração  de  segunda  ordem 

A  especificação  de  um  modelo  CFA  de  segunda  ordem 
é,  na  verdade,  bastante  parecida  com  a  de  um  modelo  de 
primeira  ordem,  se  olharmos  os  construtos  de  primeira 
ordem  como  indicadores.  Modelos  fatoriais  de  primei¬ 
ra  ordem  explicam  covariância  entre  construtos  latentes 
melhor  do  que  uma  representação  de  ordem  superior  dos 
mesmos  dados.  Considerando  a  Figura  11-lOa,  o  modelo 
de  primeira  ordem  estima  uma  relação  (um  caminho  de 
dois  sentidos,  neste  caso)  para  cada  covariância  em  po¬ 
tencial.  O  modelo  de  ordem  superior  na  Figura  11-lOb 
explica  essas  seis  relações  com  quatro  cargas  fatoriais.  A 
despeito  de  a  comparação  entre  um  modelo  de  mensura¬ 
ção  de  primeira  ordem  e  um  de  segunda  ser  geralmente 
por  acoplamento,  a  comparação  empírica  usando  uma 
estatística  Ax^  não  é  tão  útil  quanto  a  comparação  entre 
modelos  de  mensuração  concorrentes  de  mesma  ordem 
[36].  O  modelo  de  primeira  ordem  sempre  se  ajustará  me¬ 
lhor  em  termos  absolutos,  pois  ele  usa  mais  caminhos  para 
capturar  o  mesmo  tanto  de  covariância. 

Em  compensação,  o  modelo  de  ordem  superior  é  mais 
parcimonioso  (ele  consume  menos  graus  de  liberdade). 
Fogo,  ele  deve  desempenhar  melhor  em  índices  que  re¬ 
fletem  parcimônia  (PNFI,  RMSEA  etc.).  Note,  porém, 
que  ainda  que  um  modelo  de  ordem  superior  seja  mais 
parcimonioso  do  ponto  de  vista  de  graus  de  liberdade, 
ele  não  é  “mais  simples”,  pois  envolve  múltiplos  níveis 
de  abstração.  Isso  complica  comparações  empíricas  e, 
assim,  coloca  maior  peso  sobre  preocupações  teóricas  e 
pragmáticas. 

Exatamente  como  foi  exigido  na  especificação  de  cada 
construto  de  primeira  ordem,  a  escala  deve  ser  definida 
para  o  construto  de  segunda  ordem  também.  A  modela¬ 
gem  das  covariâncias  com  caminhos  de  quatro  cargas  fa¬ 
toriais  poderia  tomar  três  ou  quatro  graus  de  liberdade, 
dependendo  de  como  a  escala  fatorial  foi  definida.  Uma 
estimativa  de  carga  (como  Xj  j,  o  caminho  de  EC  para 
R&T)  pode  ser  fixada  em  I,  para  definir  a  escala.  Alterna¬ 
tivamente,  todas  as  quatro  estimativas  de  cargas  fatoriais 
podem  ser  livres  se  a  variância  do  fator  de  segunda  ordem 
for  fixada  em  I. 

Modelos  de  mensuração  de  ordem  superior  também 
ainda  são  sujeitos  a  padrões  de  validade  de  construto.  Em 
particular,  fatores  de  segunda  ordem  devem  ser  rigorosa¬ 
mente  examinados  quanto  a  validade  nomológica,  pois  é 
possível  que  várias  explicações  confusas  possam  existir 
para  um  fator  de  ordem  superior.  Por  exemplo,  se  todas 
as  medidas  de  itens  usam  o  mesmo  tipo  de  escala  de  ava¬ 
liação,  poderia  haver  um  fator  comum  entre  métodos  in¬ 
fluenciando  todos  os  construtos  de  primeira  ordem.  O  fa¬ 
tor  de  segunda  ordem  poderia  ser  interpretado  como  um 
viés  comum  de  medição,  neste  caso.  Se  o  fator  de  segunda 
ordem  reage  a  outros  construtos  teóricos  como  o  espera- 
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do,  a  chance  de  ele  ser  deste  tipo  é  menor.  Mais  especi¬ 
ficamente,  se  o  fator  de  ordem  superior  explica  resulta¬ 
dos  teoricamente  relacionados,  como  comprometimento 
organizacional  e  satisfação  com  emprego,  de  forma  tão 
eficaz,  ou  até  melhor,  do  que  faz  o  conjunto  combinado 
de  fatores  de  primeira  ordem,  então  há  evidência  em  fa¬ 
vor  da  representação  de  ordem  superior  [36].  Assim,  um 
critério  fundamental  de  validação  se  torna  uma  medida 
do  quão  bem  um  fator  de  ordem  superior  explica  teori¬ 
camente  construtos  relacionados.  Quando  se  comparam 
modelos  de  mensuração  de  ordens  distintas,  um  modelo 
de  segunda  ordem  é  sustentado  na  medida  em  que  ele 
mostra  maior  validade  nomológica  do  que  um  modelo  de 
primeira  ordem. 

Quando  usar  análise  fatorial  de  ordem  superior 

Apesar  de  modelos  de  mensuração  de  ordem  superior  po¬ 
derem  parecer  que  têm  muitas  vantagens,  devemos  tam¬ 
bém  considerar  as  desvantagens.  Com  freqüência,  eles  são 
conceitualmente  mais  complicados.  Um  construto  pode  se 
tornar  tão  abstrato  que  é  difícil  descrever  adequadamente 
seu  significado.  A  complexidade  adicionada  pode  também 
diminuir  o  valor  diagnóstico  de  um  construto  à  medida 
que  ele  fica  mais  afastado  dos  itens  medidos  tangíveis. 
Modelos  CFA  de  ordem  superior  criam  também  mais  so¬ 
luções  potenciais  CFA  impróprias  ou  não-identificadas. 
Por  exemplo,  pesquisadores  podem  ter  um  ou  mais  fato¬ 
res  de  ordem  superior  com  menos  de  três  indicadores. 

Com  um  modelo  fatorial  reflexivo  de  segunda  ordem 
ou  de  ordem  maior,  todos  os  fatores  de  primeira  ordem, 
que  agora  são  indicadores  do  fator  de  segunda  ordem,  de¬ 
vem  se  mover  juntos,  assim  como  acontece  com  os  itens 
medidos  que  indicam  fatores  de  primeira  ordem.  Quan¬ 
do  múltiplos  fatores  de  primeira  ordem  são  usados  como 
indicadores  de  um  fator  de  segunda  ordem,  o  pesquisa¬ 
dor  abre  mão  da  habilidade  de  testar  relações  entre  esses 
fatores  de  primeira  ordem  e  outros  construtos  importan¬ 
tes.  Assim,  uma  desvantagem  do  modelo  de  mensuração 
mostrado  na  Figura  11-lOb  é  que  não  podemos  investigar, 
por  exemplo,  relações  entre  comportamentos  de  colegas 
e  outros  resultados  importantes  de  trabalho,  como  ro¬ 
tatividade.  Além  disso,  o  pressuposto  é  de  que  todos  os 
quatro  indicadores  de  primeira  ordem  influenciariam  na 
rotatividade  da  mesma  maneira.  Se  um  caso  conceituai 
pudesse  ser  enunciado  de  maneira  que  um  desses  fatores 
de  primeira  ordem  afetaria  outro  construto  importante  di¬ 
ferentemente,  então  talvez  uma  teoria  de  mensuração  de 
segunda  ordem  não  devesse  ser  usada.  Este  caso  é  tipifica¬ 
do  quando  se  esperasse  que  um  conjunto  de  construtos  re¬ 
lacionados  afetasse  positivamente  algum  outro  construto 
enquanto  outros  o  afetariam  negativamente. 

Algumas  questões  que  podem  ajudar  a  determinar  se 
um  modelo  de  mensuração  de  ordem  superior  é  adequado 
são  listadas  aqui: 

1.  Existe  um  motivo  teórico  para  esperar  que  existem  camadas 

conceituais  de  um  construto? 


2.  Espera-se  que  todos  os  fatores  de  primeira  ordem  influen¬ 
ciem  outros  construtos  nomologicamente  relacionados  da 
mesma  maneira? 

3.  Os  fatores  de  ordem  superior  serão  usados  para  prever  ou¬ 
tros  construtos  do  mesmo  nível  geral  de  abstração  (ou  seja, 
personalidade  global  -  atitudes  globais)? 

4.  As  condições  mínimas  para  identificação  e  prática  da  boa 
mensuração  estão  presentes  em  camadas  de  primeira  ordem 
e  de  ordem  superior  da  teoria  de  mensuração? 

Se  a  resposta  a  cada  uma  dessas  questões  for  positiva, 
então  um  modelo  de  mensuração  de  ordem  superior  se 
torna  aplicável.  Depois  de  testar  empiricamente  modelos 
de  ordem  superior,  as  perguntas  a  seguir  devem  ser  res¬ 
pondidas. 

1.  O  modelo  fatorial  de  ordem  superior  apresenta  ajuste  ade¬ 
quado? 

2.  Os  fatores  de  ordem  superior  prevêem  adequadamente  ou¬ 
tros  construtos  conceitualmente  relacionados  e  de  forma 
esperada? 

3.  Quando  se  compara  com  um  modelo  de  ordem  menor,  o  de 
ordem  superior  exibe  validade  preditiva  igual  ou  melhor? 

Novamente,  se  as  respostas  a  tais  questões  forem  todas 
positivas,  então  uma  teoria  de  ordem  superior  será  supor¬ 
tada. 

Grupos  múltiplos  em  CFA 

Numerosas  aplicações  de  CFA  envolvem  a  análise  de  gru¬ 
pos  de  respondentes.  Grupos  são,  por  vezes,  formados  a 
partir  de  uma  amostra  geral  dividindo-a  de  acordo  com 
uma  característica  lógica  significativa  como,  digamos,  uma 
importante  diferença  individual,  como  sexo.  Por  exemplo, 
podemos  esperar  que  homens  e  mulheres  possam  não  res¬ 
ponder  semelhantemente  a  uma  vasta  gama  de  questões 
de  caráter  social.  Alternativamente,  uma  grande  amostra 
pode  ser  dividida  ao  acaso  em  duas  sub-amostras,  de  for¬ 
ma  que  uma  validação  cruzada  possa  ocorrer.  Mas  grupos 
não  são  sempre  separados  após  o  fato.  Muitas  vezes,  di¬ 
ferentes  populações  têm  amostras  coletadas  com  a  meta 
final  de  testar  similaridades  e  diferenças  entre  tais  popu¬ 
lações.  Por  exemplo,  as  populações  podem  envolver  pes¬ 
soas  de  culturas  distintas. 

Modelos  de  grupos  múltiplos  podem  ser  acomodados 
em  uma  estrutura  CFA  e  testados  usando-se  SEM.  Diver¬ 
sas  preocupações  extras  afetam  a  validade  de  modelos  de 
múltiplos  grupos  e  os  resultados  de  quaisquer  conclusões 
subseqüentes  referentes  aos  grupos.  Discutimos  essas 
questões  primeiramente  no  contexto  de  validação  cruzada 
e  então  as  estendemos  para  cobrir  outras  situações. 

Validação  cruzada 

Validação  cruzada  é  uma  tentativa  de  reproduzir  os  resul¬ 
tados  encontrados  em  uma  amostra  usando  dados  de  uma 
amostra  diferente.  Em  termos  gerais,  a  validação  cruzada 
usa  duas  amostras  obtidas  da  mesma  população.  Em  ou¬ 
tras  palavras,  as  unidades  de  amostragem  em  cada  grupo 
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teriam  as  mesmas  características.  Validação  cruzada  tem 
muitos  usos  em  CFA.  Talvez  a  aplicação  mais  básica  seja 
fornecer  uma  segunda  confirmação  de  uma  teoria  de  men- 
suração  que  sobreviveu  a  um  teste  inicial.  Uma  maneira 
de  atingir  tal  objetivo  é  dividir  uma  grande  amostra  ale¬ 
atoriamente  em  dois  grupos  de  forma  que  cada  amostra 
atenda  às  exigências  de  tamanho  mínimo  discutidas  ante¬ 
riormente.  Uma  abordagem  CFA  de  múltiplos  grupos  nos 
permite  entender  completamente  a  extensão  em  que  os 
resultados  são  os  mesmos  em  ambos  os  grupos. 

A  Figura  11-11  ajuda  a  ilustrar  testes  CFA  de  dois  gru¬ 
pos  ou  duas  amostras.  Ela  descreve  um  modelo  de  men- 
suração  de  três  construtos  que  se  imagina  existirem  em 
duas  amostras  ou  grupos.  Para  fins  de  validação  cruzada, 
o  grupo  1  pode  ser  pensado  como  uma  amostra  inicial 
usada  para  testar  o  modelo  CFA  de  três  construtos.  Tal¬ 
vez  o  teste  inicial  envolvesse  até  mesmo  um  refinamento 
menor,  como  a  eliminação  de  uma  ou  duas  variáveis  não 
mostradas  aqui.  O  grupo  2  pode  ser  imaginado  como  uma 
amostra  subseqüente  utilizada  para  fazer  validação  cruza¬ 
da  com  o  modelo  original.  Os  parâmetros  envolvidos  na 
validação  cruzada  serão  as  estimativas  de  carga  (\^),  as 
correlações  entre  construtos  («F)  e  a  variância  associada 
com  os  termos  de  erro  (chamada  de  Gg). 

O  modelo  de  mensuração  proposto  é  um  arranjo  con¬ 
gênere  padrão.  Como  anteriormente  observado,  uma 
estimativa  de  carga  para  cada  fator,  ou  as  variâncias  fa¬ 


toriais,  seriam  fixadas  em  1  na  estimação  do  modelo.  To¬ 
dos  os  demais  parâmetros  exibidos  seriam  estimados.  O 
modelo  resultante  teria  51  graus  de  liberdade.  A  fórmu¬ 
la  mostrada  anteriormente  pode  ser  usada  para  verificar 
este  número. 

Comparação  de  grupos 

Agora  voltamos  nossa  atenção  para  vários  testes  que  in¬ 
dicam  o  grau  em  que  uma  amostra  produz  os  mesmos 
resultados  que  outra  amostra.  É  importante  observar 
que  validação  cruzada  não  fornece  uma  resposta  do  tipo 
“sim  ou  não”  sobre  o  quão  bem  resultados  são  reprodu¬ 
zidos  em  uma  amostra  independente.  Validação  cruzada 
é  mais  uma  questão  de  grau  que  pode  ser  determinado 
pela  aplicação  de  uma  série  de  testes  progressivamente 
mais  rigorosos  ao  longo  de  amostras  [9,  35].  A  lista  a  se¬ 
guir  inclui  testes  típicos  que  vão  dos  menos  para  os  mais 
rigorosos. 

1.  Validação  cruzada  solta.  Com  validação  cruzada  solta,  o 
mesmo  modelo  CFA  usado  com  a  amostra  original  é  im¬ 
posto  sobre  a  amostra  de  validação.  Uma  CFA  é  então  con¬ 
duzida  usando  somente  a  amostra  de  validação.  Assim,  o 
modelo  de  CFA  mostrado  para  o  grupo  2  na  Figura  11-11  é 
testado  como  se  mostra.  Se  a  CFA  se  ajusta  bem  aos  dados 
do  grupo  2,  tem-se  evidência  de  validação  cruzada.  Vale  no¬ 
tar  que  ambos  os  modelos  terão  o  mesmo  número  de  graus 
de  liberdade,  pois  a  mesma  estrutura  fatorial  é  empregada. 


Grupo  1 


Grupo  2 


ôg  8^0  8^,  8,2 


FIGURA  11-11  Um  modelo  fatorial  de  dois  grupos  padrão. 
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Nenhuma  comparação  de  ajuste  é  feita  entre  os  grupos  1  e 

2.  Ao  invés  disso,  o  ajuste  deve  ser  aceitável  em  ambos  os 
grupos  separadamente,  para  se  prosseguir  com  confiança. 

2.  Matrizes  equivalentes  de  covariância.  As  vezes,  os  pesqui¬ 
sadores  conduzem  um  teste  de  equivalência  para  determi¬ 
nar  se  os  dois  grupos  apresentam  matrizes  de  covariância 
equivalentes.  Teoricamente,  este  teste  é  redundante  rela¬ 
tivamente  aos  testes  abaixo,  no  sentido  de  que  se  as  duas 
matrizes  de  covariância  forem  idênticas,  então  os  resultados 
de  CFA  também  devem  ser  idênticos.  A  utilidade  e  o  valor 
diagnóstico  deste  teste  têm  sido  questionados  [37].  Pesqui¬ 
sadores  geralmente  prosseguem  para  os  próximos  testes, 
não  importando  o  resultado  deste.  Logo,  vamos  para  os  tes¬ 
tes  mais  específicos. 

3.  Equivalência  de  estrutura  fatorial.  Os  testes  a  seguir  envol¬ 
vem  a  estimação  simultânea  de  modelos  de  CFA  usando  da¬ 
dos  de  ambos  os  grupos.  Em  terminologia  SEM,  o  número 
de  grupos  (NG)  agora  é  dois.  Logo,  matrizes  separadas  de 
covariância,  uma  para  cada  grupo,  são  computadas  como 
um  ponto  de  partida  para  os  próximos  testes.  Agora,  testa¬ 
mos  o  mesmo  modelo  CFA  quanto  aos  dois  grupos  simulta¬ 
neamente.  Em  outras  palavras,  apenas  a  estrutura  fatorial 
é  restrita  entre  grupos.  Este  modelo  é,  às  vezes,  chamado 
de  modelo  totalmente  livre  de  múltiplos  grupos  (TF),  pois 
todas  as  estimativas  mostradas  (\,  <I>,  0^)  são  livremente 
estimadas  em  cada  amostra.  Os  valores,  portanto,  podem 
ser  diferentes  entre  grupos.  O  importante  valor  x  e  as  cor¬ 
respondentes  estatísticas  de  ajuste  agora  se  referem  a  quão 
bem  o  modelo  ajusta  ambas  as  matrizes  de  covariância.  Um 
resultado  é  que  os  graus  de  liberdade  associados  com  este 
modelo  são  o  dobro  do  que  ocorre  na  correspondente  CFA 
de  um  grupo.  A  Figura  11-11  descreve  uma  CFA  de  dois 
grupos  que  teria  102  graus  de  liberdade.  De  fato,  poder-se- 
ia  juntar  ambos  os  valores  x  e  graus  de  liberdade  dos  resul¬ 
tados  individuais  de  CFA  de  um  grupo,  e  isso  corresponde¬ 
ria  ao  resultado  de  dois  grupos.  Esta  abordagem,  algumas 
vezes,  é  uma  maneira  útil  de  verificar  erros  na  especificação 
do  modelo  de  dois  grupos.  Se  os  índices  resultantes  de  ajus¬ 
te  para  a  CFA  de  dois  grupos  são  adequados,  então  há  pelo 
menos  mínima  evidência  de  validação  cruzada.  Este  teste  é, 
às  vezes,  conhecido  como  invariância  de  configuração. 

4.  Equivalência  de  carga  fatorial.  Este  teste  restringe  as  esti¬ 
mativas  de  carga  a  serem  iguais  em  cada  grupo.  Pense  nis¬ 
so  como  uma  restrição  em  termos  de  igualdade  que  força 
cada  estimativa  de  carga  no  grupo  2  a  ser  igual  à  estimativa 
no  grupo  1.  Assim,  esta  restrição  poupa  tantos  graus  de  li¬ 
berdade  quanto  há  estimativas  de  cargas  livres  no  modelo 
original.  Outra  maneira  é  pensar  na  matriz  de  cargas  como 
invariante,  o  que  significa  a  mesma  em  cada  grupo.  Pode- 
se  agora  examinar  a  estatística  de  ajuste  do  novo  modelo 
para  avaliar  a  validade  dele.  Além  disso,  pode-se  computar 
uma  ísx  (variação  no  qui-quadrado)  entre  este  modelo  e  o 
modelo  TF  (a  referência).  Se  ísx  for  significante,  então  as 
restrições  acrescentadas  significativamente  pioraram  o  ajus¬ 
te.  Se  não  for  significante,  restringir  as  estimativas  de  cargas 
não  piora  o  ajuste,  e  assim  se  tem  uma  maior  evidência  de 
validação  cruzada. 

5.  Equivalência  de  carga  fatorial  e  de  covariância  entre  fatores. 
Este  teste  adiciona  a  restrição  de  que  os  termos  de  cova¬ 
riância  entre  fatores  descritos  nos  caminhos  curvos  de  dois 
sentidos  (€>21,  $31,  $32)  são  iguais  entre  as  amostras.  Com 


três  elementos  da  matriz  de  covariância  entre  fatores  agora 
restritos  a  serem  iguais  àqueles  no  outro  grupo  (como  mos¬ 
trado  na  Figura  11-11),  o  modelo  usa  três  graus  de  liberda¬ 
de  a  menos.  Como  antes,  os  índices  de  ajuste  geral  podem 
ser  examinados  e  uma  Ax^  pode  ser  calculada  entre  este  e  o 
teste  anterior.  Se  o  teste  não  for  significante,  então  as  res¬ 
trições  acrescentadas  não  pioraram  o  ajuste  e  temos  maior 
evidência  de  validação  cruzada. 

6.  Equivalência  de  carga  fatorial,  covariância  entre  fatores  e 
variância  de  erro.  Este  último  teste  representa  aquilo  que 
às  vezes  é  chamado  de  validação  cruzada  apertada  [35].  Ela 
acrescenta  a  restrição  de  que  a  variância  de  erro  associada 
com  cada  resíduo  é  igual  entre  grupos.  Matematicamente, 
as  variâncias  e  covariâncias  de  erro  são  representadas  em 
forma  matricial.  As  variâncias  de  erro  são  encontradas  na 
diagonal  desta  matriz.  Tipicamente,  os  demais  elementos 
não  são  estimados  e  são  fixados  em  zero.  O  número  de  ele¬ 
mentos  de  variância  de  erro  se  iguala  aos  itens  medidos,  pois 
a  equação  para  cada  variável  medida  contém  erro.  Neste 
caso,  o  teste  deste  modelo  usaria  até  12  graus  de  liberdade 
a  menos,  pois  os  12  termos  de  erro  no  grupo  2  são  restritos 
a  serem  iguais  àqueles  no  grupo  1.  Novamente,  estatísticas 
de  ajuste  de  modelo  e  uma  Ax^  podem  ser  examinadas.  Uma 
Ax^  insignificante  sugere  que  as  restrições  acrescentadas  não 
pioraram  o  ajuste  e  que  existe  validação  cruzada  completa 
ou  apertada. 

Quanta  evidência  é  necessária  para  validar  um  mode¬ 
lo  CFA  com  uma  amostra  separada?  A  validação  cruzada 
apertada  é  considerada  ideal,  mas  talvez  mais  forte  do  que 
o  necessário  [35].  Validação  cruzada  parcial,  como  repre¬ 
sentada  por  um  teste  de  equivalência  de  carga  fatorial, 
deve  fornecer  evidência  adequada  de  validação  cruzada. 
Além  disso,  as  questões  de  tamanho  de  amostra  sobre  a  x 
do  modelo  se  aplicam  à  estatística  Ax^  No  entanto,  o  teste 
de  significância  é  mais  útil  com  os  valores  de  Ax^,  e,  assim, 
essas  comparações  são  muito  úteis  no  estabelecimento  do 
grau  de  validação  cruzada.  Sob  condições  com  amostras 
muito  pequenas  ou  muito  grandes  em  particular,  o  pesqui¬ 
sador  pode  querer  confiar  mais  em  mudanças  em  índices 
importantes  de  ajuste  relativo,  como  o  CFI  ou  o  PNFI. 


Ilustração  de  validação  cruzada.  Ilustraremos  testes  de 
validação  cruzada  baseados  em  resultados  que  empregam 
duas  amostras  obtidas  de  uma  população  semelhante  para 
fazer  validação  cruzada  de  um  modelo  bidimensional  de 
mensuração  de  Auto-Apresentação  em  Exercício  (SPE) 
[19].  A  SPE  é  uma  medida  psicológica  associada  com  o 
quanto  que  alguém  acredita  que  exercício  contribui  para 
a  imagem  de  uma  pessoa.  As  duas  dimensões  representam 
motivação  de  impressão  (IM)  e  construção  de  impressão 
(IC).  IM  corresponde  ao  quanto  que  alguém  deseja  ser 
percebido  como  uma  pessoa  que  se  exercita,  e  IC  está  mais 
preocupada  com  os  benefícios  sociais  do  exercício  físico. 
A  validação  cruzada  foi  mais  apropriada  porque  modifi¬ 
cações  foram  feitas  com  base  nos  diagnósticos  de  resíduos 
padronizados  produzidos  a  partir  da  CFA  inicial.  Este  pro¬ 
cesso  trunca  o  modelo  de  14  para  9  itens  medidos. 

(Continua) 
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(Continuação) 

A  Tabela  11-7  resume  os  resultados  de  validação  cru¬ 
zada.  Cada  teste  progressivo  sustenta  validação  cruzada. 
O  teste  de  validação  cruzada  solta  (#1)  produz  estatís¬ 
ticas  adequadas  de  ajuste.  O  primeiro  teste  de  amostra 
múltipla  (#3)  também  fornece  ajuste  adequado.  Além 
disso,  cada  teste  progressivo  produz  uma  mudança  in¬ 
significante  de  ajuste  sobre  o  teste  subseqüente.  Assim, 
esses  resultados  ilustram  um  caso  ideal  no  qual  os  resul¬ 
tados  de  uma  amostra  são  validados  completamente  por 
uma  amostra  subseqüente. 


Aplicações  de  CF  A  de  multi-grupos: 
um  exemplo  cultural 

Muitas  pesquisas  em  negócios  e  ciências  sociais  são  hoje 
internacionais.  Estudos  envolvendo  amostras  obtidas  de 
diferentes  países  são  comuns.  Pesquisadores  estão  reco¬ 
nhecendo  cada  vez  mais  as  complicações  metodológicas  e 
conceituais  associadas  com  estudos  que  envolvem  respon- 
dentes  de  diferentes  culturas.  Por  exemplo,  uma  simples 
comparação  de  respostas  médias  a  uma  escala  de  múlti¬ 
plos  itens  entre  culturas  pode  não  ser  válida.  Três  impor¬ 
tantes  questões  devem  ser  tratadas: 

1.  O  pesquisador  precisa  examinar  se  o  significado  lingüístico 
da  escala  é  mantido  de  uma  cultura  para  outra.  Este  proces¬ 
so  envolve  equivalência  de  tradução. 

2.  O  pesquisador  deve  examinar  se  as  escalas  de  avaliação  em 
si  são  usadas  de  forma  análoga  em  diferentes  culturas.  Tal 
questão  envolve  invariância  métrica. 

3.  O  pesquisador  precisa  saber  se  os  significados  quantificáveis 
da  escala  são  os  mesmos  ao  longo  de  culturas,  o  que  envolve 
invariância  escalar. 

Equivalência  de  tradução  pode  ser  estabelecida  por 
meio  de  procedimentos  tradicionais  de  tradução  e  retra- 
dução  e  não  envolve  qualquer  procedimento  estatístico. 
Este  processo  resolveria  a  primeira  questão.  Procedimen¬ 
tos  de  CEA  amparam  a  segunda  e  a  terceira  questão,  pois 
eles  permitem  que  pesquisadores  testem  invariância  ou 
equivalência  métrica  e  escalar.  (Invariância  significa  va¬ 
riação  nula  entre  grupos;  e  equivalência  é  outra  forma  de 
expressar  a  mesma  idéia.  Os  dois  termos  podem  ser  usa¬ 
dos  alternadamente.)  Cada  uma  dessas  características  é 
descrita  nas  próximas  seções. 


Equivalência  métrica.  Uma  condição  de  teoria  de  men- 
suração  na  qual  as  medidas  que  formam  um  modelo  de 
mensuração  têm  o  mesmo  significado  e  são  usadas  do 
mesmo  modo  por  diferentes  grupos  de  respondentes  é 
chamada  de  invariância  métrica  [18].  Como  uma  medida 
de  invariância  de  medida,  ela  fornece  ao  pesquisador  uma 
indicação  se  pessoas  de  diferentes  culturas  interpretam  e 
usam  as  escalas  da  mesma  maneira.  Invariância  métrica 
fornece  evidência  de  que  respondentes  usam  escalas  de 
avaliação  de  maneira  semelhante  ao  longo  de  grupos, 
no  sentido  de  que  as  diferenças  entre  valores  podem  ser 
comparadas.  Em  outras  palavras,  respondentes  usam  os 
intervalos  entre  valores  de  construtos  da  mesma  manei¬ 
ra  em  cada  grupo.  Ainda  que  esta  idéia  possa  ser  difícil 
de  assimilar  conceitualmente,  o  resultado  simples  é  que 
invariância  métrica  permite  comparações  com  significado 
sobre  a  força  de  relações  entre  construtos  de  um  grupo 
com  o  outro.  Invariância  métrica  não  pode  existir  sem  in¬ 
variância  de  configuração  (condição  n°  3  na  lista  da  seção 
sobre  comparação  de  grupos).  Invariância  métrica  com¬ 
pleta  também  demanda  que  as  cargas  fatoriais  sejam  inva¬ 
riantes  entre  os  grupos  que  serão  comparados.  Assim,  ela 
requer  equivalência  de  cargas  fatoriais  (condição  n°  4  na 
lista  de  comparação  de  grupos)  [18]. 

Um  novo  exame  da  Figura  11-11  mostra  que  haveria 
invariância  métrica  completa  quando  restrições  ao  mode¬ 
lo  para  ter  estimativas  iguais  de  carga  não  diminuíssem 
significativamente  o  ajuste.  Logo,  poderíamos  significa¬ 
tivamente  comparar  relações  entre  os  construtos  em  um 
grupo  com  a  relação  entre  os  construtos  no  segundo  gru¬ 
po.  Analogamente,  teríamos  comparações  válidas  sobre 
todas  as  relações  entre  construtos.  Invariância  métrica 
completa  é  um  teste  rigoroso  na  maioria  dos  contextos. 

Na  prática,  invariância  métrica  parcial  é  considerada  su¬ 
ficiente  para  viabilizar  comparações  de  relações  entre  gru¬ 
pos.  O  nível  de  invariância  parcial  necessário  requer  que 
pelo  menos  duas  estimativas  de  carga  para  cada  construto 
sejam  iguais  entre  grupos.  CEA  pode  fornecer  um  teste  de 
invariância  parcial  pela  comparação  do  modelo  de  refe¬ 
rência  TF  (totalmente  livre)  com  um  modelo  restringindo 
uma  estimativa  de  carga  para  ser  igual  entre  grupos.  Assim, 
por  exemplo,  poderia  ser  acrescentada  uma  restrição  que 
demandasse  que  a  estimativa  de  carga  ^  fosse  a  mesma 
em  ambos  os  grupos,  1  e  2.  Uma  Ax^  pode  ser  usada  para 


TABELA  11-7  Estatísticas  de  validação  cruzada  para  a  escala  de  SPE 


Descrição  do  modelo 

df 

2 

X 

CFI 

RMSEA 

Comentários 

1 .  Validação  cruzada  solta 

26 

81,3 

0,96 

0,08 

Ajuste  razoavelmente  bom 

3.  Equivalência  de  estrutura  fatorial 

52 

176,6 

0,95 

0,08 

Ajuste  razoavelmente  bom 

4.  Equivalência  de  carga  fatorial 

59 

184,5 

0,95 

0,08 

=  7,9,  insignificante 

5.  Equivalência  de  covariãncia  entre  fatores 

62 

185,6 

0,95 

0,08 

ÚX3^  =  1,1,  insignificante 

6.  Equivalência  de  variância  de  erro 

71 

197,5 

0,95 

0,07 

Ax/  =  11,9,  insignificante 

Fonte:  Adaptada  de  Conroy  e  Motl,  2003.  “Modifioation,  Cross-Validation,  Invarianoe,  and  Latent  Mean  Structure  of  the  Self-Presentation  in  Exeroise  Questionnaire,” 
Measurement  in  Physical  Education  and  Exercise  Science  7  (1 ):  1  -1 8. 
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ver  se  a  restrição  adicionada  diminui  significativamente  o 
ajuste.  Este  processo  pode  ser  repetido  em  um  esforço  para 
determinar  se  dois  itens  invariantes  por  fator  podem  ser 
encontrados.  Com  três  construtos,  um  mínimo  de  seis  es¬ 
timativas  de  cargas  (duas  em  cada  um  dos  três  construtos) 
seria  necessário  para  ser  invariante  entre  os  grupos  1  e  2. 
Se  seis  pudessem  ser  encontradas  por  este  processo,  uma 
CFA  final  seria  conduzida  acrescentando-se  todas  as  seis 
restrições  de  igualdade  ao  modelo  TF.  Os  ajustes  são  com¬ 
parados  como  antes  com  uma  estatística  Ax^  insignificante 
e/ou  melhores  valores  de  PNFI  para  o  modelo  mais  restrito 
sustentando  invariância  métrica  parcial  [24,  48]. 

Invariância  escalar.  Estudos  de  cruzamentos  culturais 
freqüentemente  envolvem  a  comparação  de  construtos 
entre  culturas.  Especificamente,  comparamos  as  médias 
entre  duas  populações.  Na  Figura  11-11,  os  dois  grupos 
poderiam  ser  dois  países  diferentes,  talvez  Rússia  e  Es¬ 
tados  Tinidos,  e  gostaríamos  de  perceber  se  os  construtos 
são  maiores  na  Rússia  do  que  nos  Estados  Unidos.  Se  este 
exemplo  é  apropriado  para  a  HBAT,  a  administração  da 
HBAT  pode  querer  examinar  uma  questão  de  pesquisa 
na  qual  se  indaga  se  três  medidas  latentes  -  qualidade,  sa¬ 
tisfação  e  lealdade  -  exibem  médias  mais  elevadas  nos  Es¬ 
tados  Unidos  ou  na  Rússia.  Outros  pesquisadores  podem 
querer  comparar  satisfação  com  emprego,  auto-estima  ou 
até  mesmo  inteligência  entre  populações. 

A  primeira  vista,  esta  comparação  parece  uma  questão 
simples.  MANOVA  poderia  ser  usada  para  testar  diferen¬ 
ças  de  médias.  Isso  seria  apropriado  quando  as  variáveis 
dependentes  ou  os  construtos  fossem  relacionados  entre  si 
e  a  variável  independente  chave  fosse  não-métrica.  Neste 
caso,  ela  seria  uma  variável  dicotômica  representando  o 
país  de  um  respondente.  Técnicas  de  ANOVA  poderiam 
ser  empregadas  sobre  variáveis  ou  construtos  dependen¬ 
tes  que  não  são  relacionados  entre  si.  Seriam  aplicadas  se¬ 
paradamente  para  cada  variável  ou  construto  dependente. 
MANOVA  e  ANOVA  tradicionais  continuam  sendo  as 
ferramentas  estatísticas  mais  comumente  aplicadas  para 
teste  de  diferenças  entre  culturas  de  grupos.  Resultados 
a  partir  dessas  abordagens  são  precisos  somente  quando 
as  três  questões  sobre  invariância  de  medição  cruzada  de 
culturas  são  confirmadas. 

Aparecem  diferenças  nas  médias  entre  dados  de  duas 
populações  diferentes  (países,  neste  caso)?  Esta  questão 
aparentemente  simples  se  torna  complexa  sempre  que 
nos  preocupamos  com  problemas  como  saber  se  quantias 
de  um  construto  (neste  caso,  médias)  sob  consideração 
têm  o  mesmo  significado  em  ambas  as  populações.  Um 
teste  de  equivalência  escalar  pode  fornecer  esta  evidên¬ 
cia.  Equivalência  escalar  significa  que  quantias  têm  o 
mesmo  significado  entre  os  dois  grupos  considerados.  Em 
outros  termos,  um  escore  de  satisfação  com  emprego  de 
15  em  uma  cultura  seria  expresso  como  um  15  em  outra. 
Mais  especificamente,  equivalência  escalar  é  estabelecida 
examinando-se  se  os  pontos-zero  (o  valor  das  variáveis 


observadas  quando  um  construto  é  igual  a  zero)  são  os 
mesmos  entre  grupos.  Quando  as  equivalências  métrica  e 
escalar  são  ambas  estabelecidas,  diz-se  existir /oríe  inva¬ 
riância  fatorial  juntamente  com  a  correspondente  habili¬ 
dade  de  comparar  relações  e  médias  entre  eles  [18]. 

Você  pode  lembrar  que  em  nossa  discussão  sobre 
análise  de  regressão  (Capítulo  4),  o  termo  de  intercep¬ 
to  na  equação  de  regressão  (bg)  freqüentemente  não  era 
de  interesse  na  interpretação  de  relações  entre  variáveis. 
Analogamente,  nossa  discussão  de  SEM  evitou  qualquer 
menção  sobre  um  intercepto  ou  um  termo  de  intercepto- 
zero,  pois  isso  não  é  importante  para  entender  como  itens 
medidos  são  relacionados  com  construtos  dentro  de  um  só 
grupo.  Mas  não  podemos  evitar  isso  agora.  Na  verdade,  o 
intercepto  deve  ser  examinado  quando  se  testa  equivalên¬ 
cia  escalar.  Existe  equivalência  escalar  quando  os  termos 
de  intercepto  para  cada  variável  medida  são  invariantes 
entre  os  grupos  sob  estudo. 

Invariância  escalar  completa  existe  quando  o  vetor  de 
termos  de  intercepto-zero  em  um  grupo  não  é  significati¬ 
vamente  diferente  dos  vetores  nos  demais  grupos  em  estu¬ 
do.  Em  outras  palavras,  isso  resulta  quando  todos  os  ter¬ 
mos  intercepto  são  invariantes  entre  grupos.  Invariância 
escalar  parcial  pode  ser  suficiente  para  permitir  compara¬ 
ções  médias  entre  grupos.  Se  dois  termos  de  intercepto  de 
item  sobre  cada  construto  são  iguais  entre  grupos,  então 
comparações  de  média  são  consideradas  válidas  [48]. 

A  CFA  testa  invariância  escalar  completa  ou  parcial.  O 
procedimento  também  envolve  a  comparação  de  ajuste  de 
um  modelo  com  as  restrições  adicionadas  associadas  com 
invariância  escalar  a  um  modelo  de  referência  menos  res¬ 
trito.  O  modelo  de  referência  neste  caso  é  aquele  associado 
com  invariância  métrica  (completa  ou  parcial,  conforme  o 
caso).  Note  que  ambas  as  invariâncias,  métrica  e  escalar, 
são  necessárias  para  fazer  comparações  válidas.  No  caso 
de  invariância  escalar  completa,  o  ajuste  CFA  de  um  mo¬ 
delo,  adicionando  a  restrição  de  que  o  vetor  é  o  mesmo  em 
cada  grupo,  não  é  significativamente  pior  do  que  o  ajuste 
do  modelo  de  referência.  Se  invariância  escalar  completa 
não  pode  ser  estabelecida,  então  o  teste  para  invariância 
escalar  parcial  envolveria  restrições  que  igualam  dois  ter¬ 
mos  de  intercepto  por  construto  entre  grupos.  Novamente, 
se  este  modelo  se  ajusta  tão  bem  quanto  o  modelo  de  refe¬ 
rência,  então  variância*  escalar  parcial  é  estabelecida. 

Visão  geral  de  teste  de  invariância.  A  crescente  presen¬ 
ça  de  pesquisa  sobre  cruzamento  de  nações  tem  gerado 
considerável  interesse  em  procedimentos  que  avaliam  in¬ 
variância  métrica.  Mais  notavelmente,  surgem  questões 
sobre  o  quão  bem  índices  tradicionais  de  ajuste,  incluin¬ 
do  a  estatística  Ax^,  se  aplicam  para  estabelecer  invariân¬ 
cia  de  medida.  Estudos  de  simulação  demonstram  que 
testes  convencionais  envolvendo  vários  níveis  de  restri¬ 
ções  fazem  um  bom  trabalho  de  diagnóstico  de  invariân¬ 
cia  ou  de  sua  falta  na  maioria  das  condições.  Ou  seja, 

*  N.  de  R.  T.:  O  termo  correto  seria  “invariância”. 
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OS  testes  funcionam  bem  desde  que  as  amostras  sejam 
grandes  o  bastante  e  cada  construto  inclua  um  número 
suficiente  de  itens  [37].  A  Tabela  11-8  resume  os  níveis 
de  invariância  de  medida  associados  com  comparações 
entre  populações. 

Teste  de  diferenças  em  médias  de  construtos 

Um  último  tipo  de  comparação  multi-grupos  é  o  teste  para 
diferenças  em  médias  de  construtos.  Se  há  pelo  menos 
invariância  escalar  parcial,  podemos  operacionalizar  um 
valor  para  as  médias  dos  construtos  latentes.  Deste  modo, 
dizemos  ao  programa  SEM  que  estamos  interessados  na 
análise  de  médias.  O  Apêndice  IIB  mostra  a  equação  que 
é  introduzida  para  representar  médias  de  construtos  la¬ 
tentes.  Porém,  de  uma  maneira  ou  de  outra,  o  programa 
SEM  deve  ser  avisado  que  estamos  interessados  nas  mé¬ 
dias  de  tais  construtos. 

Programas  SEM  comparam  médias  apenas  em  um 
sentido  relativo.  Em  outros  termos,  eles  podem  dizer  a 
você  se  a  média  é  maior  ou  menor  relativamente  a  outro 
grupo  [39].  Uma  razão  para  tal  limitação  tem  a  ver  com 
identificação,  uma  vez  que  os  termos  de  intercepto  estão 
agora  sendo  estimados.  Um  resultado  é  que  o  vetor  de 
médias  de  construtos  latentes  (contido  na  matriz  kapa) 
tem  que  ser  fixado  em  zero  em  um  grupo,  para  identificar 
o  modelo.  Chamamos  este  grupo  de  grupo  1.  Ele  pode  ser 
livremente  estimado  nos  demais  grupos  e  os  valores  resul¬ 
tantes  podem  ser  interpretados  como  quão  acima  ou  abai¬ 
xo  as  médias  de  construtos  latentes  estão  nestes  grupos, 
relativamente  ao  grupo  1. 


Usando  o  exemplo  ilustrativo  da  Figura  11-11,  a  saída 
SEM  incluirá  agora  estimativas  para  o  vetor  no  grupo  2. 
Tipicamente,  esta  saída  incluiria  um  valor  estimado,  um 


erro  padrão  e  um  valor-í  associado  com  cada  valor.  Por 
exemplo,  pode  se  parecer  com  isto: 


KAPA  (k) 

Construto  1 

Construto  2 

Construto  3 

2,6 

0,09 

-3,50 

(0,45) 

(0,60) 

(1,55) 

5,78 

0,10 

-2,25 

Esses  valores  sugerem  que  a  média  para  o  construto  1 
é  2,6  maior  no  grupo  2  do  que  no  grupo  1.  Esta  diferença 
é  significante,  como  se  evidencia  pelo  valor-í  de  5,78  {p 
<  0,001).  A  média  para  o  construto  2,  diferindo  por  0,09, 
não  é  significativamente  distinta  (f  =  0,10).  A  média  para 
o  construto  3,  por  outro  lado,  é  significativamente  menor 
no  grupo  2  relativamente  ao  grupo  1  (/  =  -2,25;  p  <  0,05). 
Esses  tipos  de  comparação  de  valores  médios  de  constru¬ 
tos  podem  ser  úteis  na  pesquisa  de  culturas  [24, 48]. 


Parcelamento  de  item  em  CFA  e  SEM 
Parcelamento  de  item  se  refere  à  combinação  de  variáveis 
medidas  em  conjuntos  de  diversas  variáveis  por  soma  ou 
cálculo  de  média  de  itens.  O  parcelamento  oferece  uma 
maneira  de  lidar  com  um  número  não-gerenciável  de  va¬ 
riáveis  reflexivas  medidas  por  construto  [17].  Por  exem¬ 
plo,  algumas  escalas  psicológicas  podem  conter  mais  de 
100  itens  para  capturar  apenas  duas  ou  três  dimensões 
básicas  de  personalidade.  Assim,  mesmo  com  uns  poucos 
construtos  pode-se  terminar  com  muito  mais  do  que  100 
itens  medidos.  Aplicações  de  SEM  são  difíceis  de  geren¬ 
ciar  com  tantas  variáveis  medidas. 

Usando-se  parcelamento  de  itens,  um  único  construto 
latente  com  40  itens  medidos  (xj  -  x^)  poderia  ser  repre¬ 
sentado  por  oito  parcelas,  cada  uma  consistindo  de  5  dos 
40  itens  medidos.  Uma  parcela  é  uma  combinação  mate¬ 
mática  que  resume  múltiplas  variáveis  em  uma.  No  caso 
extremo,  todos  os  itens  medidos  para  um  construto  podem 


TABELA  11-8  Resultados  de  testes  de  invariância  de  medidas  em  comparações  de  populações 


Tipo  de  invariância 

Restrição 

Compara  ajuste  com: 

Resultado  para  comparações  de  grupos 

Invariância  métrica  completa 

Todas  as  estimativas  de  cargas 
iguais  ao  longo  de  todos  os  grupos. 

Modelo  CFA 
multi-grupo  TF 

Comparações  de  relações  entre  construtos 
são  válidas. 

Invariância  métrica  parcial 

Ao  menos  duas  estimativas  de 
carga  fatorial  iguais  em  todos  os 
grupos. 

Modelo  CFA 
multi-grupo  TF 

Comparações  de  relações  entre  construtos 
são  válidas. 

Invariância  escalar  completa 

Todas  as  estimativas  de  intercepto 
zero  de  item  medido  são  iguais  em 
todos  os  grupos. 

Modelo  de  invariância 
métrica 

Comparações  de  relações  entre  construtos 
e  comparações  entre  médias  de  construtos 
são  válidas. 

Invariância  escalar  parcial 

Pelo  menos  dois  termos  de  inter¬ 
cepto  zero  de  item  são  iguais  ao 
longo  de  todos  os  grupos. 

Modelo  de  invariância 
métrica 

Comparações  de  relações  entre  construtos 
e  comparações  entre  médias  de  construtos 
são  válidas. 

Invariância  fatorial  forte 

Exigências  de  invariância  escalar 
completa  e  invariância  métrica 
completa. 

Modelo  CFA 
multi-grupo  TF 

Comparações  de  relações  entre  construtos 
e  comparações  entre  médias  de  construtos 
são  válidas. 
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ser  combinados  em  uma  média  ou  uma  soma  daquelas  va¬ 
riáveis.  No  Capítulo  3,  discutimos  como  criar  um  constru- 
to  somado  dessa  maneira.  O  termo  indicador  composto 
é  geralmente  usado  para  se  referir  a  parcelamento  que 
resulta  em  apenas  uma  parcela  de  todos  os  itens  medidos 
para  um  construto. 

Numerosas  questões  estão  associadas  com  parce¬ 
lamento  de  itens.  Essas  questões  incluem  a  adequação 
do  parcelamento,  quais  itens  devem  ser  combinados 
em  uma  parcela,  e  quais  são  os  efeitos  do  parcelamento 
sobre  a  avaliação  de  modelos.  Parcelamento  tem  o  po¬ 
tencial  para  melhorar  o  ajuste  do  modelo  simplesmente 
por  reduzir  a  complexidade  do  modelo,  e  modelos  com 
menos  variáveis  têm  potencial  para  melhor  ajuste  [31]. 
No  entanto,  melhora  somente  no  ajuste  não  é  argumen¬ 
to  o  suhciente  para  se  combinar  múltiplos  itens  em  um, 
pois  o  principal  objetivo  é  a  criação  de  um  modelo  que 
melhor  represente  os  dados  reais.  Além  disso,  parcelas 
de  item  podem  freqüentemente  mascarar  problemas 
com  medidas  de  itens  e  sugerir  um  ajuste  melhor  do  que 
realmente  existe  [7].  Parcelamento  pode  também  ocultar 
outros  construtos  latentes  que  existem  nos  dados.  Assim, 
uma  matriz  de  covariância  que  realmente  contenha  cinco 
construtos  latentes  pode  ser  adequada,  mas  falsamente 
representada  por  três  construtos  latentes  usando-se  par¬ 
celamento. 

Quando  é  apropriado  o  parcelamento? 

Parcelamento  de  itens  deve  ser  considerado  somente 
quando  um  construto  tem  um  grande  número  de  indica¬ 
dores  de  variáveis  medidas.  Por  exemplo,  aplicações  en¬ 
volvendo  menos  de  15  itens  não  requerem  parcelamento. 
Analogamente,  parcelamento  não  é  empregado  com  mo¬ 
delos  formativos,  pois  é  importante  que  todas  as  causas 
de  um  fator  formativo  sejam  incluídas.  Parcelamento  é 
adequado  quando  todos  os  itens  para  um  construto  são 
unidimensionais.  Ou  seja,  mesmo  com  um  grande  número 
de  itens  medidos,  todos  eles  deveriam  carregar  altamente 
sobre  apenas  um  construto  e  deveriam  mostrar  alta  con¬ 
fiabilidade  (0,9  ou  mais).  Mais  importante,  parcelamento 
é  apropriado  quando  não  se  perde  informação  no  uso  de 
parcelas  no  lugar  de  itens  individuais  [30].  Assim,  algumas 
verificações  simples  anteriores  ao  parcelamento  envolvem 
a  execução  de  uma  CFA  sobre  o  fator  individual,  para  ve¬ 
rificar  unidimensionalidade  e  para  ver  se  o  construto  refle¬ 
tido  por  todos  os  itens  individuais  se  relaciona  com  outros 
construtos  da  mesma  maneira  que  um  construto  refletido 
por  um  número  menor  de  parcelas. 

Como  itens  devem  ser  combinados  em  parcelas? 

Tradicionalmente,  pouco  se  tem  pensado  na  maneira 
como  itens  devem  ser  combinados.  Contudo,  a  estratégia 
de  combinação  pode  afetar  a  possibilidade  de  que  uma 
CFA  esteja  na  verdade  sustentando  uma  falsa  teoria  de 
mensuração.  Apesar  de  muitas  complicações  serem  asso¬ 
ciadas  com  as  estratégias  de  combinação,  duas  conside¬ 


rações  simples  levam  ao  melhor  desempenho  quando  um 
pesquisador  deve  usar  parcelamento.  Uma  consideração  é 
empírica  e  a  outra,  teórica.  Sabendo-se  que  os  itens  indivi¬ 
duais  sugerem  unidimensionalidade,  as  melhores  parcelas 
são  formadas  por  itens  que  retratam  aproximadamente 
a  mesma  covariância,  o  que  deve  levá-los  a  terem  apro¬ 
ximadamente  as  mesmas  estimativas  de  cargas  fatoriais. 
Além  disso,  as  parcelas  devem  conter  grupos  de  itens  com 
a  maior  similaridade  conceituai.  Isto  é,  itens  com  a  vali¬ 
dade  de  conteúdo  mais  próxima.  Portanto,  parcelas  com 
itens  que  mostram  aproximadamente  a  mesma  covariân¬ 
cia  e  que  compartilham  uma  base  conceituai  tendem  a  ter 
um  bom  desempenho  e  a  representar  os  dados  com  me¬ 
lhor  precisão  [30]. 


ILUSTRAÇÕES  DE  CEA  AVANÇADA 

Esta  seção  fornece  ilustrações  de  CFA  avançada.  Estão  in¬ 
cluídas  aplicações  do  conjunto  de  dados  de  HBAT_SEM 
para  análises  de  grupos  múltiplos  e  viés  de  medidas. 

Análises  de  grupos  múltiplos 

Durante  as  entrevistas  entre  a  administração  da  HBAT 
e  os  consultores,  surgiram  numerosas  questões  sugerindo 
uma  necessidade  de  comparar  empregados  homens  com 
mulheres. 


Da  mesma  maneira  que  invariância  seria  testada  se  duas 
amostras  internacionais  fossem  usadas,  ou  se  os  dados 
fossem  divididos  em  amostras  de  validação  e  de  valida¬ 
ção  cruzada,  testes  de  invariância  são  necessários  para 
comparar  os  resultados  de  CFA  obtidos  a  partir  de  em¬ 
pregados  do  sexo  masculino  e  feminino. 

Muito  semelhante  com  a  divisão  de  amostra  usando 
SPSS  em  outros  procedimentos  multivariados,  os  dados 
gerais  podem  ser  separados  em  dois  grupos:  um  para  res- 
pondentes  homens  e  outro  para  respondentes  mulheres. 
Neste  estudo,  200  empregados  do  sexo  masculino  e  200 
empregados  do  sexo  feminino  responderam  o  questioná¬ 
rio.  O  usuário  deve  informar  ao  programa  SEM  que  uma 
análise  de  múltiplos  grupos  está  sendo  conduzida.  Con¬ 
sulte  a  documentação  de  seu  programa  para  ver  como 
esta  informação  é  transmitida  com  seu  software  SEM 
preferido.  Essencialmente,  o  modelo  é  reproduzido  em 
todas  as  amostras  consideradas  e  o  ajuste  é  determinado 
agora  pela  qualidade  do  modo  como  o  modelo  reproduz 
todas  as  matrizes  de  covariância  de  amostra  observada. 
Assim,  somente  um  valor  x  é  fornecido. 


Passos  em  invariância  de  medida 

Nesta  seção,  demonstramos  os  testes  necessários  associa¬ 
dos  com  validação  cruzada  e  invariância  de  medida.  Esses 
procedimentos  se  sobrepõem,  mas  podem  ser  separados 
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em  cinco  passos,  com  cada  passo  ficando  mais  restrito.  Os 
procedimentos  usados  aqui  são  os  mesmos  utilizados  em 
qualquer  validação  cruzada  de  CFA.  Analogamente,  os 
procedimentos  se  estendem  a  testes  de  invariância  entre 
amostras  obtidas  de  diferentes  países. 


A  meta  é  examinar  se  os  resultados  da  amostra  de  em¬ 
pregados  homens  podem  passar  por  validação  cruzada 
usando  a  amostra  de  empregados  do  sexo  feminino. 
De  um  ponto  de  vista  de  medição,  freqüentemente  es¬ 
taríamos  validando  usando  uma  amostra  com  o  mesmo 
perfil  demográfico  obtido  da  mesma  população,  o  que 
corresponderia  ao  exemplo  SPE  ilustrado  na  Tabela 
11-7. 


Validação  cruzada  solta.  O  primeiro  passo  é  validação  cru¬ 
zada  solta  estabelecida  pela  aplicação  separada  de  CFA  ao 
mesmo  modelo  de  mensuração  em  cada  amostra.  Assim,  dois 
modelos  CFA  são  testados  neste  exemplo  de  dois  grupos. 
Se  mais  de  dois  grupos  estão  envolvidos,  então  mais  CF  As 
são  exigidas.  Aqui,  examinamos  o  grau  em  que  resultados  da 
amostra  de  homens  pode  passar  por  validação  cruzada  com 
os  resultados  da  amostra  de  mulheres. 


As  CF  As  são  realizadas  mediante  a  mesma  estrutura  de 
medição  usada  com  a  amostra  geral  (Figura  11-8).  Pro¬ 
cessando  o  programa  SEM  duas  vezes,  uma  vez  com  os 
dados  de  homens  e  uma  vez  com  os  dados  de  mulheres, 
obtemos  resultados  CFA  para  homens  e  mulheres,  res¬ 
pectivamente.  As  estatísticas  resultantes  de  ajuste  da 
FIBAT  a  partir  de  cada  teste  são  as  seguintes: 


Homens 

Mulheres 

2 

X 

206,7 

222,1 

df 

179 

179 

P 

0,076 

0,016 

RMSEA 

0,021 

0,028 

CFI 

0,99 

0,99 

Os  valores  de  RMSEA  e  CFI  são  muito  parecidos 
para  cada  grupo  e  sugerem  um  bom  ajuste  para  as 
amostras  de  homens  e  mulheres.  Usando  uma  taxa  de 
erro  Tipo  I  de  0,01,  os  homens  têm  um  teste  x  pratica¬ 
mente  insignificante  (p  =  0,076),  e  o  mesmo  ocorre  com 
a  amostra  de  mulheres  {p  =  0,016).  Nenhum  problema 
significante  foi  observado  com  validade  de  construto 
em  qualquer  amostra.  Portanto,  os  critérios  de  valida¬ 
ção  cruzada  solta  são  atendidos,  pois  o  modelo  de  men¬ 
suração  parece  válido  em  ambas  as  amostras  tomadas 
separadamente. 


Equivalência  de  estrutura  fatorial.  Análises  de  múltiplos 
grupos  começam  com  este  passo.  O  teste  de  equivalência 


de  estrutura  fatorial  examina  o  modelo  de  mensuração 
original  em  ambas  as  amostras,  como  na  validação  cruza¬ 
da  solta,  mas  agora  o  modelo  será  estimado  em  cada  gru¬ 
po  simultaneamente,  e  não  em  separado.  Esses  índices  de 
ajuste  agora  se  referem  à  precisão  com  que  o  modelo  de 
mensuração  reproduz  a  matriz  de  covariância  observada 
para  homens  e  mulheres. 


No  lugar  de  estatísticas  separadas  de  ajuste  para  as 
amostras  de  homens  e  mulheres,  um  conjunto-chave  de 
estatísticas  de  ajuste  é  fornecido.  Como  resultado,  olha¬ 
mos  um  conjunto  de  índices  de  ajuste  ao  invés  de  dois. 
Lembre-se  que  os  parâmetros  livres  associados  com  o 
modelo  de  mensuração  da  HBAT  não  estão  restritos 
entre  grupos;  logo,  este  modelo  é  dito  TF  (totalmente 
livre).  As  correspondentes  estimativas  de  parâmetros 
freqüentemente  assumem  diferentes  valores  em  cada 
amostra,  como  brevemente  veremos. 

Como  esperado,  o  x  do  modelo  para  a  CFA  de  dois 
grupos  (homens  versus  mulheres)  se  iguala  ao  valor  ob¬ 
tido  pela  adição  dos  dois  valores  x  do  processo  de  vali¬ 
dação  solta.  Tal  valor  é  428,8  com  358  graus  de  liberdade 
ip  =  0,006).  A  RMSEA  para  o  modelo  de  dois  grupos  é 
0,025,  com  um  intervalo  de  confiança  de  90%  de  0,000 
a  0,037.  O  CFI  é  de  0,99.  Esses  resultados  suportam  o 
modelo  de  mensuração.  Assim,  a  mesma  estrutura  fato¬ 
rial  é  apropriada  em  qualquer  amostra.  Equivalência  de 
estrutura  fatorial  é  sustentada. 

A  Figura  11-12  exibe  as  estimativas  resultantes  de 
parâmetros  em  cada  grupo  usando  um  diagrama  visual. 
Um  propósito  de  apresentar  este  diagrama  é  demonstrar 
como  se  parece  o  resultado  quando  se  baseia  em  um  dia¬ 
grama  de  caminhos.  Esse  método  de  apresentação  pa¬ 
drão  para  estimativas  de  parâmetros  está  disponível  em 
AMOS  ou  LISREL,  quando  um  diagrama  de  caminhos 
é  requisitado.  Alguns  usuários  preferem  a  saída  visual,  e 
outros  podem  preferir  em  forma  de  texto.  No  entanto,  à 
medida  que  os  modelos  aumentam  em  complexidade,  os 
diagramas  ficam  cada  vez  mais  difíceis  de  ler. 

As  estimativas  de  parâmetros  no  diagrama  geral¬ 
mente  sustentam  o  modelo  TF.  Não  as  discutimos  em 
detalhes  porque  elas  seguem  de  maneira  muito  próxima 
aquelas  apresentadas  para  a  amostra  geral  em  termos  da 
adequação  de  cargas  fatoriais,  variância  extraída  e  es¬ 
timativas  de  confiabilidade.  Portanto,  a  HBAT  conclui 
que  o  modelo  de  mensuração  proposto  tem  suficiente 
validade  em  ambos  os  grupos.  Ele  também  satisfaz  os 
critérios  para  validação  estrutural  fatorial. 


Equivalência  de  carga  fatorial.  O  próximo  teste  restringe 
o  modelo  de  CFA  de  uma  maneira  que  requer  que  as  es¬ 
timativas  de  cargas  fatoriais  nos  dois  grupos  sejam  iguais. 
Equivalência  de  carga  fatorial  é  testada  examinando-se 
os  efeitos  do  acréscimo  dessa  restrição  sobre  o  ajuste  do 
modelo  TF. 
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FIGURA  11-12  Resultados  de  CFA  de  dois  grupos  de  empregados  da  HBAT. 

Nota:  A  primeira  estimativa  mostrada  é  o  resultado  para  o  grupo  de  homens,  e  a  segunda  é  o  resultado  para  o  grupo  feminino  (homens/mulheres). 
Números  exibidos  são  estimativas  completamente  padronizadas. 


A  Tabela  11-9  retrata  as  estatísticas  de  ajuste  associadas 
com  ambos  os  modelos,  obrigando  as  estimativas  de  car¬ 
gas  fatoriais  na  amostra  de  homens  a  serem  iguais  àquelas 
da  amostra  feminina.  Ela  contém  também  resultados  para 
outros  modelos  que  testam  demais  graus  de  equivalência. 
A  estatística  de  ajuste  de  x  para  o  modelo  de  equivalên¬ 
cia  de  carga  fatorial  é  de  486,0  com  374  graus  de  liberda¬ 
de.  Subtraindo  os  resultados  de  TF  a  partir  disso,  obte¬ 
mos  o  valor  Ax^  de  57,2  com  16  graus  de  liberdade.  Com 
base  em  16  estimativas  de  carga  fatorial,  o  valor  crítico  da 
distribuição  x  co^n  16  graus  de  liberdade  é  de  32,0  com 
um  risco  de  erro  do  Tipo  1  de  0,01.  Portanto,  as  restrições 
adicionadas  pioram  significativamente  a  estatística  x.  A 
RMSEA  aumenta  para  0,032,  enquanto  a  CFl  cai  para 
0,98.  A  PNFl  aumenta  ligeiramente  para  0,83,  refletindo 
a  maneira  como  recompensa  modelos  com  complexidade 
menor  -  o  que  significa  menos  parâmetros  livres.  Apesar 
de  poder  ser  argumentado  que  o  PNFl  aumentado  susten¬ 
ta  equivalência,  a  HBAT  assume  uma  abordagem  mais 
conservadora  com  base  na  magnitude  relativa  do  valor 
Ax^.  Não  é  incomum  que  o  PNFl  entre  em  conflito  com 
outros  indicadores.  Dado  o  debate  sobre  o  uso  do  PNFl 


e  o  fato  de  que  a  melhora  é  pequena  (0,03),  maior  con¬ 
fiança  vem  de  se  basear  nos  demais  resultados.  Assim,  a 
conclusão  é  que  o  modelo  carece  de  equivalência  de  carga 
fatorial  e  que  validação  cruzada  das  amostras  se  estende 
somente  para  estruturas  fatoriais  equivalentes. 


Equivalência  de  covariância  entre  fatores.  Se  equivalên¬ 
cia  de  carga  fatorial  é  sustentada,  então  o  próximo  passo 
é  o  exame  de  equivalência  de  covariância  entre  fatores. 
Como  descrito  anteriormente,  este  processo  exige  a  adi¬ 
ção  de  outra  restrição  para  o  processo  de  estimação. 


Como  nossos  resultados  não  sustentam  equivalência  de 
carga  fatorial,  este  passo  não  seria  necessário  para  exami¬ 
nar  validação  cruzada  simples.  No  entanto,  pode  ser  ne¬ 
cessário  por  alguma  outra  razão,  trazendo  atenção  especial 
às  correlações  entre  fatores.  Também  o  apresentamos  aqui 
para  ilustrar  como  ele  é  executado  e  sua  interpretação. 

O  modelo  pode  ser  estimado  adicionando-se  a  res¬ 
trição  de  que  a  matriz  de  covariância  entre  fatores  de 
um  grupo  é  equivalente  à  matriz  de  covariância  do  outro 

_ (Continua) 
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grupo.  Se  elas  não  são  verdadeiramente  iguais,  o  ajuste 
deve  piorar  por  conta  desta  restrição.  Neste  caso,  a  res¬ 
trição  adicionada  piora  significativamente  o  ajuste  (Ax^ 
=  53,9,  df=  15,  p  <  0,001).  Novamente,  um  pequeno  au¬ 
mento  (0,03)  no  PNFl  é  observado  em  comparação  com 
o  modelo  anterior.  No  entanto,  o  significante  Ax^  e  o  au¬ 
mento  em  RMSEA  sugerem  uma  falta  de  equivalência 
de  covariância  entre  fatores. 


Equivalência  de  variância  de  erro.  A  seguir,  ilustramos 
como  examinar  a  equivalência  de  variância  de  erro  entre 
amostras.  Como  o  outro  teste,  precisamos  adicionar  uma 
restrição  ao  modelo.  Neste  caso,  as  estimativas  de  variân¬ 
cia  de  erro  devem  ser  restritas  para  serem  iguais  em  cada 
amostra. 


Como  ocorre  com  a  restrição  de  covariância  entre  fa¬ 
tores  já  discutida,  este  vínculo  também  piora  significa¬ 
tivamente  o  ajuste  (Ax^  =  134,2,  df=  21,  p  <  0,001).  O 
CFI  cai  para  0,96  e  a  RMSEA  sobe  para  0,051*.  Assim, 
a  conclusão  é  que  os  termos  de  variância  de  erro  não  são 
equivalentes  nas  amostras  de  homens  e  mulheres. 


Invariância  métrica 

Invariância  métrica  completa  não  pode  ser  sustentada,  a 
menos  que  equivalência  de  carga  fatorial  também  seja  sus¬ 
tentada,  pois  ela  sugere  que  as  cargas  variam  significativa¬ 
mente  de  um  grupo  para  o  seguinte.  Contudo,  pesquisado¬ 
res  podem  estar  interessados  na  comparação  de  relações, 
que  pode  ser  executada  se  invariância  métrica  parcial  puder 
ser  estabelecida.  Lembre-se  que  invariância  métrica  parcial 
existe  quando  pelo  menos  dois  itens  que  carregam  sobre 
cada  fator  são  equivalentes  de  um  grupo  para  o  próximo. 
Portanto,  uma  série  de  modelos  de  CFA  que  restringem  su¬ 
cessivamente  apenas  duas  estimativas  de  cargas  sobre  um 
fator  pode  ser  usada  para  testar  invariância  métrica  parcial. 


Ainda  que  invariância  métrica  completa  não  possa  ser 
sustentada  por  conta  da  falta  de  equivalência  de  car¬ 
ga  fatorial,  a  HBAT  está  interessada  na  comparação 


*  N.  de  R.  T.:  Este  número  (0,051)  é  ligeiramente  diferente  na  Tabela 
11-9  (0,05). 


de  relações.  Como  resultado,  testes  posteriores  foram 
conduzidos  para  ver  se  invariância  métrica  parcial  po¬ 
deria  ser  estabelecida.  Se  começamos  a  partir  do  mo¬ 
delo  TF,  podemos  acrescentar  uma  restrição  de  que 
qualquer  parâmetro  individual  seja  o  mesmo  entre 
grupos,  selecionando  qualquer  estimativa  de  carga  li¬ 
vre  do  grupo  1  e  restringindo-a  a  ser  igual  ao  mesmo 
valor  no  grupo  2. 

Por  exemplo,  as  estimativas  para  i  e  X^j  j  serão  res¬ 
tritas  a  serem  iguais  em  cada  grupo.  Podemos  então  exami¬ 
nar  o  quanto  de  mudança  este  vínculo  provoca  no  ajuste. 
Os  resultados  sugerem  que  o  ajuste  não  se  modifica  sig¬ 
nificativamente.  O  X  do  modelo  é  igual  a  431,35  com  360 
graus  de  liberdade.  A  RMSEA  é  0,024,  o  CFI  é  0,99,  e  o 
PNFI  é  de  0,81.  Subtraindo  os  resultados  de  TF,  descobri¬ 
mos  que  Ax^  =  2,55  com  2  df.  O  valor  x  crítico  para  2  d/é 
9,21  (erro  Tipo  I  =  0,01).  Logo,  essas  duas  estimativas  de 
caminhos  mostram  equivalência  ao  longo  dos  grupos. 

Este  processo  pode  ser  continuado  para  cada  um 
dos  demais  fatores.  Depois  de  fazer  isso,  o  consultor  da 
HBAT  descobre  que  as  seguintes  estimativas  de  cargas 
dos  parâmetros  (valores  lambda)  são  equivalentes  entre 
amostras: 


Parâmetro 

Construto 

Variável  medida 

^x2,l 

JS 

Xi 

^x5,l 

JS 

Xii 

^x7,2 

OC 

^6 

^x9,2 

OC 

X2 

^xll,3 

SI 

Xi4 

^j:13,3 

SI 

X21 

^.rl5,4 

EP 

X7 

^.rl7,4 

EP 

-'■10 

AC 

-'■18 

^x21,5 

AC 

X20 

Se  pelo  menos  dois  itens  por  fator  podem  ser  res¬ 
tringidos  a  serem  iguais  sem  significativamente  piorar  o 
ajuste,  invariância  métrica  parcial  é  sustentada.  Como 
resultado,  podem  ser  feitas  comparações  válidas  das  re¬ 
lações  entre  construtos  envolvendo  as  amostras  de  ho¬ 
mens  e  de  mulheres.  Retornamos  a  este  ponto  com  mais 
detalhes  no  Capítulo  12. 


TABELA  11-9  Resultados  de  testes  de  invariância  de  mensuração  para  homens  e  mulheres 


2 

X 

df 

P 

RMSEA 

CFI 

PNFl 

Ax' 

Adf 

P 

Grupos  individuais: 

Homens 

206,7 

179 

0,078 

0,021 

0,99 

0,81 

Mulheres 

222,1 

179 

0,016 

0,028 

0,99 

0,8 

TF  (Equivalência  de  estrutura  fatorial) 

428,8 

358 

0,006 

0,021 

0,99 

0,81 

Equivalência  de  carga  fatorial 

486,0 

374 

0,0002 

0,032 

0,98 

0,83 

57,2 

16 

p<  0,001 

Equivalência  de  covariância  fatorial 

539,9 

389 

0,0000 

0,038 

0,98 

0,86 

53,9 

15 

p<  0,001 

Equivalência  de  variância  de  erro 

674,1 

410 

0,0000 

0,05 

0,96 

0,89 

134,2 

21 

p<  0,001 
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Equivalência  escalar 

Descrevemos  anteriormente  neste  capítulo  como  inva¬ 
riância  escalar  é  sustentada  quando  termos  de  intercep¬ 
to  correspondentes  para  as  variáveis  observadas  são  os 
mesmos  em  cada  grupo.  Este  teste  complica  as  coisas,  no 
sentido  de  que  os  interceptas  zero  da  variável  medida  têm 
que  ser  parametrizados  (isto  é,  explicados  em  computa¬ 
ções  e/ou  estimados)  dentro  da  CFA.  Além  disso,  as  mé¬ 
dias  da  variável  latente  também  são  parametrizadas  via 
kapa.  O  leitor  pode  consultar  a  documentação  do  respec¬ 
tivo  programa  SEM  quanto  a  detalhes  sobre  as  maneiras 
como  esses  passos  podem  ser  levados  a  cabo. 


A  HBAT  está  interessada  em  diferenças  entre  empre¬ 
gados  homens  e  mulheres.  Antes  que  comparações  váli¬ 
das  em  médias  possam  ser  feitas,  temos  que  saber  que  as 
duas  populações  interpretam  os  significados  e  valores  da 
escala  do  mesmo  modo.  Portanto,  a  HBAT  aplicará  um 
teste  de  invariância  escalar.  Eles  estão  particularmente 
interessados  em  comparar  compromisso  organizacional 
e  percepções  de  ambiente  para  ambos  os  grupos.  Assim, 
neste  momento  eles  escolhem  a  simplificação  da  CFA 
para  incluir  somente  esses  dois  construtos. 

Neste  caso,  devemos  estabelecer  invariância  escalar 
antes  que  as  médias  de  grupos  para  comprometimento 
organizacional  e  percepção  de  ambiente  possam  ser 
comparadas.  Depois  de  parametrizar  os  interceptos 
zero  da  variável  medida  (TX)  e  restringir  para  que 
os  termos  intercepto  de  um  grupo  sejam  iguais  (TX  = 
IN)  aos  correspondentes  termos  intercepto  do  outro 
grupo,  as  seguintes  estatísticas  de  ajuste  foram  produ¬ 
zidas: 


Grupo  2 

Restrição: 

TX  =  FR 

H 

X 

II 

1— 1 

X 

2 

X 

165,6 

174,4 

df 

44 

52 

Neste  caso  estamos  preocupados  com  a  diferença 
de  ajuste  e  não  com  o  ajuste  geral,  uma  vez  que  a  va¬ 
lidade  de  construto  já  foi  estabelecida  na  CFA  sem  os 
interceptos  zero  ou  médias  de  construto  latente.  Assim, 
Ax^  se  torna  especialmente  importante.  Neste  caso,  Ax^= 
8,9*  com  8  graus  de  liberdade,  o  que  não  é  significan- 
te.  Portanto,  a  restrição  acrescentada  de  que  os  termos 
intercepto  da  variável  medida  são  iguais  ao  longo  dos 
grupos  não  prejudica  significativamente  o  ajuste.  Desse 
modo,  invariância  escalar  completa  é  estabelecida  e  a 
HBAT  pode  promover  comparações  válidas  de  médias 
de  construto  latente.  Se  não  fosse  o  caso,  o  analista  da 
HBAT  poderia  ter  testado  equivalência  individual  de 
interceptos  de  variável  medida,  dois  por  vez,  como  um 
esforço  para  estabelecer  invariância  escalar  parcial.  Esta 


*N.  do  R.  T.  O  valor  correto  seria  8,8. 


abordagem  seria  consistente  com  o  método  usado  pre¬ 
viamente  para  estabelecer  invariância  métrica  parcial. 

Porém,  estamos  mais  interessados  nos  valores  para  as 
médias  de  construto  latente  (rotulados  aqui  por  KAPA). 
Os  valores  a  seguir  estão  dispostos  na  primeira  seção  de 
saída  associada  com  os  resultados  para  homens: 


KAPA 

(k) 

OC 

EP 

0,29 

0,55 

(0,44) 

(0,22) 

0,66 

2,48 

Somente  um  conjunto  de  médias  é  fornecido,  pois 
elas  representam  a  diferença  entre  médias  de  grupos. 
SEM  não  produzirá  médias  para  cada  grupo.  A  média 
padronizada  para  comprometimento  organizacional  na 
amostra  de  homens  é  estimada  em  0,29,  com  um  erro 
padrão  de  0,44  e  um  valor-í  de  0,66.  Este  valor  deve 
ser  interpretado  como  uma  comparação  de  médias  pa¬ 
dronizadas.  Em  outras  palavras,  é  uma  interpretação 
relativa  que  indica  que  comprometimento  organiza¬ 
cional  é  0,29  maior  entre  empregados  homens  do  que 
entre  as  mulheres.  Esta  diferença  não  é  significante.  A 
percepção  ambiental  média  padronizada  na  amostra  de 
homens  é  estimada  em  0,55,  com  um  erro  padrão  de 
0,22  e  um  valor-í  de  2,48.  Este  resultado  é  significante 
{p  <  0,05).  Assim,  percepção  do  ambiente  é  0,55  mais 
favorável  entre  empregados  do  sexo  masculino  do  que 
entre  empregados  do  sexo  feminino.  A  HBAT  conclui, 
portanto,  que  homens  gostam  mais  do  ambiente  de  tra¬ 
balho  do  que  mulheres,  apesar  de  ambos  os  grupos  se¬ 
rem  igualmente  comprometidos. 


Resumo 

Esta  seção  introduziu  vários  testes  de  equivalência  con¬ 
duzidos  no  âmbito  de  CFA  básica  de  grupos  múltiplos.  A 
despeito  de  o  modelo  CFA  de  dois  grupos  TF  ser  uma  ex¬ 
tensão  razoavelmente  direta  da  abordagem  padrão  de  um 
grupo,  os  testes  de  invariância  métrica  e  invariância  esca¬ 
lar  podem  se  tornar  complicados.  Isso  fica  particularmente 
complexo  quando  se  tenta  estabelecer  invariância  métrica 
parcial  ou  invariância  escalar  parcial.  Testes  de  equivalên¬ 
cia  são  úteis  quando  o  pesquisador  precisa  fazer  validação 
cruzada  de  resultados  prévios  ou  comparar  construtos  en¬ 
tre  grupos  que  podem  não  ser  obtidos  da  mesma  popula¬ 
ção.  A  segunda  condição  é  particularmente  verdadeira  em 
pesquisas  que  ultrapassam  as  fronteiras  de  uma  nação. 

Viés  de  medida 

Às  vezes,  pesquisadores  ficam  preocupados  que  respostas 
de  entrevistas  sejam  viesadas,  dependendo  da  maneira 
como  as  questões  são  formuladas.  Por  exemplo,  poderia 
ser  argumenfado  que  a  ordem  na  qual  as  quesfões  são 
realizadas  pode  ser  responsável  pela  covariância  enfre 
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itens  que  são  agrupados  proximamente.  Se  for  o  caso,  um 
fator  de  incômodo  baseado  na  proximidade  física  de  itens 
de  escala  pode  estar  explicando  um  tanto  da  covariância 
entre  itens. 

Analogamente,  pesquisadores  muitas  vezes  estão  dian¬ 
te  da  solução  da  questão  do  viés  dos  métodos  constantes. 
Viés  dos  métodos  constantes  implica  que  a  covariância 
entre  itens  medidos  é  direcionada  pelo  fato  de  que  algu¬ 
mas  das  respostas,  ou  todas,  são  coletadas  com  o  mesmo 
tipo  de  escala.  Um  questionário  que  usa  somente  escalas 
diferenciais  semânticas,  por  exemplo,  pode  sofrer  viés 
porque  a  forma  de  resposta  com  termos  opostos  se  torna 
responsável  pela  covariância  entre  os  itens.  Assim,  a  cova¬ 
riância  poderia  ser  explicada  pela  maneira  como  respon- 
dentes  usam  um  certo  tipo  de  escala  juntamente  com  o 
conteúdo  dos  itens  de  escala,  ou  no  lugar  deste  conteúdo. 
Aqui,  uma  ilustração  simples  é  dada  usando  o  exemplo 
da  HBAT.  Ela  mostra  como  um  modelo  de  CFA  pode 
ser  empregado  para  examinar  a  possibilidade  de  vieses  de 
medida  na  forma  de  um  fator  de  incômodo. 

O  questionário  dos  empregados  da  HBAT  consiste  de 
diversos  tipos  diferentes  de  escalas  de  avaliação.  Apesar 
de  poder  ser  argumentado  que  respondentes  preferem  um 
único  formato  em  qualquer  questionário,  diversas  vanta¬ 
gens  surgem  ao  se  usar  um  pequeno  número  de  formatos 
distintos.  Uma  vantagem  é  que  a  extensão  do  viés  sobre 
os  resultados  em  qualquer  tipo  de  escala  em  particular 
pode  ser  avaliada  usando-se  CFA. 


Neste  caso,  a  HBAT  está  com  receio  de  que  os  itens  di¬ 
ferenciais  semânticos  estejam  causando  viés  de  medida. 
O  analista  argumenta  que  os  respondentes  têm  padrões 
consistentes  de  respostas  para  escalas  diferenciais  semân¬ 
ticas,  não  importando  qual  seja  o  assunto  do  item.  Logo, 
um  fator  diferencial  semântico  pode  ajudar  a  explicar 
resultados.  Um  modelo  CFA  pode  ser  usado  para  testar 
esta  proposição.  Uma  maneira  de  fazer  isso  é  criando  um 
construto  adicional  que  também  seja  postulado  como  a 
causa  dos  itens  diferenciais  semânticos.  Neste  caso,  os 
itens  EP4,  JS2,  JS3,  AC2  e  SI4  são  medidos  com  escalas 
diferenciais  semânticas.  Assim,  o  modelo  precisa  estimar 
caminhos  entre  este  novo  construto  e  esses  itens  medi¬ 
dos.  A  adição  de  um  fator  de  incômodo  deste  tipo  viola 
os  princípios  da  boa  medição,  e  assim  o  novo  modelo  não 
terá  propriedades  de  medição  congênere. 

Modificaremos  o  modelo  CFA  original  da  HBAT 
mostrado  na  Figura  11-8.  Um  sexto  construto  é  introdu¬ 
zido  (I5).  A  seguir,  caminhos  de  dependência  (causais, 
neste  caso)  seriam  estimados  (esboçados,  caso  se  empre¬ 
gue  um  diagrama  de  caminhos)  de  para  EP4,  JS2,  JS3, 
AC2  e  SI4.  Logo,  o  padrão  fatorial  não  exibe  mais  estru¬ 
tura  simples,  pois  cada  uma  dessas  variáveis  medidas  é 
agora  determinada  por  seu  fator  conceituai  e  pelo  novo 
construto  ^5. 


O  analista  testa  este  modelo  e  observa  as  estatísti¬ 
ca  de  ajuste  a  seguir.  O  =  232,6  com  174  graus  de  li¬ 
berdade,  e  a  RMSEA,  o  PNFI  e  o  CFI  são  0,028,  0,80 
e  0,99,  respectivamente.  Os  caminhos  adicionados  não 
fornecem  um  ajuste  geral  ruim,  apesar  da  RMSEA  ter 
crescido  um  pouco  e  o  PNFI  ter  diminuído.  Não  obs¬ 
tante,  Ax^  =  4,0  (236,6  -  232,6),  com  5  (179  -  174)  graus 
de  liberdade,  é  insignificante.  Além  disso,  nenhuma  das 
estimativas  associadas  com  o  fator  de  viés  (^5)  é  signi- 
ficante.  As  estimativas  completamente  padronizadas  de 
lambda  (cargas  fatoriais)  e  os  valores-í  correspondentes 
são  mostrados  aqui: 


Parâmetro 

Estimativa 

Valor-í 

^2,6 

0,14 

1,19 

^13,6 

-0,01 

-0,08 

^xl7,6 

0,16 

1,32 

^xl9,6 

0,07 

0,84 

^x21,6 

0,20 

1,48 

Ainda,  os  valores  para  as  estimativas  paramétricas 
originais  se  mantêm  virtualmente  inalterados  também. 
Assim,  com  base  nas  comparações  de  ajuste  do  modelo, 
nas  estimativas  insignificantes  de  parâmetros  e  na  estabi¬ 
lidade  paramétrica,  nenhuma  evidência  sustenta  a  propo¬ 
sição  de  que  respostas  para  itens  diferenciais  semânticos 
estejam  provocando  vieses  nos  resultados.  O  analista  da 
HBAT  conclui,  portanto,  que  este  caso  não  está  sujeito  a 
viés  de  medida.  Outro  fator  poderia  ser  adicionado  para 
atuar  como  potencial  causa  perturbadora  para  os  itens 
representando  outro  tipo  de  escala,  como  todos  os  itens 
Likert.  O  teste  prosseguiria  de  maneira  muito  parecida. 

O  resultado  final  de  todos  esses  testes  é  que  o  pesqui¬ 
sador  pode  prosseguir  testando  hipóteses  mais  específi¬ 
cas  sobre  retenção  de  empregados  e  construtos  relacio¬ 
nados  -  o  tópico  do  próximo  capítulo. 


Resumo 

O  amplo  uso  de  análise  fatorial  confirmatória  tem  me¬ 
lhorado  muito  a  medição  quantitativa  nas  ciências  so¬ 
ciais.  Pesquisadores  agora  dispõem  de  uma  ferramenta 
que  fornece  um  forte  teste  para  a  teoria  de  mensuração 
de  alguém.  A  principal  vantagem  é  que  o  pesquisador 
pode  testar  analiticamente  uma  teoria  conceitualmen- 
te  fundamentada,  explicando  como  que  diferentes  itens 
medidos  representam  importantes  medidas  psicológicas, 
sociológicas  ou  de  negócios.  Quando  resultados  de  CFA 
são  combinados  com  testes  de  validade  de  construto,  pes¬ 
quisadores  podem  obter  uma  compreensão  completa  da 
qualidade  de  suas  medidas.  Portanto,  quando  passamos 
de  procedimentos  multivariados  exploratórios  para  testes 
empíricos  mais  específicos  de  idéias  conceituais,  CFA  se 
torna  uma  ferramenta  multivariada  essencial. 
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É  difícil  destacar  em  um  parágrafo  ou  dois  os  pontos 
importantes  sobre  CFA.  No  entanto,  alguns  pontos  estra¬ 
tégicos  que  ajudam  a  entender  e  usar  CFA  incluem  aque¬ 
les  correspondentes  aos  objetivos  do  capítulo: 

Distinguir  entre  análise  fatorial  exploratória  e  análise  fa¬ 
torial  confirmatória.  CFA  não  pode  ser  conduzida  ade¬ 
quadamente,  sem  que  o  pesquisador  possa  especificar  o 
número  de  construtos  que  existem  dentro  dos  dados  a 
serem  analisados  e  quais  medidas  específicas  devem  ser 
designadas  para  cada  um  desses  construtos.  Em  contra¬ 
partida,  EFA  é  conduzida  sem  conhecimento  de  qualquer 
uma  dessas  coisas.  A  EFA  não  fornece  uma  avaliação  de 
ajuste.  A  CFA  faz  isso. 

Avaliar  a  validade  de  construto  de  um  modelo  de  men- 
suração.  Validade  de  construto  é  essencial  para  confir¬ 
mar  um  modelo  de  mensuração.  Múltiplos  componentes 
de  validade  de  construto  incluem  validade  convergente, 
validade  discriminante,  validade  de  expressão  e  validade 
nomológica.  Confiabilidades  de  construto  e  estimativas 
de  variância  extraída  são  úteis  para  estabelecer  validade 
convergente.  Validade  discriminante  é  sustentada  quando 
a  variância  média  extraída  para  um  construto  é  maior  do 
que  a  variância  compartilhada  entre  construtos.  Valida¬ 
de  de  expressão  é  estabelecida  quando  os  itens  medidos 
são  conceitualmente  consistentes  com  a  definição  de  um 
construto.  Validade  nomológica  é  sustentada  na  medida 
em  que  um  construto  se  relaciona  com  outros  de  uma  ma¬ 
neira  teoricamente  consistente. 

Saber  como  representar  um  modelo  de  mensuração 
usando  um  diagrama  de  caminhos.  Diagramas  visuais 
ou  de  caminhos  são  ferramentas  úteis  para  ajudar  a  tra¬ 
duzir  uma  teoria  de  mensuração  em  algo  que  possa  ser 
testado  usando-se  procedimentos  CFA  padrão.  Progra¬ 
mas  SEM  fazem  uso  desses  diagramas  de  caminhos  para 
mostrar  como  construtos  são  relacionados  com  variáveis 
medidas.  A  boa  prática  da  medição  sugere  que  um  mo¬ 
delo  de  mensuração  deve  ser  congênere,  o  que  significa 
que  cada  variável  medida  deve  carregar  sobre  apenas  um 
construto.  Exceto  no  caso  em  que  fortes  motivos  teóri¬ 
cos  indiquem  o  contrário,  todos  os  construtos  devem  ser 
conectados  com  uma  seta  curvilínea  de  dois  sentidos  no 
diagrama  de  caminhos,  mostrando  que  a  correlação  en¬ 
tre  construtos  será  estimada. 

Entender  os  princípios  básicos  de  identificação  estatísti¬ 
ca  e  conhecer  algumas  das  principais  causas  dos  proble¬ 
mas  de  identificação  da  SEM.  Identificação  estatística 
é  extremamente  importante  para  obter  resultados  de 
CFA  úteis.  Modelos  sub-identificados  não  podem  pro¬ 
duzir  resultados  confiáveis.  Modelos  super -identificados 
com  um  número  excessivo  de  graus  de  liberdade  são  exi¬ 
gidos  para  identificação  estatística.  Além  disso,  cada  pa¬ 
râmetro  estimado  deve  ser  identificado  estatisticamente. 


Muitos  problemas  associados  com  CFA  e  SEM  em  geral, 
incluindo  aqueles  de  identificação  e  convergência,  resul¬ 
tam  de  duas  fontes:  tamanho  amostrai  insuficiente  e  nú¬ 
mero  insuficiente  de  variáveis  indicadoras  por  construto. 
O  pesquisador  é  fortemente  encorajado  a  fornecer  uma 
amostra  adequada  com  base  nas  condições  do  modelo  e 
a  planejar  pelo  menos  três  ou  quatro  itens  medidos  para 
cada  construto. 

Compreender  o  conceito  de  ajuste  na  forma  como  se 
aplica  a  modelos  de  mensuração  e  ser  capaz  de  avaliar 
o  ajuste  de  um  modelo  de  análise  fatorial  confirmató¬ 
ria.  CFA  é  uma  ferramenta  multivariada  que  computa 
uma  matriz  de  covariância  prevista  usando  as  equações 
que  representam  a  teoria  testada.  A  matriz  de  covariân¬ 
cia  prevista  é  então  comparada  com  a  matriz  de  cova¬ 
riância  real  computada  a  partir  dos  dados  originais.  Em 
termos  gerais,  modelos  se  ajustam  bem  à  medida  que  tais 
matrizes  se  tornam  mais  parecidas.  Estatísticas  de  ajus¬ 
te  múltiplo  devem  ser  relatadas  para  ajudar  a  entender 
o  quão  bem  um  modelo  verdadeiramente  se  ajusta.  Elas 
incluem  a  estatística  de  qualidade  de  ajuste  x  e  graus  de 
liberdade,  um  índice  de  ajuste  absoluto  (como  o  GFI  ou 
a  SRMR)  e  um  índice  de  ajuste  incremental  (como  o  TLI 
ou  o  CFI).  Um  desses  índices  deve  ser  também  um  in¬ 
dicador  de  má  qualidade  de  ajuste,  como  a  SRMR  ou  a 
RMSEA.  Nenhum  valor  absoluto  para  os  vários  índices 
de  ajuste  sugere  bom  ajuste;  apenas  orientações  estão 
disponíveis  para  esta  tarefa.  Os  valores  associados  com 
modelos  aceitáveis  variam  de  uma  situação  para  outra  e 
dependem  consideravelmente  do  tamanho  da  amostra, 
do  número  de  variáveis  medidas  e  das  comunalidades  dos 
fatores. 

Saber  como  SEM  pode  ser  usada  para  comparar  resul¬ 
tados  eutre  grupos,  o  que  iucluí  a  avaliação  da  validação 
cruzada  de  um  modelo  de  mensuração.  Comparações  de 
múltiplos  grupos  podem  ser  úteis.  Elas  demandam  que  o 
pesquisador  teste  vários  graus  de  invariância  ou  a  igualda¬ 
de  entre  os  grupos  a  serem  comparados.  A  CFA  fornece 
uma  maneira  para  executar  tais  testes,  ò^x  é  uma  estatís¬ 
tica  útil  para  testar  invariância  e  para  extrair  conclusões 
sobre  as  diferenças  entre  grupos. 

Questões 

1.  Como  CFA  difere  de  EFA? 

2.  Liste  e  defina  os  componentes  de  validade  de  construto. 

3.  Quais  são  os  passos  no  desenvolvimento  de  uma  nova  medi¬ 
da  de  construto? 

4.  Quais  são  as  propriedades  de  um  modelo  de  mensuração 
congênere?  Por  que  elas  correspondem  às  propriedades  da 
boa  mensuração? 

5.  Quais  são  as  considerações  para  determinar  se  indicadores 
devem  ser  modelados  como  formativos  ou  reflexivos? 

6.  Q  que  é  um  caso  Heywood  e  como  ele  é  tratado  usando-se 
SEM? 
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7.  Qual  é  a  diferença  entre  um  índice  de  qualidade  de  ajuste  e 
um  de  má  qualidade  de  ajuste? 

8.  É  possível  estabelecer  cortes  precisos  para  índices  de  ajuste 
de  CFA?  Justifique  sua  resposta. 

9.  Descreva  os  passos  de  uma  busca  de  especificação. 

10.  Quais  condições  tornam  apropriado  um  modelo  fatorial  de 
segunda  ordem? 

11.  Quais  condições  devem  ser  satisfeitas  a  fim  de  se  obter  con¬ 
clusões  válidas  sobre  diferenças  em  relações  e  diferenças  em 
médias  entre  três  grupos  distintos  de  respondentes  -  um  do 
Canadá,  um  da  Itália  e  outro  do  Japão?  Justifique  sua  res¬ 
posta. 


12.  Um  entrevistador  coleta  dados  sobre  satisfação  com  auto¬ 
móveis.  Dez  questões  são  coletadas  por  meio  de  uma  entre¬ 
vista  pessoal.  Em  seguida,  o  respondente  responde  outros 
20  itens,  marcando-os  com  um  lápis.  Como  CFA  pode  ser 
usada  para  testar  se  o  formato  da  questão  provoca  algum 
viés  sobre  os  resultados? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustra  problemas  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 


Apêndice  1 1  A 


Questões  de  especificação  em  programas  SEM 


Neste  apêndice  fornecemos  uma  visão  geral  de  questões 
de  especificação  em  SEM  para  dois  pacotes  computacio¬ 
nais.  Primeiro  examinamos  tais  questões  para  LISREL  e 
em  seguida  para  AMOS. 

Problemas  de  especificação  com  LISREL 

Especificação  é  bastante  diferente  usando-se  CEA  em 
comparação  com  EFA.  A  Figura  llA-1  ilustra  como  o 
modelo  de  mensuração  da  HBAT  é  comunicado  usan¬ 
do  os  comandos  do  programa  LISREL.  O  usuário  pode 
utilizar  os  menus  iconográficos  para  gerar  a  sintaxe  que 
corresponde  ao  modelo  de  mensuração,  esboçar  o  modelo 
usando  um  diagrama  de  caminhos,  ou  escrever  o  código 
apropriado  em  uma  janela  de  sintaxe.  Se  alguma  das  duas 
primeiras  alternativas  for  seguida  corretamente,  LISREL 
pode  gerar  a  sintaxe  do  programa  automaticamente.  A 
HBAT  decidiu  escrever  os  comandos  do  programa.  Nú¬ 
meros  de  linhas  foram  adicionados  à  Figura  IIA-I  para 
fins  de  referência.  Os  números  das  linhas  não  são  necessá¬ 
rios  como  entrada  em  LISREL. 

A  linha  01  é  simplesmente  uma  declaração  do  título.  O 
usuário  pode  escrever  o  que  quiser  nesta  linha,  que  ajuda 
a  identificar  a  análise.  A  linha  02  é  uma  declaração  dos  da¬ 
dos.  Deve  começar  com  DA  e  diz  ao  programa  SEM  que 
28  variáveis  são  incluídas  no  conjunto  de  dados  de  399  ob¬ 
servações.  Apesar  de  o  conjunto  original  de  dados  ter  400 
observações,  um  ponto  de  uma  resposta  foi  descartado 
por  estar  fora  do  intervalo,  e  outro  por  estar  simplesmen¬ 
te  faltando.  Usando  eliminação  aos  pares  e  a  regra  prática 
anterior,  o  número  de  observações  foi  fixado  no  número 
mínimo  de  observações  para  qualquer  computação  de  co- 
variância.  Neste  caso,  pelo  menos  399  observações  estão 
envolvidas  em  alguma  computação  de  covariância.  Este 
número  pode  ser  verificado  examinando-se  a  saída  estatís¬ 
tica  para  as  computações  de  covariância.  Se  a  eliminação 
listwise  tivesse  sido  usada,  então  NO  seria  fixado  em  398, 
uma  vez  que  ambos  os  casos  com  uma  resposta  perdida 
seriam  eliminados  de  quaisquer  cálculos.  MA  =  CM  sig¬ 
nifica  que  a  matriz  de  entrada  é  de  covariância.  A  linha 
03  indica  que  uma  matriz  de  covariância  (CM)  é  armaze¬ 
nada  em  um  arquivo  (FI)  chamado  HBAT.COV.  A  linha 
04  é  uma  declaração  de  rótulo  e  deve  começar  com  LA. 
Os  rótulos  são  listados  na  linha  abaixo.  As  linhas  05  e  06 
mostram  os  rótulos  para  as  28  variáveis.  Usuários  podem 
escolher  quaisquer  rótulos  que  o  programa  respectivo 
permita.  Neste  caso,  a  HBAT  rotulou  as  variáveis  com 
iniciais  (em  inglês)  dos  nomes  dos  construtos,  como  JSI, 


JS2, ...,  SI4.  Poderia  ter  sido  usado  XI-X28  ou  VI-V28  ou 
qualquer  outra  abreviação  parecida.  Um  rótulo  é  neces¬ 
sário  para  cada  variável  no  conjunto  de  dados. 

A  linha  07  é  uma  declaração  de  escolha  e  deve  ser 
denotada  por  SE  (de  SElect).  Ela  indica  que  as  variáveis 
listadas  nas  próximas  linhas  são  aquelas  a  serem  usadas 
na  análise.  Uma  /  indica  o  final  da  lista  de  variáveis  es¬ 
colhidas.  A  ordem  é  particularmente  importante.  O  que 
quer  que  seja  listado  em  primeiro  lugar  se  torna  a  primei¬ 
ra  variável  observada.  Por  exemplo,  a  primeira  variável 
medida  no  programa  CEA,  designada  como  Xj  (o  x  minús¬ 
culo  com  índice  aqui  representando  a  primeira  variável 
observada  selecionada  e  correspondendo  à  estimativa  de 
carga  i),  será  representada  pela  variável  introduzida 
rotulada  “JSI”.  “SI4”,  a  vigésima  primeira  variável  na  li¬ 
nha  SE,  se  torna  a  vigésima  primeira  variável  medida  ou 
X21,  e  as  estimativas  de  carga  associadas  com  esta  variável 
serão  encontradas  na  vigésima  primeira  linha  da  matriz  de 
cargas  fatoriais  (X^ji.s  de  A^,  neste  caso). 

Somente  em  raras  circunstâncias  as  variáveis  serão  ar¬ 
mazenadas  no  arquivo  original  de  dados,  na  ordem  exa¬ 
ta  que  combinaria  a  configuração  correspondente  com 
a  teoria  sendo  testada.  Além  disso,  o  usuário  raramente 
inclui  todas  as  variáveis  na  CEA,  pois  a  maior  parte  dos 
dados  também  contém  algumas  variáveis  de  classificação 
ou  de  identificação,  bem  como  variáveis  potenciais  que 
foram  medidas  mas  não  incluídas  na  CEA.  O  processo  de 
seleção,  seja  por  comandos  ou  pelo  menu  de  ícones,  é  a 
maneira  com  que  as  variáveis  envolvidas  na  CEA  são  es¬ 
colhidas. 

A  linha  09  é  uma  declaração  de  modelo  e  deve  come¬ 
çar  com  MO.  Declarações  de  modelo  indicam  os  núme¬ 
ros  respectivos  de  variáveis  medidas  e  latentes  e  podem 
incluir  descrições  das  matrizes  fundamentais  de  parâme¬ 
tros.  As  abreviações  mostradas  aqui  são  relativamente 
fáceis  de  se  seguir.  NX  se  refere  ao  número  de  variáveis 
X  que,  neste  caso,  é  21.  NK  é  o  número  de  ^  construtos, 
que  aqui  é  5.  PH  indica  que  a  matriz  de  covariâncias  entre 
os  5  construtos  (<1>)  será  simétrica  (SY)  e  livre  (FR).  Em 
outras  palavras,  as  variâncias  de  construtos  (a  diagonal 
de  <1>)  e  as  covariâncias  entre  cada  par  de  construtos  se¬ 
rão  estimadas.  TD  é  a  matriz  de  variâncias  e  covariâncias 
de  erro.  Ela  é  diagonal  (Dl)  e  livre  (FR),  de  modo  que 
apenas  variâncias  de  erro  são  estimadas.  Qualquer  matriz 
de  parâmetros  não  listada  na  linha  MO  é  fixada  no  valor 
padrão  do  programa.  O  leitor  pode  consultar  a  documen¬ 
tação  do  programa  quanto  a  outras  possíveis  abreviações 
e  defaults. 
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EXEMPLO  DE  CEA  DE  HBAT 
DA  NI=28  NO=399  MA=CM 
CM  FI=HBAT.COV 
LA 

ID  JSl  OCl  0C2  EPl  OC3  0C4  EP2  EP3  ACl  EP4  JS2  JS3  AC2  SIl  JS4  SI2  JS5 
AC3  SI3  AC4  SI4  Cl  C2  C3  AGE  EXP  JP 
SE 

JSl  JS2  JS3  JS4  JS5  OCl  OC2  OC3  0C4  SIl  SI2  SI3  SI4  EPl  EP2  EP3  EP4  ACl  AC2  AC3  AC4/ 

MO  NX=21  NK=5  PH=SY,FR  TD=DI,FR 

VA  1.0  LX  1  1  LX  6  2  LX  10  3  LX  14  4  LX  18  5 

FR  LX  2  1  LX  3  1  LX  4  1  LX  5  1  LX  7  2  LX  8  2  LX  9  2 

FR  LX  11  3  LX  12  3  LX  13  3  LX  15  4  LX  16  4  LX  17  4  LX  19  5  LX  20  5  LX  21  5 

LK 

■JS'  'OC  'SI'  'EP'  'CA' 

PD 

OU  SC  RS  ND=2 


01 
02 
03 
04 
05 
06 
07 
08 
09 
10 
11 
12 

13 

14 

15 

16 

FIGURA  11 A-1  A  sintaxe  LISREL  para  o  modelo  CFA  da  HBAT. 

A  linha  10  é  uma  declaração  de  valor  (VA).  Declara¬ 
ções  deste  tipo  designam  um  valor  a  um  parâmetro  fixado. 
Neste  caso,  cada  um  dos  parâmetros  listados  nesta  linha  é 
fixado  em  1,0.  Tal  comando  marca  a  escala  para  os  cons- 
trutos  de  forma  que  um  item  é  fixado  em  1,0  sobre  cada 
construto.  LX  1,1  representa  o  parâmetro  para  a  primeira 
carga  sobre  o  primeiro  construto  j).  O  L  se  refere  a 
lambda,  o  X  é  uma  variável  x,  e  1  e  1  correspondem  aos 
números  da  variável  medida  e  do  construto,  respectiva¬ 
mente.  Assim,  LX  2,1  se  refere  ao  parâmetro  represen¬ 
tando  a  carga  fatorial  da  segunda  variável  medida  (^2) 
sobre  o  primeiro  construto  latente  ou  seja,  Car¬ 
gas  fatoriais  em  um  modelo  fatorial  reflexivo  podem  ser 
igualmente  expressadas  como  caminhos  causais.  Usando 
esta  terminologia,  LX  21,5  corresponde  ao  caminho  do 
construto  ^5  para  X21  (X^ji  s)- 

As  linhas  11  e  12  começam  com  FR  e  designam  as  esti¬ 
mativas  de  cargas  livres.  As  16  cargas  que  aparecem  nes¬ 
sas  linhas  serão  estimadas  e  mostradas  como  resultados 
fatoriais  na  saída  (em  A^).  Com  as  cinco  estimativas  fixa¬ 
das  em  1  na  linha  10  e  16  cargas  estimadas,  84  elementos 
permanecem  no  padrão  fatorial  fixados  em  zero  (21  variá¬ 
veis  X  5  construtos  =  105  cargas  potenciais;  105  -  16  -  5  = 
84).  Lembre-se  que  EFA  produziria  uma  estimativa  para 
todas  as  105  cargas.  O  padrão  de  cargas  livres  e  fixadas 
corresponde  à  estrutura  teórica  proposta  no  modelo  de 
mensuração.  Consistentemente  com  o  modelo  congêne¬ 
re  proposto,  apenas  uma  estimativa  de  carga  é  livre  para 
cada  variável  indicadora  medida.  Em  outras  palavras, 
cada  variável  indicadora  medida  carrega  somente  sobre 
um  construto. 

A  linha  13  é  outra  declaração  de  rótulo.  E  onde  os  ró¬ 
tulos  para  os  construtos  latentes  podem  ser  listados.  LK 
se  refere  a  rótulos  para  ksi  (^).  Os  rótulos  reais  aparecem 
na  próxima  ou  nas  próximas  linhas,  se  necessário.  Neste 
caso,  os  rótulos  correspondem  às  abreviações  de  constru¬ 


tos  dadas  (JS,  OC,  Sl,  EP  e  AC).  A  linha  15,  com  a  abre¬ 
viação  PD,  pede  que  um  diagrama  de  caminho  seja  esbo¬ 
çado  pelo  programa,  descrevendo  o  modelo  especificado 
e  as  estimativas  de  caminhos.  A  linha  OU  (16)  é  exigida  e 
é  onde  qualquer  uma,  dentre  as  numerosas  opções,  pode 
ser  requisitada.  Por  exemplo,  a  SC  está  requisitando  que 
estimativas  completamente  padronizadas  sejam  incluídas 
na  saída.  RS  requer  que  todos  os  resíduos  resultantes  da 
estimativa  do  modelo  sejam  mostrados,  incluindo  resídu¬ 
os  tanto  padronizados  quanto  não-padronizados.  ND  =  2 
significa  que  resultados  serão  mostrados  com  dois  dígitos 
significativos. 

Por  vezes,  um  pesquisador  pode  querer  colocar  res¬ 
trições  adicionais  sobre  um  modelo  CFA.  Por  exemplo, 
às  vezes  é  útil  fixar  dois  ou  mais  parâmetros  como  sen¬ 
do  iguais.  Isso  produziria  uma  solução  que  exigiria  que 
os  valores  para  esses  parâmetros  fossem  os  mesmos.  Se, 
por  exemplo,  equivalência-tau  é  assumida,  esta  restrição 
é  necessária.  Com  LISREL,  esta  tarefa  pode  ser  realizada 
usando  a  linha  de  comando  EQ.  Analogamente,  pesquisa¬ 
dores  de  vez  em  quando  querem  fixar  um  parâmetro  espe¬ 
cífico  em  um  valor  dado  usando  a  linha  de  comando  VA. 
Informação  adicional  sobre  restrições  pode  ser  consegui¬ 
da  na  documentação  do  programa  SEM  de  escolha. 

Especificação  com  AMOS 

Comandos  de  programa  podem  também  ser  escritos  para 
AMOS  de  modo  muito  parecido  com  LISREL.  Contudo, 
a  suposição  com  AMOS  é  a  de  que  o  usuário  trabalhará 
com  um  diagrama  de  caminhos.  Essencialmente,  as  ins¬ 
truções  para  desenhar  o  diagrama  de  caminhos,  mostrado 
na  Figura  11-8,  fornecem  a  estrutura  a  partir  da  qual  se 
constrói  o  modelo.  No  entanto,  o  usuário  deve  designar 
variáveis  para  cada  retângulo,  que  representa  uma  variá¬ 
vel  medida,  e  nomes  de  construtos  para  cada  oval.  Ana¬ 
logamente,  o  usuário  deve  especificar  nomes  para  cada 


APÊNDICE  IIA  Questões  de  Especificação  em  Programas  SEM  539 


termo  de  erro  de  variável  medida.  Em  seguida,  as  setas 
apropriadas  devem  ser  esboçadas  para  formar  o  modelo. 
O  usuário  deve  ser  cuidadoso,  para  que  variáveis  sejam 
designadas  corretamente.  ícones  podem  ser  usados  para 
adicionar  restrições  no  modelo  e  para  executar  aplicações 
avançadas  como  análise  de  múltiplos  grupos. 

Resultados  usando  diferentes  programas  SEM 

Apesar  de  variarem  as  entradas  para  diferentes  progra¬ 
mas  SEM,  os  resultados  deveriam  ser  essencialmente 
os  mesmos.  Os  algoritmos  podem  variar  um  pouco,  mas 
um  modelo  que  retrata  bom  ajuste  usando  um  programa 
SEM  deve  também  mostrar  bom  ajuste  em  outro.  Cada 
um  tem  suas  próprias  idiossincrasias  que  podem  impedir 
que  a  mesma  especificação  de  modelo  seja  estimada.  Por 
exemplo,  alguns  tornam  mais  ou  menos  difícil  usar  cada 
uma  das  opções  de  variáveis  perdidas  já  mencionadas. 
Cada  abordagem  pode  ser  facilmente  especificada  com 
LISREL,  mas  AMOS  usa  apenas  EM.  Eliminação  listwi- 
se,  por  exemplo,  pode  ser  executada  com  AMOS  exami- 
nando-se  observações  com  dados  perdidos  antes  de  se  co¬ 
meçar  a  rotina  AMOS  (p.ex.,  com  SPSS). 

As  estatísticas  de  ajuste  geral  do  modelo,  incluindo 
o  e  todos  os  índices  de  ajuste,  não  deveriam  variar  de 
forma  significativa  entre  os  programas.  Analogamente,  as 
estimativas  de  parâmetros  também  não  deveriam  variar 


de  forma  a  gerar  conseqüências.  Diferenças  podem  ser  es¬ 
peradas  em  duas  áreas. 

Uma  área  na  qual  diferenças  nas  estimativas  numéri¬ 
cas  podem  variar  está  nos  resíduos.  Em  particular,  algu¬ 
mas  diferenças  podem  ser  encontradas  entre  AMOS  e  os 
demais  programas.  Sem  entrar  nos  detalhes,  AMOS  usa 
um  método  diferente  para  escalonar  os  termos  de  erro  de 
variáveis  medidas,  em  comparação  com  outros  progra¬ 
mas.  Este  formato  tem  a  ver  com  o  estabelecimento  da 
escala  de  termos  de  erro,  parecido  com  a  maneira  como 
estabelecemos  a  escala  para  os  construtos  latentes  em  um 
modelo  SEM.  Este  método  pode  provocar  diferenças  re¬ 
lativamente  pequenas  nos  valores  para  resíduos  e  resídu¬ 
os  padronizados  computados  com  AMOS.  No  entanto,  as 
diferenças  não  afetam  as  regras  práticas  dadas  neste  ca¬ 
pítulo. 

Outra  área  na  qual  estimativas  numéricas  podem  va¬ 
riar  é  nos  índices  de  modificação.  Novamente,  AMOS  as¬ 
sume  uma  abordagem  computacional  diferente  dos  outros 
programas  SEM.  A  diferença  reside  em  se  a  mudança  no 
ajuste  é  isolada  em  um  ou  diversos  parâmetros.  Uma  vez 
mais,  apesar  de  o  usuário  poder  encontrar  diferenças  em 
MI  na  comparação  entre  AMOS  e  outros  programas,  tais 
diferenças  não  devem  ser  tão  grandes  a  ponto  de  afetarem 
as  conclusões  na  maioria  das  situações.  Assim,  novamen¬ 
te,  as  regras  práticas  para  o  MI  valem  para  qualquer  pro¬ 
grama  SEM. 


Apêndice  1 IB 


Variável  medida  e  termos  de  intercepto  no  construto 


Freqüentemente  se  torna  necessário  usar  as  médias  de 
variável  medida  e  variável  latente  para  tirar  conclusões 
sobre  similaridades  e  diferenças  entre  grupos.  Até  ago¬ 
ra,  nenhuma  equação  de  SEM  mostrou  um  valor  médio. 
Agora,  no  entanto,  as  médias  devem  ser  consideradas. 

Uma  maneira  de  perceber  o  valor  médio  de  qualquer 
variável  medida  é  pensar  nela  como  a  soma  de  seu  ter¬ 
mo  de  intercepto-zero  com  a  carga  fatorial,  vezes  o  valor 
médio  do  construto  latente.  Em  forma  matemática,  isso 
se  parece  com  o  que  se  segue,  expresso  em  termos  de 
[15]: 


O  Kçj  representa  o  valor  médio  para  o  primeiro  cons¬ 
truto  latente  o  corresponde  à  média  da  variável 
medida  Xj,  e  o  é  o  intercepto-zero  para  x^.  Em  termos 
mais  gerais,  k  representa  a  média  para  qualquer  construto 
latente.  Matematicamente,  é  também  o  termo  de  intercep¬ 
to-zero  quando  se  isola  Ainda  que  a  matemática  neste 
cálculo  possa  ser  difícil  de  se  acompanhar,  é  importante 
saber  que  a  menos  que  instruções  específicas  sejam  dadas 
ao  programa  SEM,  ele  não  considerará  e  nem  estimará 
médias  de  construtos  de  tipo  algum. 

Esta  equação  pode  ser  reescrita  para  isolar  ou  k. 
Se  alguma  hipótese  se  refere  a  diferenças  entre  médias  de 
construtos,  tais  diferenças  podem  ser  encontradas  nos  va¬ 
lores  relatados  para  k. 
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CAPÍTULO 

SEM:  Teste  de  um  Mqdélo  Estrutural 


OBJETIVOS  DE  APRENDIZAGEM 

Ao  completar  este  capítulo,  você  deverá  ser  capaz  de  fazer  o  seguinte: 

■  Distinguir  um  modeio  de  mensuração  de  um  modelo  estrutural. 

■  Descrever  as  similaridades  entre  SEM  e  outras  técnicas  multivariadas. 

■  Descrever  um  modelo  com  relações  de  dependência  usando  um  diagrama  de  caminhos. 

■  Testar  um  modelo  estrutural  usando  SEM. 

■  Diagnosticar  problemas  com  resultados  de  SEM. 

■  Compreender  os  conceitos  de  mediação  e  moderação  estatística. 


APRESENTAÇÃO  DO  CAPÍTULO 

O  processo  de  testar  um  modelo  de  equações  estruturais  (SEM)  foi  introduzido  no  Capítulo  10  como 
algo  que  envolve  dois  modelos  identificáveis.  O  Capítulo  1 1  descreveu  o  primeiro  modelo  em  SEM  com 
uma  visão  geral  do  desenvolvimento  de  um  modelo  de  mensuração  com  base  em  teoria  e,  em  seguida, 
seu  teste  com  análise  fatorial  confirmatória  (CFA).  CFA  foi  comparada  e  contrastada  com  análise  fatorial 
exploratória  (EFA)  para  ilustrar  os  conceitos  que  elas  têm  em  comum  como  cargas  fatoriais,  covariância 
e  correlação.  CFA  testa  teoria  de  mensuração  baseada  na  covariância  entre  todos  os  itens  medidos. 
Como  tal,  0  modelo  CFA  fornece  a  fundamentação  para  todo  o  restante  do  teste  da  teoria. 

Este  capítulo  se  concentra  no  segundo  modelo:  testar  o  modelo  teórico  ou  estrutural,  onde  o  principal 
foco  se  desvia  para  as  relações  entre  construtos  latentes.  Com  SEM,  examinamos  relações  entre  construtos 
latentes  de  forma  parecida  como  examinamos  as  relações  entre  variáveis  independentes  e  dependentes 
em  análise  de  regressão  múltipla  (Capítulo  4).  Ainda  que  tenhamos  visto  que  fatores  múltiplos  representan¬ 
do  construtos  teóricos  poderiam  entrar  como  variáveis  em  modelos  de  regressão,  estes  modelos  tratavam 
variáveis  e  construtos  exatamente  da  mesma  forma.  Ou  seja,  regressão  múltipla  não  leva  em  conta  qual¬ 
quer  uma  das  propriedades  de  mensuração  que  acompanham  a  formação  de  um  construto  de  múltiplos 
itens  quando  se  estima  a  relação.  SEM  fornece  uma  maneira  melhor  de  empiricamente  examinar  um  mode¬ 
lo  teórico  por  meio  do  envolvimento  do  modelo  de  mensuração  e  do  modelo  estrutural  em  uma  análise.  Em 
outras  palavras,  ela  leva  em  conta  informações  sobre  mensuração  no  teste  do  modelo  estrutural. 

O  capítulo  começa  descrevendo  um  pouco  da  terminologia  associada  com  o  teste  do  modelo  estru¬ 
tural  com  SEM.  Além  disso,  discutimos  as  similaridades  e  diferenças  entre  SEM  e  outras  técnicas  mul¬ 
tivariadas.  Descrevemos  então  os  dois  últimos  estágios  (5  e  6)  no  processo  de  seis  passos  para  testar 
modelos  teóricos  e  fornecer  uma  ilustração  usando  o  banco  de  dados  de  HBAT_SEM.  O  capítulo  finaliza 
com  uma  visão  geral  de  diversos  tópicos  avançados.  Diversos  apêndices  tratam  dos  detalhes  das 
equações  estruturais  em  si,  bem  como  de  alguns  detalhes  associados  com  o  uso  de  programas  SEM. 


Termos-chave 

Antes  de  começar  este  capítulo,  reveja  os  termos-chave  para 
desenvolver  uma  compreensão  dos  conceitos  e  da  terminolo¬ 


gia  usada.  Ao  longo  do  capítulo  os  termos-chave  aparecem 
em  negrito.  Outros  pontos  de  ênfase  no  capítulo  e  referências 
cruzadas  de  termos  estão  em  itálico.  Exemplos  ilustrativos  es¬ 
tão  em  quadros. 
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Análise  post  hoc  Testes  após-o-fato  de  relações  para  as  quais 
nenhuma  hipótese  foi  teorizada.  Em  outras  palavras,  um  cami¬ 
nho  é  testado  onde  a  teoria  original  não  Indicou  um  caminho. 

Confusão  de  interpretação  Estimativas  de  medida  para  um 
construto  são  significantemente  afetadas  por  relações  que 
não  são  aquelas  entre  as  medidas  específicas.  É  indicada 
quando  estimativas  de  cargas  variam  substancialmente  de 
um  modelo  SEM  para  outro  que  é  o  mesmo  exceto  pela  mu¬ 
dança  de  especificação  de  uma  ou  mais  relações.  Diferenças 
em  estimativas  de  cargas  indicam  dificuldade  para  separar 
qual  item  indicador  mede  um  construto  latente  em  particular. 

Efeito  direto  Relação  que  conecta  dois  construtos  com  uma 
seta  entre  eles. 

Efeito  indireto  Seqüência  de  relações  com  pelo  menos  um 
construto  mediador  envolvido.  Ou  seja,  uma  seqüência  de 
dois  ou  mais  efeitos  diretos  visualmente  representados  por 
múltiplas  setas  entre  construtos. 

Efeito  mediador  Efeito  de  uma  terceira  variável/construto  inter¬ 
mediando  entre  dois  outros  construtos  relacionados. 

Efeito  moderador  Efeito  de  uma  terceira  variável  ou  construto 
que  muda  a  relação  entre  duas  variáveis/construtos  relacio¬ 
nadas.  Ou  seja,  um  moderador  significa  que  a  relação  entre 
duas  variáveis  muda  com  base  na  quantia  que  uma  outra  va¬ 
riável  acrescentou  ao  modelo. 

Estimativa  paramétrica  estruturai  O  equivalente  SEM  de  um 
coeficiente  de  regressão  que  mede  a  relação  linear  entre  um 
preditor  e  um  resultado. 

Mediação  compieta  Relação  entre  uma  variável  preditora  e 
uma  variável  resultado  se  torna  insignificante  depois  que  um 
mediador  entra  como  preditor  adicional. 

Mediação  parciai  Efeito  quando  uma  relação  entre  um  preditor 
e  um  resultado  é  reduzida,  mas  permanece  significante  quan¬ 
do  um  mediador  também  entra  como  um  preditor  adicional. 

Mínimos  quadrados  parciais  (PLS)  Abordagem  alternativa  de 
estimação  para  SEM  tradicional.  Os  construtos  são  represen¬ 
tados  como  compostos,  com  base  em  resultados  de  análise 
fatorial,  sem  tentativa  de  recriar  covariãncias  entre  itens  me¬ 
didos. 

Modelo  causal  Modeio  estrutural  que  infere  que  relações  têm 
uma  ordem  seqüencial  na  qual  uma  mudança  de  um  lado  traz 
uma  mudança  no  outro. 

Modelo  estrutural  Teoria  estrutural  correspondente  com  um 
conjunto  de  equações  estruturais  que  pode  ser  descrito  por 
meio  de  um  diagrama  visual. 

Modelo  estrutural  saturado  Modelo  SEM  recursivo  que  especi¬ 
fica  0  mesmo  número  de  relações  estruturais  diretas  em  com¬ 
paração  com  0  número  de  possíveis  correlações  de  constru¬ 
tos  na  CEA.  As  estatísticas  de  ajuste  para  um  modelo  teórico 
saturado  devem  ser  as  mesmas  obtidas  para  o  modelo  CEA. 

Modelo  não-recursivo  Modelo  estrutural  contendo  retornos  de 
resposta. 

Modelos  recursivos  Modelos  estruturais  nos  quais  todos  os 
caminhos  entre  construtos  prosseguem  somente  do  constru¬ 
to  antecedente  para  as  conseqüências  (construto  resultado). 
Um  modelo  recursivo  não  contém  retornos  de  resposta  com 
setas  operando  em  um  sentido  oposto  daquelas  que  origina¬ 
ram  0  modelo. 


Processo  SEM  de  dois  passos  Abordagem  para  SEM  na  qual 
0  ajuste  do  modelo  de  mensuração  e  a  validade  de  construto 
são  avaliados  primeiramente  usando-se  CEA  e,  em  seguida, 
0  modelo  estrutural é  testado,  incluindo  uma  avaliação  da  sig- 
nificância  de  relações.  O  modelo  estrutural  é  testado  somente 
depois  que  mensuração  adequada  e  validade  de  construto 
tenham  sido  estabelecidas. 

Retorno  de  resposta  Relação  quando  um  construto  é  visto 
como  preditor  e  resultado  de  outro  construto.  Retornos  de  res¬ 
posta  podem  envolver  relações  diretas  ou  indiretas.  Também 
conhecido  como  um  modelo  não-reoursivo. 

Teoria  estrutural  Representação  conceituai  das  relações  entre 
construtos. 

Unidade  de  análise  Unidade  ou  nível  para  os  quais  resultados  se 
aplicam.  Em  pesquisas  sobre  negócios,  elafreqüentemente  lida 
com  a  escolha  de  testes  de  relações  entre  percepções  indivi¬ 
duais  (de  pessoas)  ou  testes  de  relações  entre  organizações. 


O  QUE  É  UM  MODELO  ESTRUTURAL? 

No  capítulo  anterior,  aprendemos  que  a  meta  da  teoria 
de  mensuração  é  produzir  maneiras  de  medir  conceitos 
de  uma  forma  confiável  e  válida.  Teorias  de  mensuração 
são  testadas  pela  qualidade  com  que  as  variáveis  indica¬ 
doras  de  construtos  teóricos  se  relacionam  entre  si.  As  re¬ 
lações  entre  os  indicadores  são  capturadas  em  uma  matriz 
de  covariância.  CFA  testa  uma  teoria  de  mensuração  pelo 
fornecimento  de  evidência  sobre  a  validade  de  medidas  in¬ 
dividuais  com  base  no  ajuste  geral  do  modelo  e  outras  evi¬ 
dências  de  validade  de  construto.  CFA  por  si  só  é  limitada 
em  sua  habilidade  para  examinar  a  natureza  de  relações 
entre  construtos  além  de  simples  correlações.  Uma  teoria 
de  mensuração  é  então  freqüentemente  um  meio  para  a 
meta  de  examinar  relações  entre  construtos,  e  não  pro¬ 
priamente  a  meta  em  si. 

Uma  teoria  estrutural  é  uma  representação  conceituai 
das  relações  entre  construtos.  Ela  pode  ser  expressa  em 
termos  de  um  modelo  estrutural  que  representa  a  teoria 
com  um  conjunto  de  equações  estruturais  e  é  geralmente 
descrita  com  um  diagrama  visual.  Modelos  estruturais  são 
conhecidos  por  diversos  nomes,  incluindo  um  modelo  te¬ 
órico  ou,  ocasionalmente,  um  modelo  causal.  Um  modelo 
causal  infere  que  as  relações  atendem  às  condições  neces¬ 
sárias  para  causalidade.  As  condições  para  causalidade 
foram  discutidas  no  Capítulo  10  e  o  pesquisador  deve  ser 
muito  cuidadoso  para  não  descrever  que  o  modelo  tem 
inferências  causais,  a  menos  que  todas  as  condições  sejam 
atendidas. 


UM  EXEMPLO  SIMPLES  DE  UM 
MODELO  ESTRUTURAL 

A  transição  de  um  modelo  de  mensuração  para  um  estru¬ 
tural  é  estritamente  a  aplicação  da  teoria  estrutural  em 
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termos  de  relações  entre  construtos.  Como  você  deve  lem¬ 
brar  do  Capítulo  11,  um  modelo  de  mensuração  contém 
tipicamente  todos  os  construtos  com  relações  não-causais 
ou  correlacionais  entre  eles.  O  modelo  estrutural  aplica 
a  teoria  estrutural  pela  especificação  de  quais  construtos 
são  relacionados  entre  si  e  da  natureza  de  cada  relação. 
Revemos  nosso  exemplo  simples  de  modelo  de  mensura¬ 
ção  do  Capítulo  11  para  ilustrarmos  este  ponto. 


A  Figura  12-1  ilustra  um  modelo  estrutural  simples.  Se 
prosseguirmos  a  partir  da  figura  correspondente  do  ca¬ 
pítulo  anterior  (Figura  11-1),  a  suposição  agora  é  que  o 
primeiro  construto.  Gastos  de  Cliente,  está  relacionado 
com  o  Comprometimento  de  Cliente  de  uma  maneira  que 
a  relação  pode  ser  capturada  por  um  coeficiente  de  re¬ 
gressão.  Em  uma  teoria  causal,  o  modelo  implicaria  que 
Gastos  de  cliente  causa,  ou  ajuda  a  produzir.  Comprome¬ 
timento  de  Cliente. 


Quando  passamos  de  modelos  de  mensuração  para  es¬ 
truturais,  algumas  mudanças  ocorrem  também  com  abre¬ 
viações,  terminologias  e  notações.  O  diagrama  visual  na 
Figura  12-1  é  semelhante  ao  modelo  CFA  na  Figura  11-1. 
Não  foram  feitas  modificações  no  lado  esquerdo  do  dia¬ 
grama  que  representa  o  construto  Gastos  de  cliente 
Mudanças  em  outras  áreas  incluem  o  seguinte: 
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FIGURA  12-1  Representação  visual  (diagrama  de  caminhos)  de 
uma  teoria  estrutural  simples. 


•  O  construto  Comprometimento  de  Cliente  é  agora 
representado  pela  notação  -rij.  Esta  notação  é  impor¬ 
tante  porque  agora  devemos  distinguir  entre  construtos 
tanto  quanto  distinguimos  entre  variáveis  em  análise 
de  regressão.  A  teoria  é  testada  pelo  exame  do  efeito 
de  construtos  exógenos  (preditores)  sobre  construtos 
endógenos  (resultados).  Além  disso,  se  existem  dois  ou 
mais  construtos  endógenos,  o  modelo  SEM  pode  exami¬ 
nar  o  efeito  de  um  construto  endógeno  sobre  outro. 

•  As  variáveis  indicadoras  medidas  não  são  mais  todas 
representadas  pela  letra  x.  Ao  invés  disso,  as  variáveis 
indicadoras  para  o  construto  exógeno  são  representa¬ 
das  pela  letra  x.  Em  contrapartida,  as  variáveis  indi¬ 
cadoras  para  o  construto  endógeno  são  representadas 
pela  letra  y.  Esta  abordagem  é  típica  em  SEM  e  é 
consistente  com  a  técnica  usada  em  outros  procedi¬ 
mentos  multivariados  (x  associada  com  preditores  e  y 
correspondente  a  resultados).  O  Apêndice  12A  trata 
de  equações  para  x  ey. 

•  Os  termos  de  variância  de  erro  agora  têm  uma  notação 
que  combina  com  a  distinção  entre  construtos  exógenos 
e  endógenos.  Termos  de  erro  para  as  variáveis  x  não  fo¬ 
ram  alterados  e  têm  um  símbolo  8.  Termos  de  erro  para 
as  variáveis  y  são  representados  por  c. 

•  As  estimativas  de  cargas  também  são  modificadas 
para  indicar  construtos  exógenos  e  endógenos.  Esti¬ 
mativas  de  cargas  das  variáveis  para  construtos  exó¬ 
genos  são  denotadas  por  enquanto  que  estimativas 
de  cargas  das  variáveis  para  construtos  endógenos  são 
denotadas  por  X^,. 


Com  tais  distinções  teóricas  representadas  no  mo¬ 
delo  estrutural  e  no  diagrama  de  caminhos,  agora  pas¬ 
samos  para  a  estimação  do  modelo  estrutural  usando 
procedimentos  SEM. 

Resumo 

Modelos  estruturais  diferem  de  modelos  de  mensuração 
no  sentido  de  que  a  ênfase  passa  da  relação  entre  constru¬ 
tos  latentes  e  variáveis  medidas  para  a  natureza  e  magni¬ 
tude  das  relações  entre  construtos.  Modelos  de  mensura¬ 
ção  são  testados  usando-se  apenas  CFA.  O  modelo  CFA 
é  então  alterado  com  base  na  natureza  de  relações  entre 
construtos.  O  resultado  é  a  especificação  de  um  modelo 
estrutural  que  é  usado  para  testar  o  modelo  teórico  su¬ 
posto.  Sempre  que  um  modelo  é  modificado,  a  matriz  de 
covariância  estimada  muda,  com  base  no  conjunto  de  re¬ 
lações  estimadas  sob  uso  (ver  Apêndice  12 A).  A  matriz 
de  covariância  observada  não  muda.  Na  maioria  dos  ca¬ 
sos,  o  ajuste  do  modelo  estrutural  não  será  o  mesmo  que 
o  ajuste  do  modelo  de  CFA.  O  exemplo  que  acabamos 
de  rever  (Figura  12-1)  é  uma  situação  especial  na  qual  as 
qualidades  de  ajuste  dos  modelos  de  CFA  e  estrutural  são 
idênticas,  pois  o  pesquisador  estima  uma  única  relação  di¬ 
reta  entre  cada  par  de  construtos.  É  incomum  entre  as  si¬ 
tuações  nas  quais  modelos  mais  realistas  e  complexos  são 
representados. 
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UMA  VISÃO  GERAL  DE  TESTE 
DE  TEORIA  COM  SEM 

O  teste  de  modelos  teóricos  usando  SEM  se  concentra  em 
duas  questões: 

•  O  ajuste  geral  e  relativo  do  modelo 

•  O  tamanho,  a  direção  e  a  significância  das  estimativas  para¬ 
métricas  estruturais,  descritas  com  setas  em  um  sentido  em 
um  diagrama  de  caminhos 

O  modelo  teórico  descrito  na  Figura  12-2  é  avaliado 
com  base  na  qualidade  com  que  ele  reproduz  a  matriz  de 
covariância  observada  e  na  significância  e  direção  dos  ca¬ 
minhos  supostos.  Se  o  modelo  mostra  bom  ajuste  e  se  os 
caminhos  supostos  são  significantes  e  na  direção  prevista 
(todos  positivos,  neste  caso),  então  o  modelo  é  sustenta¬ 
do.  No  entanto,  bom  ajuste  não  significa  que  algum  mo¬ 
delo  alternativo  não  possa  se  ajustar  melhor  ou  ser  mais 
preciso.  Assim,  mais  verificações  se  fazem  necessárias, 
incluindo  um  teste  de  plausibilidade  teórica.  Um  teste  de 
plausibilidade  teórica  verifica  se  as  relações  fazem  senti¬ 
do.  Se  não  for  o  caso,  elas  não  são  confiáveis. 

O  Apêndice  12A  descreve  derivação  das  estimativas 
de  caminhos,  bem  como  a  maneira  como  SEM  é  parecida 
com  as  equações  multivariadas  introduzidas  em  capítulos 
anteriores.  Isso  explica  a  relação  entre  variáveis  medidas 
e  os  construtos  latentes,  bem  como  as  relações  entre  cons- 
trutos  latentes.  O  leitor  pode  achar  esta  informação  útil 
para  aprender  como  comunicar  conceitos  de  SEM. 


ESTÁGIOS  NO  TESTE  DE 
TEORIA  ESTRUTURAL 

Teste  de  teoria  com  SEM  segue  de  modo  muito  próximo 
a  maneira  como  teoria  de  mensuração  é  testada  usando 
CEA.  O  processo  é  conceitualmente  parecido,  no  sentido 
de  que  uma  teoria  é  proposta  e  então  testada  com  base  no 


quão  bem  ela  se  ajusta  aos  dados.  Agora,  quando  lidamos 
com  as  relações  teóricas  entre  construtos,  maior  atenção 
é  focada  nos  tipos  diferentes  de  relações  que  podem  exis¬ 
tir. 

Abordagens  de  um  passo  versus  dois  passos 

Ainda  que  SEM  tenha  a  vantagem  de  simultaneamente 
estimar  os  modelos  de  mensuração  e  estrutural,  nosso 
processo  geral  de  seis  estágios  é  consistente  com  um  pro¬ 
cesso  SEM  de  dois  passos  [2].  Por  dois  passos  queremos 
dizer  que  no  primeiro  testamos  o  ajuste  e  a  validade  de 
construto  do  modelo  proposto  de  mensuração.  Uma  vez 
que  um  modelo  satisfatório  de  mensuração  é  obtido,  o 
segundo  passo  é  testar  a  teoria  estrutural.  Assim,  dois 
testes  fundamentais  -  um  de  medição  e  outro  estrutural 
-  avaliam  totalmente  ajuste  e  validade.  No  Capítulo  10, 
nos  referimos  a  isso  como  teste  de  SEM  em  duas  partes.  O 
ajuste  do  modelo  de  mensuração  fornece  então  uma  base 
para  avaliação  da  validade  da  teoria  estrutural  [3]. 

Alguns  argumentam  a  superioridade  de  uma  aborda¬ 
gem  de  um  passo,  na  qual  o  ajuste  geral  de  um  modelo  é 
testado  sem  se  preocupar  com  uma  separação  entre  mo¬ 
delo  de  mensuração  e  estrutural  [9].  Porém,  um  modelo 
de  um  passo  oferece  somente  um  teste -chave  de  ajuste  e 
validade.  Não  diferencia  a  avaliação  do  modelo  de  men¬ 
suração  da  avaliação  do  modelo  estrutural. 

O  teste  em  separado  do  modelo  de  mensuração  por 
meio  de  uma  abordagem  de  dois  passos  é  visto  como  es¬ 
sencial,  uma  vez  que  testes  de  teoria  estrutural  válida  não 
podem  ser  conduzidos  com  medidas  ruins.  Em  outras  pa¬ 
lavras,  com  medidas  ruins  não  saberíamos  o  que  os  cons¬ 
trutos  realmente  significam.  Portanto,  se  um  modelo  de 
mensuração  não  pode  ser  validado,  pesquisadores  devem 
primeiramente  refinar  suas  medidas  e  coletar  novos  dados. 
Se  o  modelo  de  mensuração  revisado  pode  ser  validado, 
então,  e  somente  então,  aconselhamos  prosseguir  com  um 
teste  do  modelo  estrutural  completo.  Uma  discussão  mais 


FIGURA  12-2  Um  modelo  teórico  expandido  de  comprometimento  de  clientes. 

Nota:  Correlações  entre  construtos  exógenos  foram  omitidas  da  figura  para  fins  de  simplificação.  Elas  não  são  de  interesse  teórico  prioritário.  Somente  as 
relações  de  dependência  tratam  de  hipóteses. 
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detalhada  desta  questão  é  apresentada  adiante  neste  capí¬ 
tulo  na  seção  sobre  confusão  de  interpretação.  Referências 
nesta  seção  identificam  fontes  para  uma  discussão  mais 
aprofundada. 

Os  seis  estágios  de  SEM  agora  continuam.  Os  estágios 
1-4  cobriram  o  processo  CFA  desde  a  identificação  de  cons- 
trutos  do  modelo  até  a  avaliação  da  validade  do  modelo  de 
mensuração.  Se  a  medição  é  considerada  suficientemente 
válida,  o  pesquisador  pode  testar  um  modelo  estrutural 
composto  dessas  medições,  conduzindo-nos  aos  estágios  5 
e  6  do  processo  SEM.  O  estágio  5  envolve  a  especificação 
do  modelo  estrutural,  e  no  estágio  6  avalia-se  sua  validade. 

Estágio  5:  Especificação  do  modelo  estrutural 

Agora  nos  voltamos  para  a  tarefa  de  especificar  o  mode¬ 
lo  estrutural.  Este  processo  envolve  a  determinação  da 
unidade  apropriada  de  análise,  a  representação  visual  da 
teoria  usando  um  diagrama  de  caminhos,  esclarecer  quais 
construtos  são  exógenos  e  endógenos,  bem  como  diversas 
questões  relacionadas,  como  tamanho  da  amostra  e  iden¬ 
tificação. 

Unidade  de  análise 

Uma  questão  não  visível  em  um  modelo  é  a  unidade  de 
análise.  O  pesquisador  deve  garantir  que  as  medidas  do 
modelo  capturem  a  unidade  adequada  de  análise.  Por 
exemplo,  pesquisadores  organizacionais  freqüentemente 
se  defrontam  com  a  escolha  de  testes  de  relações  entre 
percepções  individuais  versus  a  organização  como  um 
todo.  Percepções  individuais  representam  a  opinião  ou 
sentimentos  de  uma  pessoa.  Fatores  organizacionais  re¬ 
presentam  características  que  descrevem  uma  organiza¬ 
ção.  Um  construto  como  esprit  de  corps  de  empregados 
pode  bem  existir  tanto  no  nível  individual  quanto  organi¬ 
zacional.  Esprit  de  corps  pode  ser  pensado  como  o  grau  de 
entusiasmo  que  um  empregado  tem  pelo  trabalho  e  pela 
firma.  Desse  modo,  um  empregado  pode  ser  comparado 
com  outro.  Mas  também  pode  ser  imaginado  como  uma 
característica  da  firma  em  geral.  Dessa  maneira,  uma  fir¬ 
ma  pode  ser  comparada  com  outra.  A  escolha  de  unidade 
de  análise  determina  como  uma  escala  é  tratada. 


Uma  escala  de  múltiplos  itens  poderia  ser  usada  para 
avaliar  o  construto  esprit  de  corps.  Se  a  unidade  de  aná¬ 
lise  desejada  está  no  nível  individual  e  se  queremos  en¬ 
tender  relações  que  existem  entre  indivíduos,  a  pesquisa 
pode  prosseguir  com  respostas  individuais.  No  entanto, 
se  a  unidade  de  análise  é  a  organização,  ou  qualquer  ou¬ 
tro  grupo,  respostas  devem  ser  agregadas  para  todos  os 
indivíduos  respondendo  por  aquele  grupo  em  particu¬ 
lar.  Assim,  os  estudos  de  nível  organizacional  requerem 
consideravelmente  mais  dados,  pois  múltiplas  respostas 
devem  ser  agregadas  em  um  grupo. 


Uma  vez  que  a  unidade  de  análise  é  decidida  e  os  da¬ 
dos  são  coletados,  o  pesquisador  deve  agregar  os  dados  se 
respostas  em  nível  de  grupos  são  usadas  para  preparar  a 
SEM  apropriada.  Se  a  unidade  de  análise  for  a  individual, 
o  pesquisador  pode  prosseguir  como  antes. 

Especificação  de  modelo  usando 
um  diagrama  de  caminhos 

Agora  consideramos  como  uma  teoria  é  representada  por 
diagramas  visuais.  Caminhos  indicam  relações.  Parâme¬ 
tros  fixados  correspondem  a  uma  relação  que  não  será  es¬ 
timada  pela  rotina  SEM,  tipicamente  assumidos  como  0  e 
não  exibidos  em  um  diagrama  visual.  Parâmetros  livres  se 
referem  a  uma  relação  que  será  estimada  pelo  programa 
de  SEM.  Geralmente  eles  são  descritos  por  uma  seta  em 
um  diagrama  visual. 


A  Figura  12-2  retrata  parâmetros  livres  e  fixados.  Por 
exemplo,  nenhuma  relação  é  especificada  entre  preço 
e  comprometimento  de  Cliente.  Logo,  nenhuma  seta  é 
mostrada  aqui  e  a  teoria  assume  que  este  caminho  é 
igual  a  zero.  Mas  um  caminho  entre  Gastos  de  Clien¬ 
te  e  Comprometimento  de  Cliente  representa  a  relação 
entre  esses  dois  construtos,  para  a  qual  um  parâmetro 
será  estimado. 


Os  parâmetros  que  representam  relações  estruturais 
entre  construtos  são  agora  nosso  foco.  Eles  são,  em  mui¬ 
tos  sentidos,  o  equivalente  a  coeficientes  de  regressão,  e 
podem  ser  interpretados  de  maneira  parecida.  Com  SEM, 
tais  parâmetros  são  divididos  em  dois  tipos: 

•  De  construtos  exógenos  (^)  para  construtos  endógenos  ('t\). 
Representa-se  pelo  símbolo  7  (gama).  A  matriz  gama  (E) 
contém  todas  as  relações  a  serem  estimadas  entre  cons¬ 
trutos  exógenos  e  endógenos  (ver  Apêndice  lOB  para  de¬ 
finições  de  símbolos  gregos). 

•  De  construto  endógeno  para  construtos  endógenos.  Referi¬ 
do  pelo  símbolo  (3.  O  conjunto  de  coeficientes  p  para  um 
dado  modelo  são  capturados  em  uma  matriz  chamada  de 
beta  (B). 

Essas  duas  matrizes  contêm  as  estimativas  paramétri¬ 
cas  correspondentes  aos  caminhos  básicos  teorizados  para 
um  dado  modelo  estrutural. 

Início  com  um  modelo  de  mensuração.  Uma  vez  que 

uma  teoria  é  proposta,  o  modelo  SEM  é  desenvolvido. 
Primeiro,  a  teoria  de  mensuração  é  especificada  e  vali¬ 
dada  com  CFA.  Em  seguida,  a  teoria  estrutural  é  repre¬ 
sentada  pela  especificação  do  conjunto  de  relações  entre 
construtos.  Algumas  serão  estimadas,  o  que  significa  que 
a  teoria  estabelece  que  dois  construtos  estão  relacionados 
entre  si.  Algumas  serão  fixadas,  o  que  significa  que  a  teo¬ 
ria  estabelece  que  os  dois  construtos  não  estão  relaciona¬ 
dos  entre  si. 


648  Análise  Multivariada  de  Dados 


(b)  Modelo  estrutural 


FIGURA  12-3  Modificação  de  um  modeio  CFA  para  um  modeio  estruturai. 

Nota:  Os  termos  de  variância  de  erro  são  omitidos  do  diagrama  para  fins  de  simplicidade.  No  entanto,  em  diagramas  de  caminhos  SEM  -  particularmente 
aqueles  usados  em  AMOS  -  cada  termo  de  erro  deve  ser  incluído  como  se  mostra  no  capítulo  anterior  (Figura  11-1). 

*  N.  de  R.  T.:  As  notações  corretas  seriam  “X„  Xj„,  Xjj,  Xjj,  Xjj,  Xj4  .Xi^eXj,” 


A  Figura  12-3  mostra  um  modelo  CFA  e  um  subseqüen- 
te  modelo  estrutural.  Os  construtos  são  designados  pe¬ 
las  letras  A,  B,  C  e  D,  no  lugar  de  nomes.  As  notações 
SEM  apropriadas  também  são  incluídas  para  ajudar 
na  discussão  e  diferenciar  entre  os  tipos  de  variáveis  e 
construtos.  A  Figura  12-3a  mostra  uma  CFA  que  testa 
o  modelo  de  mensuração  especificado.  Cada  construto 
é  indicado  por  quatro  itens  indicadores.  Assim,  quatro 
construtos  latentes  são  mensurados  por  16  va¬ 
riáveis  medidas  Os  termos  de  variância  de  erro 

não  são  exibidos  na  figura,  mas  cada  um  dos  16  itens 
indicadores  também  tem  um  termo  correspondente  de 
variância  de  erro  que  é  estimado  no  modelo  CFA.  Re¬ 
lações  entre  construtos  são  estimadas  pelos  coeficientes 
de  correlação/covariância  (<1>).  Neste  caso,  existem  seis 
termos  de  covariância/correlação  entre  construtos. 


A  computação  dos  graus  de  liberdade  será  útil  para 
comparação  com  o  modelo  estrutural.  Uma  matriz  16  x 
16  de  covariância  existe  porque  16  variáveis  medidas  são 
empregadas.  Assim,  o  número  total  disponível  de  graus 
de  liberdade  é  igual  a  136  [(16  x  11)12  =  136].  Um  total  de 
38  parâmetros  será  estimado:* 

16  estimativas  de  carga  (X) 

16  termos  de  variância  de  erro  (6  g) 

-í-  6  termos  de  covariância  de  construto  (cp) 

38  parâmetros 


*  Esta  computação  se  aplica  se  a  escala  de  construto  está  definida 
com  os  termos  de  variância  para  os  construtos.  Se  a  escala  estivesse 
marcada  estabelecendo  uma  estimativa  de  carga  igual  a  1  para  cada 
construto,  então  a  computação  equivalente  envolveria  12  estimati¬ 
vas  de  cargas  (X),  16  termos  de  variância  de  erro  (fig)  e  10  termos  de 
variância-covariância  de  construtos  (cp). 
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Assim,  a  teoria  de  mensuração  é  testada  por  uma  CFA 
com  136  -  38  =  98  graus  de  liberdade  (df).  O  valor  (x^) 
resultante  terá,  portanto,  98  df. 

Finalização  do  modelo  estrutural.  No  modelo  estrutu¬ 
ral,  setas  de  dois  sentidos  são  substituídas  por  um  número 
menor  de  setas  em  um  só  sentido.  A  teoria  estrutural  é 
criada  pela  restrição  da  matriz  de  covariância  usando  o 
conjunto  de  parâmetros  livres  e  fixados  que  representam 
relações  teorizadas. 


Suponha  que  a  teoria  estabeleça  que  os  construtos  A  e  B 
são  relacionados  com  o  construto  C.  Esta  teoria  implica 
uma  única  relação  estrutural  com  C  como  uma  função 
de  A  e  B.  Quando  o  construto  D  é  incluído,  ele  é  visto 
como  um  resultado  de  C.  Os  construtos  A  e  B  não  são 
tidos  como  diretamente  relacionados  com  D. 


A  Figura  12-3b  corresponde  à  teoria  estrutural.  Diver¬ 
sas  mudanças  podem  ser  percebidas  na  transformação  do 
modelo  de  mensuração  no  modelo  estrutural: 


1.  A  teoria  proposta  envolve  dois  construtos  exógenos 
e  dois  endógenos.  Os  construtos  A  e  B  são  exógenos 
porque  nenhuma  outra  seta  aponta  para  eles  a  não 
ser  a  seta  de  correlação  de  dois  sentidos.  O  constru¬ 
to  C  é  uma  função  de  A  e  B  e  é,  portanto,  endóge¬ 
no  (com  setas  apontando  para  ele).  O  construto  D 
é  uma  função  de  C  e,  pelo  mesmo  motivo,  também 
é  endógeno.  Logo,  a  representação  de  construtos  A 
e  B  não  é  mudada.  A  é  representado  por  B  é  re¬ 
presentado  por  Ij.  Contudo,  C  e  D  são  endógenos  e 
agora  são  representados  por  e  qj,  respectivamen¬ 
te. 

2.  Outra  modificação  segue  da  nova  representação  de 
construtos  como  exógenos  ou  endógenos.  Observe 
que  itens  medidos  para  construtos  endógenos  são 
agora  representados  por  -  ^4  e  Xj  -  Xg  para  os  cons¬ 
trutos  C  e  D,  respectivamente. 

3.  Os  coeficientes  paramétricos  que  representam  os 
caminhos  com  cargas  para  construtos  endógenos  as¬ 
sumem  as  novas  abreviações  como  j  a  ^  e  2  a 

refletindo  a  mudança,  conforme  observado. 

4.  O  único  coeficiente  de  covariância  (tpj  j)  é  represen¬ 
tado  pela  seta  de  dois  sentidos  entre  os  construtos 
exógenos  A  e  B.  Ele  representa  a  covariância  entre 
A  e  B.  Os  coeficientes  cp  que  representavam  cova¬ 
riância  entre  outros  construtos  não  existem  mais, 
pois  a  matriz  de  covariância  inclui  somente  relações 
entre  construtos  exógenos. 

5.  As  relações  teorizadas  entre  A  e  C  e  B  e  C  são  re¬ 
presentadas  por  Xj  1  e  7j2>  respectivamente. 

6.  A  relação  teorizada  entre  C  e  D  é  agora  representa¬ 
da  por  Pj.i- 


7.  Não  são  mostradas  relações  entre  A  e  D  ou  B  e  D, 
pois  elas  são  fixadas  em  0,  com  base  em  nossa  teoria. 
Ou  seja,  a  teoria  não  supõe  uma  relação  direta  entre 
A  e  D  ou  B  e  D. 

8.  Dois  novos  termos  surgem:  Çj  e  Çj-  Eles  representam 
a  variância  de  erro  de  previsão  para  os  dois  constru¬ 
tos  endógenos.  Eles  podem  ser  considerados  como 
o  oposto  de  um  R^,  uma  vez  que  são  completamente 
padronizados.  Ou  seja,  são  semelhantes  ao  resíduo 
em  análise  de  regressão. 


Uma  vez  que  essas  mudanças  sejam  implementadas,  o 
modelo  estrutural  pode  ser  estimado.  Como  ocorre  com  o 
modelo  CFA,  há  136  graus  de  liberdade  disponíveis  a  pa¬ 
rir  dos  16  indicadores.  Como  mostrado  abaixo,  o  modelo 
SEM  agora  estima  36  coeficientes  paramétricos  (usando 
36  graus  de  liberdade): 

16  estimativas  de  cargas  (8  X;,-  e  8  Xy) 

16  termos  de  variância  de  erro  (8  65  e  8  6^) 

2  termos  estruturais  exógeno-endógeno  (7) 

1  termo  estrutural  endógeno-endógeno  (p) 

+  1  termo  de  covariância  de  construto  (cp) 

36  parâmetros  livres 

O  modelo  estrutural  será  testado  por  um  valor  com 
100  (136  -  36)  graus  de  liberdade,  dois  a  mais  do  que  no 
modelo  CFA.  Os  dois  graus  de  liberdade  surgem  da  restri¬ 
ção  dos  construtos  A  e  B  de  serem  diretamente  relaciona¬ 
dos  com  D.  Ao  invés  disso,  ambos  são  relacionados  com 
C,  que,  por  sua  vez,  prevê  D. 

O  Apêndice  12C  descreve  mudanças  necessárias  na 
sintaxe  de  LISREL  para  converter  declarações  CFA  no 
modelo  de  mensuração  no  topo  da  Figura  12-3  para  o 
modelo  SEM  exibido  na  parte  de  baixo  da  mesma  figu¬ 
ra.  Usando  essas  modificações,  um  modelo  SEM  pode  ser 
executado.  Com  AMOS,  o  usuário  precisaria  mudar  as  se¬ 
tas,  usando  a  interface  gráfica,  para  mostrar  como  as  rela¬ 
ções  correlacionadas  de  CFA  se  transformam  em  relações 
de  dependência  de  SEM  e  acrescentam  termos  de  erro  às 
variáveis  endógenas. 

Modelos  recursivos  e  não-recursivos.  Uma  distinção  fi¬ 
nal  pode  ser  feita  para  determinar  se  o  modelo  estrutural 
é  recursivo  ou  não-recursivo.  Um  modelo  é  considerado 
recursivo  se  todos  os  caminhos  entre  construtos  procedem 
apenas  do  construto  preditor  (antecedente)  para  o  cons¬ 
truto  dependente  ou  de  saída  (conseqüências).  Em  outras 
palavras,  um  modelo  recursivo  não  contém  construtos 
que  sejam  determinados  por  algum  antecedente  e  ajudem 
a  determinar  aquele  antecedente  (isto  é,  nenhum  par  de 
construtos  tem  setas  seguindo  em  ambos  os  caminhos 
entre  eles).  Modelos  recursivos  SEM  jamais  têm  menos 
graus  de  liberdade  do  que  um  modelo  CFA  que  envolve 
os  mesmos  construtos  e  variáveis. 
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Em  contrapartida,  um  modelo  não-recursivo  contém 
retornos  de  resposta.  Um  retorno  de  resposta  existe  quan¬ 
do  um  construto  é  visto  como  preditor  e  resposta  de  outro 
construto.  O  retorno  de  resposta  pode  envolver  relações 
diretas  ou  até  mesmo  indiretas.  Na  relação  indireta,  a  res¬ 
posta  ocorre  por  meio  de  uma  série  de  caminhos  ou  mes¬ 
mo  mediante  termos  de  erro  correlacionados. 


A  Figura  12-4  ilustra  um  modelo  estrutural  que  é  não- 
recursivo.  Note  que  o  construto  D  (qj)  é  determinado 
por  C  (tii)  e  também  o  determina.  Os  parâmetros  para  o 
modelo  incluem  os  coeficientes  de  caminhos  correspon¬ 
dentes  a  ambos  os  caminhos  (pjj  e 

Se  o  modelo  incluísse  um  caminho  do  construto  D  de 
volta  ao  B,  o  modelo  também  seria  não-recursivo,  pois 
o  construto  D  seria  indiretamente  determinado  por  B,  o 
qual  também  seria  diretamente  determinado  por  D  com 
este  novo  caminho. 


Uma  interpretação  teórica  de  uma  relação  não-recur- 
siva  entre  dois  construtos  é  que  um  é  tanto  causa  como 
efeito  do  outro.  Apesar  de  essa  situação  ser  improvável 
com  dados  cross-section,  torna-se  mais  plausível  com  da¬ 
dos  longitudinais.  É  difícil  produzir  um  conjunto  de  con¬ 
dições  que  sustentem  uma  relação  recíproca  com  dados 
cross-section.  Retornaremos  brevemente  para  modelos 
SEM  com  dados  longitudinais  quando  cobrirmos  tópicos 
avançados  neste  capítulo. 


Por  exemplo,  tanto  inteligência  quanto  sucesso  na  escola 
podem  ser  pensados  como  construtos  latentes  medidos 
por  múltiplos  itens.  Inteligência  é  causa  de  sucesso  na  es¬ 
cola  ou  o  sucesso  provoca  inteligência?  Será  que  ambas 
são  causas  uma  da  outra?  Dados  longitudinais  podem 
ajudar  a  lidar  com  tal  questão,  pois  a  seqüência  temporal 
de  eventos  pode  ser  levada  em  conta. 


Modelos  não-recursivos  também  apresentam  proble¬ 
mas  com  identificação  estatística.  Incluindo  construtos 


adicionais  e/ou  variáveis  medidas,  podemos  ajudar  a  ga¬ 
rantir  que  a  condição  de  ordem  seja  atendida.  A  condição 
de  classificação  para  identificação  poderia  permanecer 
problemática,  porém,  porque  uma  única  estimativa  para 
um  só  parâmetro  pode  não  mais  existir  (ver  Capítulo  11). 
Logo,  recomendamos  que  se  evitem  modelos  não-recursi- 
vos,  particularmente  com  dados  cross-section. 

Resumo.  Depois  de  seguir  os  procedimentos  nesta  se¬ 
ção,  a  teoria  do  pesquisador  deveria  ser  representada  de 
uma  maneira  que  possa  ser  testada.  Se  o  pesquisador  co¬ 
meça  com  um  modelo  de  mensuração,  é  relativamente 
fácil  fazer  os  ajustes  necessários  para  transformar  a  repre¬ 
sentação  da  teoria  de  mensuração  em  uma  representação 
da  teoria  estrutural.  Agora  estamos  prontos  para  aplicar 
este  teste  usando  dados  de  um  estudo  planejado  para  tes¬ 
tar  a  SEM. 

Delineamento  do  estudo 

Sempre  que  SEM  é  usada,  tamanho  da  amostra  e  iden¬ 
tificação  são  pontos  importantes.  O  Capítulo  11  cobriu 
condições  para  identificação  com  um  tamanho  amostrai 
adequado  ao  longo  de  várias  situações.  Se  essas  condições 
são  atendidas  para  o  modelo  CEA,  elas  são  provavelmen¬ 
te  satisfeitas  para  o  modelo  estrutural  também,  especial¬ 
mente  para  modelos  estruturais  recursivos.  Um  modelo 
estrutural  é  aninhado  dentro  de  um  modelo  CEA  e  é  mais 
parcimonioso  porque  contém  menos  caminhos  estimados. 
Portanto,  se  o  modelo  CEA  é  identificado,  o  estrutural 
também  deve  ser  identificado  -  desde  que  o  modelo  seja 
recursivo,  nenhum  termo  de  interação  seja  incluído,  o  ta¬ 
manho  da  amostra  seja  apropriado,  e  um  mínimo  de  três 
itens  medidos  por  construto  seja  usado.  Agora  nos  volta¬ 
mos  a  mudanças  de  especificação  necessárias  para  a  tran¬ 
sição  de  um  modelo  de  mensuração  para  um  estrutural. 

Modelagem  das  cargas  de  construto  quando  se  testa  a  teo¬ 
ria  estrutural.  O  modelo  CEA  na  Figura  12-3a  é  modifi¬ 
cado  para  testar  o  modelo  estrutural  mostrado  na  parte  de 
baixo.  A  parte  de  medida  do  modelo  estrutural  consiste 
das  estimativas  de  cargas  para  os  itens  medidos  e  das  esti- 


FIGURA  12-4  Modelo  SEM  não-recursivo. 


CAPITULO  12  SEM:  Teste  de  um  Modelo  Estrutural  651 


mativas  de  correlação  entre  construtos  exógenos.  As  esti¬ 
mativas  de  carga  fatorial  podem  ser  tratadas  de  diferentes 
maneiras  no  modelo  estrutural. 

Um  argumento  sugere  que,  com  o  modelo  CFA  já  es¬ 
timado  neste  ponto,  as  estimativas  de  carga  fatorial  são 
conhecidas.  Portanto,  seus  valores  devem  ser  fixados  e 
especificados  para  as  estimativas  de  cargas  obtidas  a  par¬ 
tir  do  modelo  CFA.  Em  outras  palavras,  eles  não  devem 
mais  ser  estimativas  de  parâmetros  livres.  Analogamente, 
como  os  termos  de  variância  de  erro  são  fornecidos  a  par¬ 
tir  da  CFA,  seus  valores  também  podem  ser  fixados,  ao 
invés  de  estimados. 


A  Figura  12-5  reproduz  a  CFA  anterior  e  a  correspon¬ 
dência  com  o  modelo  estrutural.  Ela  agora  retrata  as  es¬ 
timativas  de  carga  fatorial  completamente  padronizadas. 
Usando  esta  abordagem,  as  cargas  seriam  fixadas  para 
os  valores  de  CFA.  Assim,  as  estimativas  seriam  trans¬ 
portadas  para  o  modelo  estrutural  e  os  valores  fixados 
(não  estimados)  quando  o  modelo  estrutural  é  testado. 


O  Apêndice  12B  mostra  um  procedimento  para  fixação 
de  cargas  fatoriais  para  algum  valor  usando  um  progra¬ 
ma  SEM.  Este  método  é  útil  também  se  uma  variável  de 
um  só  item  é  incluída  em  um  modelo  SEM. 


É  lógico  fixar  esses  valores,  uma  vez  que  eles  são  co¬ 
nhecidos.  No  entanto,  na  medida  em  que  qualquer  um  des¬ 
ses  parâmetros  são  afetados  pelas  mudanças  impostas  ao 
se  transformar  o  modelo  CFA  em  um  modelo  estrutural,  o 
ajuste  é  diminuído.  Esta  situação  seria  um  exemplo  de  con¬ 
fusão  de  interpretação,  que  significa  que  as  estimativas  de 
medição  para  um  construto  estão  sendo  significativamen¬ 
te  afetadas  por  relações  diferentes  daquelas  entre  essas 
medidas  específicas.  Colocando  de  outra  forma,  as  cargas 
para  qualquer  construto  dado  não  deveriam  mudar  apenas 
porque  uma  é  feita  mudança  no  modelo  estrutural.  Os  pa¬ 
râmetros  de  medição  deveriam  ser  estáveis.  Uma  vantagem 
deste  método  é  que  o  modelo  estrutural  é  mais  fácil  de  se 
estimar  porque  muito  mais  parâmetros  têm  valores  que  são 
fixados.  Uma  desvantagem  é  que  a  mudança  no  ajuste  entre 


FIGURA  12-5  Estimativas  de  cargas  de  CFA  em  um  modelo  estrutural. 


*  N.  de  R.  T.:  As  notações  corretas  seriam  “X,,  Xj„,  Xj^,  Xjj,  Xjj,  X^,  Xj,  e  Xj^”. 
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a  CFA  e  o  modelo  estrutural  pode  ser  decorrente  de  pro¬ 
blemas  com  as  medidas,  e  não  da  teoria  estrutural. 

Outra  abordagem  é  usar  o  padrão  fatorial  de  CFA  e  per¬ 
mitir  que  os  coeficientes  para  as  cargas  e  os  termos  de  variân¬ 
cia  de  erro  sejam  estimados  juntamente  com  os  coeficientes 
do  modelo  estrutural.  Isso  simplifica  a  transição  de  CFA  para 
o  estágio  de  teste  estrutural  pela  eliminação  da  necessidade 
de  experimentar  o  difícil  processo  de  fixar  todas  as  estimati¬ 
vas  de  cargas  de  construtos  e  de  termos  de  variância  de  erro 
com  os  valores  de  CFA.  O  processo  pode  também  revelar 
qualquer  confusão  de  interpretação  pela  comparação  das  es¬ 
timativas  de  cargas  de  CFA  com  aquelas  obtidas  do  modelo 
estrutural.  Se  as  estimativas  de  cargas  completamente  padro¬ 
nizadas  variam  substancialmente,  então  existe  evidência  de 
confusão  de  interpretação.  Pequenas  flutuações  são  espe¬ 
radas  (0,05  ou  menos).  Contudo,  quando  as  inconsistências 
aumentam  em  tamanho  e  número,  o  pesquisador  deve  exa¬ 
minar  as  medidas  mais  atentamente.  Outra  vantagem  desta 
abordagem  é  que  o  ajuste  do  modelo  CFA  original  se  torna 
uma  base  conveniente  de  comparação  na  avaliação  do  ajuste 
do  modelo  estrutural.  Esta  técnica  é  usada  mais  freqüente- 
mente  na  prática  e  é  a  recomendada  aqui. 

Medidas  de  um  só  item.  Ocasionalmente  um  modelo  es¬ 
trutural  envolve  uma  medida  de  um  único  item.  Ou  seja, 
relações  estruturais  são  teorizadas  entre  uma  só  variável 
e  construtos  latentes.  A  confiabilidade  e  a  validade  da 
medida  de  um  só  item  não  podem  ser  testadas  usando-se 
CFA  como  medidas  de  múltiplos  itens.  Além  disso,  o  coe¬ 
ficiente  alfa  (estimativa  de  confiabilidade)  de  uma  medida 
de  um  só  item  não  pode  ser  computado.  A  questão  então 
passa  a  ser:  “Como  pode  uma  medida  de  um  só  item  ser 
representada  dentro  de  uma  estrutura  CF  A/SEM?  Como 
isso  é  especificado?”.  Como  suas  características  de  men- 
suração  são  desconhecidas,  passa  a  ser  exigido  o  melhor 
julgamento  do  pesquisador  para  fixar  o  parâmetro  de 
mensuração  associado  com  o  dado  item. 


Um  exemplo  pode  ajudar  a  esclarecer  este  processo. 
Frequentemente,  pesquisadores  de  negócios  estão  in¬ 
teressados  em  estudar  um  resultado  não-latente,  como 
vendas.  Por  exemplo,  uma  companhia  pode  estar  inte¬ 
ressada  na  investigação  de  numerosos  fatores  relativos 
à  promoção  e  como  eles  estão  induzindo  vendas  entre 
suas  unidades  comerciais.  Assim,  um  modelo  estrutural 
pode  incluir  construtos  latentes  como  atitudes  de  clien¬ 
tes  em  relação  à  marca,  percepções  da  clientela  sobre 
preço  e  envolvimento  de  clientes.  Esses  construtos  são 
usados  para  tentar  modelar  vendas  com  base  em  infor¬ 
mação  de  cada  uma  das  unidades  da  empresa.  Como  re¬ 
gistros  de  vendas  são  mantidos  eletronicamente,  eles  são 
relativamente  livres  de  erros,  mas  não  completamente. 
Formar  um  construto  de  item  latente  para  vendas  não  é 
necessário,  pois  podemos  medir  esta  variável  diretamen¬ 
te  com  este  único  item. 


A  variável  de  vendas  seria  então  especificada  como  se 
fosse  um  construto  endógeno  com  um  único  indicador. 
Assim,  um  caminho  de  mensuração  os  conecta.  Este  ca¬ 
minho  de  mensuração  também  inclui  um  termo  de  erro. 
O  construto  pode  ser  pensado  como  o  verdadeiro  escore 
de  vendas,  e  a  variável,  como  o  escore  de  vendas  obser¬ 
vado.  Usando-se  SEM,  o  verdadeiro  escore  resultará  da 
correção  da  variável  para  qualquer  erro  de  medição.  Ca¬ 
minhos  de  mensuração  e  termos  de  variância  de  erro  para 
construtos  de  um  só  item  devem  ser  fixados  com  base  no 
melhor  conhecimento  disponível.  O  pesquisador  acredita 
que  os  registros  de  vendas  são,  em  sua  maioria,  livres  de 
erro.  Assim,  o  pesquisador  escolhe  algum  melhor  valor 
estimado  para  confiabilidade.  A  relação  entre  a  variável 
de  vendas  reais  e  o  construto  latente  é  então  fixada  na  raiz 


-  REGRAS  PRÁTICAS  12-1  - 

Especificação  do  modelo  estrutural 

•  CFA  é  limitada  em  sua  habilidade  de  examinar 
a  natureza  de  relações  entre  construtos  além  de 
correlações  simples 

•  Um  modelo  estrutural  deve  ser  testado  depois  que  a 
CFA  validou  o  modelo  de  mensuração 

•  As  relações  estruturais  entre  construtos  podem  ser 
criadas  por: 

•  Substituição  de  setas  de  dois  sentidos  de  CFA  por 
setas  em  um  só  sentido  representando  uma  relação 
do  tipo  causa-e-efeito 

•  Remoção  das  setas  curvadas  de  dois  sentidos  que 
conectam  construtos  que  não  são  teorizados  como 
diretamente  relacionados 

•  Modelos  recursivos  SEM  não  podem  ser  associados 
com  menos  graus  de  liberdade  do  que  um  modelo  CFA 
que  envolve  os  mesmos  construtos  e  variáveis 

•  Modelos  não-recursivos  que  envolvem  dados  cross- 
section  devem  ser  evitados  na  maioria  dos  casos: 

•  É  difícil  produzir  um  conjunto  de  condições  que 
possa  sustentar  um  teste  de  uma  relação  recíproca 
com  dados  cross-section 

•  Modelos  não-recursivos  têm  mais  problemas  com 
identificação  estatística 

•  Quando  um  modelo  estrutural  está  sendo  especificado, 
ele  deve  usar  o  padrão  de  fator  de  CFA  correspondente 
à  teoria  de  mensuração  e  permitir  que  os  coeficientes 
para  as  cargas  e  os  termos  de  variância  de  erro  sejam 
estimados  juntamente  com  os  coeficientes  do  modelo 
estrutural 

•  Caminhos  de  medição  e  termos  de  variância  de  erro 
para  construtos  de  um  só  item  devem  ser  fixados 
baseados  no  melhor  conhecimento  disponível 

•  A  estimativa  de  carga  (relação  X)  entre  a  variável  (y) 
e  o  construto  latente  (ti)  é  fixada  como  sendo  a  raiz 
quadrada  da  melhor  estimativa  de  sua  confiabilidade 

•  O  correspondente  termo  de  erro  é  fixado  em  1 
menos  a  estimativa  de  confiabilidade 
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quadrada  da  confiabilidade  estimada.  O  correspondente 
termo  de  erro  é  fixado  em  1  menos  a  estimativa  de  confia¬ 
bilidade.  Esta  é  uma  técnica  usada  para  lidar  com  medidas 
de  um  só  item  em  SEM. 

Resumo 

Esta  seção  descreveu  como  mudar  relações  correlacio¬ 
nais  entre  construtos  de  CEA  em  relações  de  dependên¬ 
cia  que  correspondem  a  hipóteses  de  pesquisa  em  SEM. 
E  como  a  teoria  do  pesquisador  é  representada.  Tendo 
completado  o  estágio  5,  agora  avaliamos  a  validade  desta 
teoria. 

Estágio  6:  Avaliação  da  validade 
do  modelo  estrutural 

Compreensão  do  ajuste  do  modelo 
estrutural  a  partir  de  ajuste  de  CF  A 

Este  estágio  avalia  a  validade  do  modelo  estrutural.  Os 
dados  observados  ainda  são  representados  pela  matriz  de 
covariância  da  amostra  observada.  Uma  matriz  de  cova- 
riância  estimada  também  é  computada.  Em  CEA,  a  matriz 
de  covariância  estimada  é  computada  com  base  nas  res¬ 
trições  (padrão  de  estimativas  paramétricas  livres  e  fixa¬ 
das)  correspondendo  à  teoria  de  mensuração.  Enquanto  a 
teoria  estrutural  for  recursiva,  ela  não  poderá  incluir  mais 
relações  entre  construtos  do  que  o  modelo  CEA  a  partir 
do  qual  ela  é  desenvolvida.  Portanto,  a  matriz  de  cova¬ 
riância  estimada  incluirá  mais  restrições,  pois  caminhos 
são  fixados  em  0  para  todos  aqueles  entre  construtos  para 
os  quais  não  existe  qualquer  motivo  teórico  para  se  espe¬ 
rar  uma  relação.  Assim,  um  modelo  estrutural  recursivo 
não  pode  ter  um  valor  x  menor  do  que  aquele  obtido  em 
CEA. 

Modelos  teóricos  saturados.  Se  o  modelo  SEM  especi¬ 
fica  um  número  de  relações  estruturais  igual  ao  número 
de  possíveis  correlações  de  construtos  em  CEA,  então 
ele  é  considerado  um  modelo  estrutural  saturado.  Mode¬ 
los  teóricos  saturados  não  são  geralmente  interessantes, 
pois  eles  usualmente  não  podem  revelar  mais  do  que  o 
modelo  CEA.  As  estatísticas  de  ajuste  para  um  modelo 
teórico  saturado  devem  ser  as  mesmas  obtidas  para  o  mo¬ 
delo  CEA,  o  que  é  algo  útil  de  se  saber.  Uma  maneira 
para  pesquisadores  poderem  verificar  se  a  transição  de 
um  modelo  CEA  para  um  modelo  estrutural  está  correta 
é  por  meio  do  teste  de  um  modelo  estrutural  saturado.  Se 
seu  ajuste  não  for  igual  ao  do  modelo  CEA,  algum  erro 
foi  cometido. 

Avaliação  do  ajuste  geral  do  modelo  estrutural.  O 

ajuste  do  modelo  estrutural  é  avaliado  como  foi  com  o 
modelo  CEA.  Logo,  a  boa  prática  dita  que  mais  de  uma 
estatística  de  ajuste  seja  empregada.  Relembrando  do 
Capítulo  10,  recomendamos  que  sejam  usados,  no  míni¬ 
mo,  um  índice  de  ajuste  absoluto,  um  índice  incremental 


e  o  do  modelo.  Além  disso,  um  dos  índices  deve  ser  de 
má  qualidade  de  ajuste.  Como  antes,  nenhum  conjunto 
mágico  de  números  sugere  bom  ajuste  em  todas  as  situa¬ 
ções.  Mesmo  um  CFI  igual  a  1,0  e  um  x^  insignificante 
podem  não  ter  grande  significado  prático  em  um  modelo 
simples.  Portanto,  são  dadas  apenas  orientações  gerais 
para  diferentes  situações.  Aquelas  orientações  permane¬ 
cem  as  mesmas  para  a  avaliação  de  ajuste  de  um  modelo 
estrutural. 

Comparação  do  ajuste  de  CFA  com  o  ajuste  do  modelo 
estrutural.  O  ajuste  de  CFA  fornece  uma  base  útil  para 
avaliar  o  ajuste  estrutural  ou  teórico.  Um  modelo  estrutu¬ 
ral  recursivo  não  pode  se  ajustar  melhor  (ter  um  x  menor) 
do  que  a  CFA  geral;  assim,  pode-se  concluir  que  a  teoria 
estrutural  carece  de  validade  se  o  ajuste  do  modelo  estru¬ 
tural  for  substancialmente  pior  do  que  o  ajuste  do  modelo 
CFA  [3].  Uma  teoria  estrutural  procura  explicar  todas  as 
relações  entre  construtos  de  maneira  tão  simples  quanto 
possível.  O  modelo  CFA  padrão  assume  que  existe  uma 
relação  em  cada  par  de  construtos.  Apenas  um  modelo 
estrutural  saturado  faria  esta  suposição.  Assim,  modelos 
SEM  tentam  explicar  relações  entre  construtos  de  modo 
mais  simples  e  preciso  do  que  CFA.  Quando  eles  não  con¬ 
seguem  fazer  isso,  esta  falha  é  refletida  em  estatísticas  de 
ajuste  relativamente  ruins.  Reciprocamente,  um  modelo 
estrutural  que  demonstra  um  valor  Ax^  insignificante  com 
seu  modelo  CFA  é  fortemente  sugestivo  de  ajuste  estru¬ 
tural  adequado. 

Exame  das  relações  de  dependência  teorizadas.  Lembre 
que  a  avaliação  de  validade  de  modelo  CFA  não  estava 
completa  com  base  apenas  em  ajuste.  Validade  de  cons- 
truto  exige  evidência  adicional.  Analogamente,  bom  ajus¬ 
te,  por  si  só,  é  insuficiente  para  sustentar  uma  teoria  estru¬ 
tural  proposta.  O  pesquisador  deve  também  examinar  as 
estimativas  individuais  de  parâmetros  versus  as  previsões 
ou  caminhos  correspondentes,  sendo  que  cada  uma  repre¬ 
senta  uma  hipótese  específica.  Assim,  as  estimativas  de 
relações  de  dependência  devem  ser  avaliadas.  Validade 
de  teoria  aumenta  na  medida  em  que  as  estimativas  de 
parâmetros  são: 

•  Estatisticamente  significantes  e  no  sentido  previsto.  Ou  seja, 
elas  são  maiores  do  que  zero  para  uma  relação  positiva  e 
menores  do  que  zero  para  uma  relação  negativa. 

•  Não-triviais.  Este  aspecto  pode  ser  verificado  usando-se 
as  estimativas  de  cargas  completamente  padronizadas.  A 
orientação  aqui  é  a  mesma  usada  em  outras  técnicas  mul- 
tivariadas. 

O  pesquisador  pode  também  examinar  as  estimativas 
de  variância  explicada  para  os  construtos  endógenos,  as 
quais  são  essencialmente  uma  análise  do  R^.  As  mesmas 
diretrizes  gerais  se  aplicam  para  tais  valores,  como  se  apli¬ 
caram  com  regressão  múltipla. 

Bom  ajuste  não  garante  que  o  modelo  SEM  é  a  melhor 
representação  dos  dados.  Como  acontece  com  modelos 
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CFA,  opções  alternativas  podem  freqüentemente  produ¬ 
zir  os  mesmos  resultados  empíricos.  Novamente,  a  teoria 
se  torna  essencial  na  avaliação  da  validade  de  um  modelo 
estrutural. 

Exame  do  diagnóstico  do  modelo 

Os  mesmos  diagnósticos  para  modelos  CFA  são  forneci¬ 
dos  para  SEM.  Por  exemplo,  o  padrão  e  o  tamanho  de 
resíduos  padronizados  podem  ser  usados  para  identificar 
problemas  de  ajuste.  Podemos  assumir  que  o  modelo  CFA 
tem  validade  suficiente  se  atingimos  este  estágio,  e,  assim, 
o  foco  é  sobre  a  informação  diagnóstica  a  respeito  de  re¬ 
lações  entre  construtos.  Logo,  o  pesquisador  prossegue 
como  em  modelos  CFA.  Mas  atenção  especial  é  dada  para 
estimativas  de  caminhos,  resíduos  padronizados  e  índices 
de  modificação  associados  com  as  possíveis  relações  entre 
construtos  em  qualquer  uma  das  três  formas  (exógenos 
— >  endógenos,  endógenos  — >  endógenos,  e  covariância  de 
erro  entre  construtos  endógenos  encontrados).  Por  exem¬ 
plo,  se  um  problema  com  ajuste  de  modelo  é  devido  a  uma 
relação  atualmente  fixada  entre  um  construto  exógeno  e 
um  endógeno,  ele  provavelmente  será  revelado  através 
de  um  resíduo  padronizado  ou  de  um  elevado  índice  de 
modificação. 


Considere  o  modelo  estrutural  na  Figura  12-5.  O  mo¬ 
delo  não  inclui  um  caminho  conectando  os  constru¬ 
tos  A  e  D.  Se  o  modelo  fosse  testado  e  se  realmente 
existisse  uma  relação  entre  esses  dois  construtos,  um 
elevado  resíduo  padronizado  ou  um  padrão  de  resí¬ 
duos  provavelmente  seriam  encontrados  entre  itens 
que  compõem  esses  dois  construtos  e  neste 
caso).  Isto  estaria  nos  dizendo  que  a  covariância  entre 
esses  conjuntos  de  itens  não  foi  reproduzida  com  pre¬ 
cisão  por  nossa  teoria.  Além  disso,  um  elevado  índice 
de  modificação  poderia  existir  para  o  caminho  que  se¬ 
ria  rotulado  como  72  j  (a  relação  de  dependência  de 
A  para  com  D).  Os  índices  de  modificação  para  cami¬ 
nhos  que  não  são  estimados  são  mostrados  na  saída 
padrão  de  SEM.  Pode-se  pedir  também  que  eles  sejam 
exibidos  em  um  diagrama  de  caminhos,  usando-se  os 
menus  drop-down  apropriados.  Falando  em  termos 
gerais,  diagnósticos  de  modelos  são  examinados  da 
mesma  maneira  que  se  faz  com  modelos  CFA. 


Um  modelo  deveria  ser  modificado  com  base  nesta 
informação  diagnóstica?  E  uma  prática  bastante  comum 
conduzir  análises  post  hoc  que  são  posteriores  ao  teste  da 
teoria.  Análises  post  hoc  são  testes  após-o-fato  de  rela¬ 
ções  para  as  quais  nenhuma  hipótese  foi  feita.  Em  outros 
termos,  um  caminho  é  testado  onde  a  teoria  original  não 
continha  um  caminho.  Lembre  que  SEM  fornece  uma 
ferramenta  excelente  para  teste  de  teoria.  Portanto,  qual¬ 
quer  relação  revelada  em  uma  análise  post  hoc  fornece 
somente  evidência  empírica,  e  não  suporte  teórico.  Por 


esta  razão,  não  se  deve  confiar  em  relações  identificadas 
post  hoc  da  mesma  maneira  que  em  relações  teóricas  ori¬ 
ginais.  Análises  estruturais  post  hoc  são  úteis  apenas  na 
especificação  de  potenciais  melhoras  no  modelo  que  de¬ 
vem  fazer  sentido  teórico  e  em  termos  de  validação  cru¬ 
zada,  testando-se  o  modelo  com  novos  dados  obtidos  da 
mesma  população.  Assim,  análises  post  hoc  não  são  úteis 
para  teste  de  teoria,  e  qualquer  tentativa  neste  sentido 
deve  ser  desencorajada. 


ILUSTRAÇÃO  DE  SEM 

As  ilustrações  de  CFA  no  capítulo  anterior  começaram 
pelo  teste  de  uma  teoria  de  mensuração.  O  resultado 
final  foi  a  validação  de  um  conjunto  de  indicadores  de 
construtos  que  permitem  que  a  HBAT  estude  relações 
entre  cinco  importantes  construtos.  A  HBAT  gostaria 
de  entender  por  que  alguns  empregados  permanecem 
no  emprego  por  mais  tempo  do  que  outros.  Eles  sabem 
que  podem  melhorar  a  qualidade  dos  serviços  e  a  lucra¬ 
tividade  quando  empregados  permanecem  na  empresa 
por  mais  tempo.  O  processo  SEM  de  seis  estágios  co¬ 
meça  com  este  objetivo  em  mente.  Para  esta  ilustração, 
usamos  o  banco  de  dados  HBAT_SEM,  disponível  na 
Web  em  www.bookman.com.br. 


O  modelo  de  mensuração  completo  foi  testado  no  capí¬ 
tulo  sobre  CFA,  mostrou-se  que  ele  tem  ajuste  adequa¬ 
do  e  validade  de  construto.  Lembre-se  que  as  estatísticas 
de  ajuste  de  CFA  para  este  modelo  foram: 

•  é  229,95  com  179  graus  de  liberdade  (0,05) 

•  CFI  =  0,99 

•  RMSEA  =  0,027 

Para  refrescar  sua  memória,  os  cinco  construtos  são 
definidos  aqui: 

•  Satisfação  com  o  trabalho  (JS).  Reações  resultantes  da 
apreciação  da  situação  de  emprego  de  alguém. 

•  Compromisso  organizacional  ( OC).  O  grau  em  que  um 
empregado  se  identifica  com  a  HBAT,  sentindo-se  parte 
da  empresa. 

•  Intenções  de  permanência  (SI).  O  grau  em  que  um  em¬ 
pregado  pretende  continuar  trabalhando  para  a  HBAT 
e  não  está  participando  de  atividades  que  tornam  o  pe¬ 
dido  de  demissão  algo  mais  provável. 

•  Percepções  ambientais  (EP).  Crenças  que  um  emprega¬ 
do  tem  sobre  as  condições  físicas  de  trabalho  no  dia-a- 
dia. 

•  Atitudes  com  colegas  (AC).  Atitudes  que  um  emprega¬ 
do  tem  com  relação  a  colegas  com  os  quais  ele/ela  inte¬ 
rage  regularmente. 

A  análise  será  conduzida  no  nível  individual.  A 
HBAT  está  agora  pronta  para  testar  o  modelo  estrutural 
usando  SEM. 
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Estágio  5  de  SEM:  Especificação 
do  modelo  estrutural 

Com  as  medidas  de  construtos  em  mãos,  os  pesquisadores 
agora  devem  estabelecer  as  relações  estruturais  entre  os 
construtos  e  traduzi-las  para  uma  forma  adequada  para  a 
análise  SEM.  As  seções  a  seguir  detalham  a  teoria  estru¬ 
tural  inerente  à  análise  e  ao  diagrama  de  caminhos  usado 
para  a  estimação  das  relações. 

Definição  de  uma  teoria  estrutural 

A  equipe  de  pesquisa  da  HBAT  propõe  uma  teoria  ba¬ 
seada  na  literatura  organizacional  e  na  experiência  co¬ 
letiva  dos  principais  funcionários  da  administração  da 
HBAT.  Eles  concordam  que  é  impossível  incluir  todos  os 
construtos  que  podem  potencialmente  se  relacionar  com  a 
retenção  de  empregados  (intenções  de  permanência).  Isto 
seria  muito  dispendioso  e  trabalhoso  para  os  responden- 
tes,  com  base  no  grande  número  de  itens  de  pesquisa  a 
serem  completados.  Assim,  o  estudo  é  conduzido  com  os 
cinco  construtos  previamente  listados. 


A  teoria  leva  a  HBAT  a  esperar  que  EP,  AC,  JS  e  OC 
sejam  todos  relacionados  com  SI,  mas  de  diferentes  ma¬ 
neiras.  Por  exemplo,  um  elevado  escore  de  EP  significa 
que  os  empregados  acreditam  que  seu  ambiente  de  tra¬ 
balho  é  confortável  e  lhes  permite  conduzir  livremente 
suas  tarefas.  Este  ambiente  é  propício  para  criar  elevada 
satisfação  no  emprego,  o  que,  por  sua  vez,  facilita  uma 
ligação  entre  EP  e  SI.  Como  isso  requer  uma  apresen¬ 
tação  razoavelmente  extensa  de  conceitos  e  descobertas 
organizacionais  importantes,  não  desenvolveremos  de¬ 
talhadamente  a  teoria  aqui. 


A  administração  da  HBAT  quer  testar  as  seguintes 
hipóteses: 

H{.  Percepções  ambientais  são  positivamente  rela¬ 
cionadas  com  satisfação  no  trabalho. 

H{.  Percepções  ambientais  são  positivamente  rela¬ 
cionadas  com  envolvimento  organizacional. 

Hy  Atitudes  para  com  colegas  são  positivamente  re¬ 
lacionadas  com  satisfação  no  emprego. 

Hy  Atitudes  para  com  colegas  são  positivamente  re¬ 
lacionadas  com  envolvimento  organizacional. 

Hy  Satisfação  no  trabalho  é  positivamente  relaciona¬ 
da  com  envolvimento  organizacional. 

Hy  Satisfação  no  trabalho  é  positivamente  relaciona¬ 
da  com  intenções  de  permanência. 

Hy  Envolvimento  organizacional  é  positivamente  re¬ 
lacionado  com  intenções  de  permanência. 


Diagrama  visual 

A  teoria  pode  ser  expressa  visualmente.  A  Figura  12-6 
mostra  o  diagrama  correspondente  a  esta  teoria.  Para  fins 
de  simplificação,  as  variáveis  indicadoras  medidas  e  seus 
caminhos  e  erros  correspondentes  foram  deixados  de  fora 
do  diagrama.  Se  fossem  usada  uma  interface  gráfica  com 
um  programa  SEM,  então  todas  as  variáveis  medidas  e  os 
termos  de  variância  de  erro  teriam  que  ser  mostrados  no 
diagrama  de  caminhos. 


Construtos  exógenos.  EP  e  AC  são  construtos  exóge¬ 
nos  neste  modelo.  Considera-se  que  eles  são  determina¬ 
dos  por  coisas  fora  deste  modelo.  Em  termos  práticos, 
isso  significa  que  nenhuma  hipótese  prevê  qualquer  um 

_ (Continua) 


FIGURA  12-6  Modelo  de  retenção  da  empregados  de  HBAT. 
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(Continuação) 

desses  construtos.  Como  ocorre  com  variáveis  indepen¬ 
dentes  em  regressão,  eles  são  usados  apenas  para  prever 
outros  construtos. 

Os  dois  construtos  exógenos  -  EP  e  AC  -  são  repre¬ 
sentados  no  extremo  esquerdo.  Nenhuma  seta  de  um 
sentido  aponta  para  os  construtos  exógenos.  Uma  seta 
curva  de  dois  sentidos  é  incluída  para  capturar  qualquer 
covariância  entre  esses  dois  construtos  (92 1)-  Apesar  de 
nenhuma  hipótese  conectá-los,  eles  podem  não  ser  cons¬ 
trutos  independentes.  Assim,  se  o  modelo  de  mensura- 
ção  estima  um  coeficiente  de  caminho  entre  construtos 
não  envolvidos  em  qualquer  hipótese,  então  tal  parâme¬ 
tro  também  deve  ser  estimado  no  modelo  SEM. 

Construtos  endógenos.  JS,  OC  e  SI  são  endógenos 
neste  modelo.  Cada  um  é  determinado  por  construtos 
incluídos  no  modelo  e,  assim,  cada  um  também  é  vis¬ 
to  como  um  resultado  baseado  nas  hipóteses  listadas. 
Observe  que  JS  e  OC  são  usados  como  resultados  em 
algumas  hipóteses  e  como  preditores  em  outras.  Este 
papel  dual  é  perfeitamente  aceitável  em  SEM,  e  um 
teste  para  todas  as  hipóteses  pode  ser  fornecido  com 
um  teste  de  modelo  estrutural.  Este  tipo  de  teste  de 
hipótese  não  seria  possível  com  um  único  modelo  de 
regressão,  pois  estaríamos  limitados  a  uma  só  variável 
dependente. 

O  modelo  de  caminhos  estruturais  começa  a  se  de¬ 
senvolver  a  partir  dos  construtos  exógenos.  Um  caminho 
deveria  conectar  quaisquer  dois  construtos  teoricamen¬ 
te  ligados  por  uma  hipótese.  Portanto,  depois  de  esbo¬ 
çar  os  três  construtos  endógenos  (JS,  OC  e  SI),  setas  de 
um  só  sentido  são  colocadas  conectando  os  construtos 
preditores  (exógenos)  com  seus  respectivos  resultados, 
com  base  nas  hipóteses.  A  legenda  no  canto  inferior  di¬ 
reito  da  Figura  12-6  lista  cada  hipótese  e  o  caminho  ao 
qual  pertence.  Cada  seta  de  um  sentido  representa  um 
caminho  direto  e  é  rotulada  com  a  estimativa  paramétri¬ 
ca  apropriada.  Por  exemplo,  H2  se  refere  a  uma  relação 
positiva  EP-OC.  Uma  estimativa  paramétrica  conectan¬ 
do  um  construto  exógeno  a  um  endógeno  é  designada 
pelo  símbolo  (7).  A  convenção  é  que  o  primeiro  subs¬ 
crito  lista  o  número  do  construto  para  o  qual  o  caminho 
aponta,  e  o  segundo  subscrito  se  refere  ao  construto  no 
qual  o  caminho  começa.  Assim,  é  representada  por 
72 1-  Analogamente  então,  H-,,  que  conecta  SI  com  OC,  é 
representada  por  (Jjj. 


Os  caminhos  supostos  devem  ser  comunicados  a  um 
programa  SEM  a  fim  de  se  obter  resultados.  O  Apêndice 
12D  fornece  a  sintaxe  do  programa  SEM  (LISREL)  que 
produz  resultados  para  este  modelo.  Com  AMOS  você 
deve  esboçar  o  modelo  usando  a  interface  gráfica,  iden¬ 


tificar  os  dados  adequados  para  uso,  e  então  processar  o 
modelo. 

Estágio  6:  Avaliação  da  validade 
do  modelo  estrutural 

O  modelo  estrutural  mostrado  no  diagrama  de  caminhos 
pode  agora  ser  estimado.  O  ajuste  do  modelo  SEM  e  a 
consistência  das  relações  com  expectativas  teóricas  po¬ 
dem  ser  avaliados.  Agora  nos  voltamos  a  um  resumo  do 
resultado  do  modelo  exibido  na  Figura  12-7. 


Primeiramente  examinamos  as  estimativas  de  cargas 
para  garantir  que  elas  não  mudaram  substancialmente 
em  relação  ao  modelo  CFA.  Neste  caso,  as  estimati¬ 
vas  de  cargas  são  virtualmente  inalteradas  em  relação 
aos  resultados  de  CFA.  Somente  três  cargas  estimadas 
completamente  padronizadas  mudam,  e  a  mudança 
máxima  é  de  0,01.  Assim,  se  já  não  tivesse  sido  testa¬ 
da  no  estágio  CFA,  a  evidência  agora  indica  estabili¬ 
dade  paramétrica  entre  os  itens  medidos.  Em  termos 
técnicos,  nenhum  problema  decorre  de  confusão  de 
interpretação,  o  que  sustenta  ainda  mais  a  validade  do 
modelo  de  mensuração. 

A  seguir,  o  ajuste  geral  do  modelo  é  examinado.  A 
saída  de  SEM  na  Figura  12-7  mostra  as  estatísticas  de 
ajuste  geral  resultantes  do  teste  do  modelo.  O  é  275,1 
com  181  graus  de  liberdade  {p  <  0,05).  O  CFI  do  modelo 
é  o  mesmo  de  CFA  em  0,99.  A  RMSEA  é  0,036,  que  é 
0,009  maior  do  que  em  CFA.  O  intervalo  de  confiança  de 
90%  para  RMSEA  é  de  0,027  a  0,045.  A  RMSEA  ainda 
está  dentro  de  um  intervalo  que  pode  ser  associado  com 
bom  ajuste.  Esses  diagnósticos  sugerem  que  o  modelo 
fornece  um  bom  ajuste  geral  (ver  Capítulo  10  para  uma 
revisão  sobre  diretrizes  de  ajuste). 


A  validação  do  modelo  não  está  completa  sem  o  exa¬ 
me  das  estimativas  paramétricas  individuais.  Elas  são  es¬ 
tatisticamente  significantes,  estão  na  direção  prevista,  são 
não-triviais?  Todas  essas  respostas  devem  ser  dadas  para¬ 
lelamente  à  avaliação  do  ajuste  do  modelo. 


A  Figura  12-8  mostra  o  diagrama  de  caminhos  com 
as  estimativas  paramétricas  estruturais  resultantes  com¬ 
pletamente  padronizadas  incluídas  nos  caminhos.  Além 
disso,  a  seguinte  saída  padrão  é  gerada  pelo  programa 
SEM  e  contém  as  estimativas  estruturais  de  máxima  ve¬ 
rossimilhança  (ML),  erros  padrão  e  valores-í.  Observe 
que  essas  são  estimativas  de  máxima  verossimilhança  em 
uma  primeira  aproximação  e,  assim,  elas  diferem  daque¬ 
las  mostradas  na  Figura  12-8. 
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Estatística  de  qualidade  de  ajuste 
Graus  de  liberdade  =  181 

Função  qui-quadrado  de  ajuste  mínimo  =  275,1  (P  =  0,00) 

Parâmetro  estimado  de  não-centralidade  (NCP)  =  94,09 
Intervalo  de  90%  de  confiança  para  NCP  =  (53,33;  142,81) 

Raiz  do  erro  quadrático  médio  de  aproximação  (RMSEA)  =  0,036 
Intervalo  de  90%  de  confiança  para  RMSEA  =  (0,027;  0,045) 

Valor-p  para  teste  de  ajuste  próximo  (RMSEA  <  0,05)  =  1,00 

índice  de  validação  cruzada  esperado  (ECVI)  =  0,94 
Intervalo  de  90%  de  confiança  para  ECVI  =  (0,84;  1,06) 

ECVI  para  modelo  saturado  =  1,16 

ECVI  para  modelo  de  independência  =  20,28 

Qui-quadrado  para  modelo  de  independência  com  210  graus  de  liberdade  =  8030,24 
AIC  de  independência  =  8072,24 
AIC  do  modelo  =  375,09 
AIC  saturado  =  462,00 

índice  de  ajuste  normado  (NFI)  =  0,96 

índice  de  ajuste  não-norraado  (NNFI)  =  0,98 

índice  de  ajuste  normado  de  parcimônia  (PNFI)  =  0,83 

índice  de  ajuste  comparativo  (CFI)  =  0,99 

índice  de  ajuste  incremental  (IFI)  =  0,99 

índice  de  ajuste  relativo  (RFI)  =  0,96 

N  crítico  (CN)  =  321,42 

Raiz  do  resíduo  quadrático  médio  (RMR)  =  0,11 
RMR  padronizado  =  0,060 

índice  de  qualidade  de  ajuste  (GFI)  =  0,94 

índice  de  qualidade  de  ajuste  ajustado  (AGFI)  =  0,92 

FIGURA  12-7  Ajuste  do  modelo  geral  de  retenção  de  empregados  da  HBAT 


Aqui  os  resultados  são  separados  em  grupos  com 
base  no  tipo  de  relação  que  eles  representam.  Novamen¬ 
te,  LISREL  faz  esse  agrupamento  por  modo  padrão. 
AMOS  não  agrupa  relações  por  tipo  desta  maneira. 
Tanto  AMOS  quanto  LISREL  mostram  os  resultados 
de  máxima  verossimilhança  como  padrão. 

Todas  as  estimativas  de  caminhos  estruturais  são 
significantes  e  na  direção  esperada,  exceto  duas.  As 
exceções  são  as  estimativas  entre  AC  e  JS  (712)  ®  entre 
JS  e  OC  (32 1)-  712  t®ni  uma  estimativa  de  ML  de  -0,01 
e  um  valor-í  de  -0,17.  321  tem  uma  estimativa  de  ML 
de  0,13  com  um  valor-í  de  1,60,  o  que  fica  abaixo  do 
valor-í  crítico  para  um  erro  Tipo  I  de  0,05.  Logo,  ape¬ 
sar  de  a  estimativa  estar  na  direção  suposta,  ela  não  é 
sustentada.  No  geral,  porém,  uma  vez  que  cinco  das 
sete  estimativas  são  consistentes  com  as  hipóteses,  es¬ 
ses  resultados  sustentam  o  modelo  teórico  com  uma 
advertência  para  os  dois  caminhos  que  não  são  susten¬ 
tados. 


Exame  do  diagnóstico  de  modelo 

Como  discutido  anteriormente,  diversas  medidas  diag¬ 
nósticas  estão  disponíveis  para  o  pesquisador,  variando 
de  índices  de  ajuste  a  resíduos  padronizados  e  índices  de 
modificação.  Cada  uma  delas  é  examinada  na  discussão  a 
seguir  para  nos  certificarmos  se  vale  a  pena  considerar  re- 
especificação  do  modelo. 
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FIGURA  12-8  Estimativas  de  caminhos  completamente  padronizadas  para  o  modelo  estrutural  da  HBAT. 


As  outras  estatísticas  de  ajuste,  em  geral,  também 
sustentam  o  modelo.  Por  exemplo,  a  SRMR  aumentou 
de  0,035  para  0,060,  mas  ainda  é  um  valor  associado 
com  bom  ajuste.  Como  teste  complementar,  a  HBAT 
examina  a  diferença  de  ajuste  entre  o  modelo  estrutu¬ 
ral  e  o  de  CFA.  O  Ax^  resultante  é  de  45,2  com  dois 
graus  de  liberdade  (p  <  0,001).  Ele  pode  ser  determina¬ 
do  pelo  cálculo  da  diferença  entre  os  valores  de  x  de 
SEM  e  de  CFA.  A  diferença  em  graus  de  liberdade  é 
2,  o  que  é  devido  ao  fato  de  que  todos  os  caminhos  es¬ 
truturais  possíveis  são  estimados,  exceto  dois.  Essa  di¬ 
ferença  altamente  significante  sugere  que  o  ajuste  pode 
ser  melhorado  estimando-se  outro  caminho  estrutural. 
A  possibilidade  de  outro  caminho  estrutural  significa¬ 
tivo  deve  ser  considerada,  particularmente  se  outra  in¬ 
formação  diagnóstica  aponta  especificamente  para  uma 
relação  em  particular. 

O  programa  SEM  oferece  um  resumo  dos  resídu¬ 
os  padronizados  em  uma  matriz  que  mostra  o  resíduo 
padronizado  para  cada  variável  medida.  Esta  última  é 
fornecida  porque  a  pedimos  como  uma  opção.  Uma  par¬ 
te  do  resumo  é  listada  a  seguir,  na  qual  este  resíduo  em 
particular  é  apresentado: 

Menor  resíduo  padronizado  =  -2,99 
Resíduo  padronizado  mediano  =  0,00 
Maior  resíduo  padronizado  =  5,84 


Maiores  resíduos  padronizados  negativos 


Resíduo  para 

SI2  e 

OCl 

-2, 

,  90 

Resíduo  para 

SI3  e 

OCl 

-2, 

,  88 

Resíduo  para 

SI4  e 

OCl 

-2, 

,  99 

Resíduo  para 

EP3  e 

OCl 

-2, 

,  90 

Maiores  resíduos  padronizados  positivos 


Resíduo  para 

SI2  e 

SIl 

3,45 

Resíduo  para 

SI4  e 

SI3 

3 ,47 

Maior 

resíduo 

Maior  resíduo 

Resíduo  para 

padronizado 

EPl  e 

SIl 

3,78 

padroni¬ 

zado 

Resíduo  para 

EP2  e 

SI4 

5,  84 

Uma  análise  dos  resíduos  padronizados  para  o  mo¬ 
delo  sugere  que  o  resíduo  máximo  é  para  a  covariância 
entre  as  variáveis  medidas  EP2  e  SI4.  Seu  valor  é  5,84,  o 
que  indica  um  problema  em  potencial,  pois  excede  4.  A 
relação  estrutural  correspondente  a  este  resíduo  seria  um 
caminho  direto  de  EP  a  Sl.  No  momento,  a  relação  entre 
esses  dois  construtos  é  explicada  somente  pelas  relações 
seqüenciais  EP  ^  JS  ^  SI  e  EP  ^  JS  ^  OC  ^  SI.  Ne¬ 
nhuma  seta  liga  EP  (um  construto  exógeno,  e  SI  (um 
construto  endógeno,  TI3)  diretamente.  Como  resultado,  o 
pesquisador  verifica  os  índices  de  modificação.  Aqui,  os 
índices  de  modificação  são  agrupados  pelo  tipo  de  parâ¬ 
metro  que  eles  indicam.  LISREL  fornece  saída  neste  for¬ 
mato.  AMOS  simplesmente  lista  os  índices  de  modifica¬ 
ção  para  parâmetros  estruturais  sem  fazer  esta  distinção. 

índices  de  modificação  para  GAMA  (7) 

EP  AC 


o  maior  índice  de  modificação  é  para  EP  ^  SI  (731), 
o  que  corresponde  a  uma  seta  de  EP  a  SI  (ver  Figura 
12-9).  Esta  relação  não  foi  anteriormente  incluída  no 
modelo  estrutural  da  Figura  12-8  porque  não  é  parte  da 
teoria  da  HBAT.  Seu  valor,  40,12,  levanta  dúvida  sobre 
a  premissa  de  que  JS  media  a  relação  entre  EP  e  SI. 
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Reespecificação  de  modelo 

Muitas  vezes,  as  medidas  diagnósticas  disponíveis  em 
SEM  indicam  uma  potencial  reespecificação  do  modelo. 
Apesar  de  já  termos  discutido  sobre  o  fato  de  que  qual¬ 
quer  reespecificação  tem  necessidade  crítica  de  suporte 
tanto  teórico  quanto  empírico,  a  reespecificação  de  mo¬ 
delo  pode  melhorar  o  ajuste  do  modelo.  A  discussão  a 
seguir  detalha  uma  reespecihcação  em  nosso  exemplo 
da  HBAT. 


Como  resultado,  a  HBAT  reestima  o  modelo  usando 
uma  análise  post  hoc  adicionando  o  caminho  sugerido. 
A  Figura  12-9  descreve  o  modelo,  incluindo  um  caminho 
livre  correspondente  a  esta  relação  direta.  O  programa 
SEM  é  instruído  a  liberar  EP  ^  SI  (731).  A  estimativa 
paramétrica  completamente  padronizada  resultante 
para  73  3  é  de  0,37  com  um  valor-í  de  6,12  {p  <  0,001). 
Além  disso,  o  ajuste  geral  revela  um  valor  x  de  238,85 
com  180  graus  de  liberdade.  O  CFI  continua  em  0,99  e  a 
RMSEA  é  0,029,  o  que  é  praticamente  o  mesmo  valor 
do  modelo  CFA.  Este  ajuste  é  melhor  do  que  no  mo¬ 
delo  estrutural  original,  pois  Ax  =  36,2  e  com  1  grau  de 
liberdade,  o  que  é  significante  (p  <  0,001).  Diversas  es¬ 
timativas  de  caminhos  do  modelo  original  mudaram  um 
pouco,  como  esperado.  Mais  notavelmente,  a  relação  JS 
^  SI  (P3 1  =  0,06)  não  é  mais  significante,  e  a  relação  SI 
^  OC*  (p3  2=  0,36)  continua  significante,  apesar  de  ser 
substanciafmente  menor  do  que  antes. 

O  valor  de  i^x  entre  os  modelos  SEM  revisado  e 
CFA  é  8,90  com  1  grau  de  liberdade.  A  correlação  múl¬ 
tipla  quadrática  (ou  seja,  I^)  para  SI  também  melhora 
de  0,35  para  0,45  com  o  acréscimo  desta  relação.  Tais 
descobertas  têm  implicações  para  os  tipos  de  relações 
que  conectam  esses  construtos,  como  percebemos  na 
próxima  seção. 


Resumo 

Até  este  momento,  a  HBAT  testou  seu  modelo  estrutu¬ 
ral  original.  Os  resultados  mostraram  ajuste  geral  razoa¬ 
velmente  bom  e  as  relações  teorizadas  foram,  em  geral, 
sustentadas.  Contudo,  a  grande  diferença  de  ajuste  entre 
o  modelo  estrutural  e  o  CFA,  bem  como  diversos  diag¬ 
nósticos  estratégicos,  incluindo  os  resíduos  padronizados, 
sugeriram  um  melhoramento  no  modelo.  Esta  mudança 
melhorou  o  ajuste  do  modelo.  Agora,  a  HBAT  deve  con¬ 
siderar  o  teste  deste  modelo  com  novos  dados  para  avaliar 
sua  generalidade. 


TÓPICOS  AVANÇADOS 

O  processo  SEM  de  seis  estágios  foi  discutido  neste  capí¬ 
tulo  e  no  anterior.  Agora,  diversos  tópicos  avançados  são 
discutidos,  os  quais  descrevem  diferentes  tipos  de  relações 
estruturais,  bem  como  análises  multigrupos  para  modelos 
estruturais. 

Tipos  de  relação 

Relações  podem  ser  caracterizadas  de  muitas  maneiras. 
No  Capítulo  10,  descrevemos  relações  em  modelos  SEM. 
Agora  explicamos  os  tipos  de  relações  que  compõem  o 
modelo  estrutural. 

Uma  relação  de  regressão  tipicamente  implica  uma 
associação  simples  ou  uma  relação  causal.  SEM  permite 
que  pesquisadores  examinem  relações  entre  variáveis  de 
uma  maneira  que  muitas  outras  técnicas  não  fazem.  Me¬ 
diação  e  moderação  são  dois  dos  tipos  mais  comuns  de 
relações. 

Mediação 

Um  efeito  mediador  é  criado  quando  uma  terceira  variá- 
vel/construto  intervém  entre  dois  outros  construtos  rela- 


FIGURA  12-9  Estimativas  de  caminhos  completamente  padronizadas  para  o  modelo  estrutural  revisado  da  HBAT. 


*  N.  de  R.  T.;  A  notação  correta  seria  “OC  ^  SI”. 
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cionados  entre  si.  O  diagrama  a  seguir  ilustra  um  efeito 
mediador: 


O  construto  M  media  a  relação  entre  K  e  E.  Media¬ 
ção  requer  correlações  significantes  entre  todos  os  três 
construtos.  Teoricamente,  um  construto  mediador  facili¬ 
ta  a  relação  entre  os  outros  dois  construtos  envolvidos.  O 
exemplo  a  seguir  ilustra  esses  pontos: 


K  pode  ser  a  inteligência  de  um  estudante,  E,  o  desem¬ 
penho  da  turma,  e  M,  a  efetividade  do  estudo.  Logo,  um 
estudante  pode  ser  inteligente,  mas  nem  sempre  ter  bom 
desempenho.  Se  um  estudante  é  inteligente,  esta  quali¬ 
dade  pode  encorajá-lo  a  estudar  mais  e  melhor,  o  que 
pode  resultar  em  um  melhor  desempenho  da  turma.  Em 
tal  caso,  a  correlação  significante  entre  K  e  E  seria  expli¬ 
cada  pela  seqüência  K-M-E  de  relações.  O  coeficiente 
paramétrico  resultante  para  c  seria  0  no  caso  de  media¬ 
ção  completa. 


Elm  pesquisador  pode  examinar  mediação  de  várias 
maneiras.  Primeiro,  se  é  esperado  que  o  caminho  rotula¬ 
do  por  c  seja  0  devido  à  mediação,  um  modelo  SEM  pode 
representar  essa  relação.  Este  modelo  incluiria  apenas  os 
caminhos  rotulados  por  a  e  b,  com  mostrado  no  diagrama 
a  seguir: 


Ele  não  incluiria  um  caminho  diretamente  de  K  a  E. 
Se  o  modelo  sugere  que  a  seqüência  K-M-E  fornece  um 
bom  ajuste,  ele  sustenta  um  papel  mediador  para  M.  Além 
disso,  o  ajuste  deste  modelo  pode  ser  comparado  com  os 
resultados  SEM  de  um  modelo  incluindo  o  caminho  K-E 
(c).  Se  a  adição  do  caminho  c  melhora  significativamente 
o  ajuste  como  indicado  por  Ax^,  então  mediação  não  é  sus¬ 
tentada.  Se  os  dois  modelos  produzem  ajustes  semelhan¬ 
tes,  então  mediação  é  sustentada. 

Como  relações  nem  sempre  são  claras,  uma  série  de 
passos  pode  ser  seguida  para  avaliar  mediação.  Esses  pas¬ 
sos  se  explicam  usando-se  tanto  SEM  quanto  qualquer 
outra  abordagem  de  modelo  linear  geral  (GLM),  incluin¬ 
do  análise  de  regressão  múltipla.  Usando-se  o  diagrama 
da  mediação  anterior,  os  passos  são  [7]: 


1.  Verificar  para  saber  que: 

a.  K  se  relaciona  com  E  (correlação  significante). 

b.  K  se  relaciona  com  M  (correlação  significante). 

c.  M  se  relaciona  com  E  (correlação  significante). 

2.  Se  c,  a  relação  entre  K  e  E,  continua  significante  e  inalterada 
quando  M  é  incluído  no  modelo  como  preditor  adicional  (K 
e  M  agora  prevêem  E),  então  mediação  não  é  sustentada. 

3.  Se  c  é  reduzida  mas  se  mantém  significante  quando  M  é  in¬ 
cluído  como  preditor  adicional,  então  mediação  parcial  é 
sustentada. 

4.  Se  c  é  reduzida  a  um  ponto  no  qual  não  é  significantemente 
diferente  de  zero  depois  que  M  é  incluído  como  construto 
mediador,  então  mediação  completa  é  sustentada. 

Retornamos  a  um  de  nossos  exemplos  anteriores  para 
verificarmos  como  este  processo  pode  ser  aplicado. 


No  diagrama  da  Figura  12-3b,  o  construto  C  é  tido  como 
mediador  da  relação  entre  os  construtos  A  e  D.  Ana¬ 
logamente,  o  construto  C  é  suposto  como  mediador  na 
relação  entre  os  construtos  B  e  D.  Se  o  ajuste  deste  mo¬ 
delo  for  aceitável,  ele  sustenta  o  papel  de  C  como  media¬ 
dor.  No  entanto,  o  pesquisador  pode  testar  para  ver  se  A 
ou  B  se  relacionam  diretamente  com  D.  Quaisquer  rela¬ 
ções  diretas  entre  A  e  D  ou  B  e  D  indicam  que  mediação 
completa  não  é  sustentada.  Quando  as  estimativas  de  ca¬ 
minhos  para  A-D  e  B-D  não  são  significantes,  e  os  outros 
caminhos  são  significantes,  então  os  papéis  mediadores 
teorizados  do  construto  C  encontram  sustentação. 


Efeitos  indiretos.  Um  modelo  estrutural  com  um  efeito 
mediador  suposto  pode  produzir  efeitos  diretos  e  indi¬ 
retos.  Efeitos  diretos  são  as  relações  que  conectam  dois 
construtos  com  uma  só  seta.  Efeitos  indiretos  são  aquelas 
relações  que  envolvem  uma  seqüência  de  relações  com 
pelo  menos  um  construto  intermediário.  Assim,  um  efeito 
indireto  é  uma  seqüência  de  dois  ou  mais  efeitos  diretos 
e  é  visualmente  representado  por  múltiplas  setas.  Efeitos 
indiretos  são  consistentes  com  mediação.  O  diagrama  a 
seguir  mostra  um  efeito  indireto  de  K  sobre  E  na  forma 
de  uma  seqüência  K  — >  M  — >  E. 


K 

a 

M 

b 

E 

Um  efeito  direto  de  K  e  E  incluiria  uma  única  seta. 
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FIGURA  12-10  Um  modelo  SEM  com  efeitos  indiretos. 


(Continuação) 

B  e  D.  Segundo,  suponha  que  0  modelo  foi  estimado 

usando  SEM  e  as  estimativas  de  caminhos  estruturais 

são  mostradas.  O  modelo  inclui  efeitos  diretos  para  os 

seguintes  caminhos: 

A- 

C  =  0,50 

B- 

^  C  =  0,50 

B- 

^  D  =  0,30 

C- 

^  D  =  0,40 

O  tamanho  de  um  efeito  indireto  é  uma  função  dos 
efeitos  diretos  que  o  formam.  O  programa  SEM  tipica¬ 
mente  produz  uma  tabela  que  mostra  o  tamanho  dos  efei¬ 
tos  diretos  implicados  por  um  modelo.  Eles  podem  ser 
computados  também  multiplicando-se  os  efeitos  diretos 
entre  si. 


Por  exemplo,  supõe-se  que  A  afeta  D  indiretamente  por 
meio  de  C.  O  tamanho  deste  efeito  indireto  pode  ser  cal¬ 
culado  multiplicando-se  0,50,  a  relação  estimada  de  A  a  C, 
por  0,40,  a  relação  estimada  de  C  a  D.  O  resultado  é  0,20. 
Os  efeitos  indiretos  para  o  modelo  na  Figura  12-10  são: 

A  ^  C  ^  D  0,50  X  0,40  =  0,20 
B  ^  C  ^  D  0,50  X  0,40  =  0,20 


O  efeito  total  de  um  construto  sobre  outro  é  a  soma 
das  relações  indiretas  e  diretas  entre  eles. 


Por  exemplo,  o  efeito  total  de  B  sobre  D  é: 

0,30  (direto)  +  0,20  (indireto)  =  0,50 


Apesar  de  seqüências  de  três  variáveis  serem  exibidas 
aqui,  duas  ou  mais  variáveis  podem  intermediar  na  rela¬ 
ção  entre  um  construto  e  o  resultado  subseqüente.  A  ilus¬ 
tração  da  HBAT  oferece  um  exemplo  de  um  modelo  que 
resulta  em  diversas  relações  mediadas. 

Ilustração  HBAT  de  mediação.  O  modelo  HBAT  mos¬ 
trado  na  Figura  12-8  teoriza  diversos  efeitos  mediadores. 


Assim,  os  resultados  do  modelo  original  podem  ser  com¬ 
parados  com  um  modelo  revisado,  para  que  se  examine  a 
extensão  da  mediação. 


O  diagnóstico  para  o  modelo  original  HBAT_SEM  su¬ 
gere  um  caminho  direto  de  EP  para  SI  (731).  O  modelo 
revisado  mostrado  na  Figura  12-9  inclui  tal  relação  direta. 
Quando  esta  relação  direta  foi  incluída,  várias  outras  esti¬ 
mativas  de  caminhos  mudaram.  O  modelo  original  supôs 
que  qualquer  efeito  de  EP  sobre  SI  seria  mediado  por  JS 
e/ou  OC  por  meio  da  seqüência  de  relações  que  conectam 
EP  com  SI.  Assim,  o  diagnóstico  que  levou  ao  teste  de 
um  modelo  revisado  acabou  levantando  a  questão  sobre 
a  natureza  teorizada  de  mediação  completa  da  conexão 
entre  EP  e  SI.  Em  outras  palavras,  o  tipo  de  relação  é 
questionado. 

Os  resultados  sugerem  um  caminho  direto  entre 
EP  e  SI,  pois  a  estimativa  do  caminho  é  significante  e 
o  acréscimo  do  caminho  melhora  o  ajuste  do  modelo. 
Com  um  caminho  direto  significante,  a  relação  JS-SI  se 
torna  insignificante;  JS  não  media  a  relação  entre  EP  e 
SI,  como  originalmente  suposto.  Logo,  é  provável  que  o 
tipo  de  relação  seja  direto,  e  não  indireto.  Em  retrospec¬ 
to,  a  relação  direta  pode  fazer  sentido,  pois  além  de  fazer 
as  pessoas  se  sentirem  satisfeitas,  os  empregados  ficam 
mais  familiarizados  com  seus  ambientes  de  trabalho  e 
podem  achar  desagradável  a  idéia  de  trabalhar  em  um 
ambiente  com  o  qual  não  tenham  familiaridade.  O  con¬ 
forto  relativo  com  o  ambiente  familiar  de  trabalho  pode 
fazer  com  que  seja  mais  provável  que  os  empregados  fi¬ 
quem.  Dada  esta  análise  teórica  post  hoc,  a  HBAT  pre¬ 
cisa  promover  a  validação  cruzada  deste  resultado  com 
novos  dados  antes  de  considerá-la  confiável.  Contudo, 
implicações  administrativas  para  cada  uma  das  hipóteses 
sustentadas  podem  ser  desenvolvidas  com  base  nos  re¬ 
sultados  positivos  gerais. 

Para  fins  de  ilustração,  um  resumo  das  relações  dire¬ 
tas  e  indiretas  (mediadas)  é  mostrado  aqui: 

(Continua) 
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{Conlinuação) 

Direta:  =  EP  ^  SI  0,37 

Indireta  EP  ^  JS  ^  SI  0,24  x  0,06  =  0,014 

Indireta  EP  ^  JS  ^  OC  ^  SI  0,24  x  0,10  x  0,36  =  0,0086 
Total  0,37  +  0,014  +  0,0086  =  0,39 

Este  resultado  ilustra  que  EP  e  SI  são  conectados 
diretamente,  e  não  indiretamente.  O  tamanho  de  cada 
efeito  indireto  é  irrelevante  relativamente  à  força  do 
efeito  direto.  Adicioná-los  ao  efeito  direto  deixa-o  vir¬ 
tualmente  inalterado.  Neste  caso,  cada  efeito  indireto 
inclui  também  pelo  menos  uma  relação  insignificante. 
Efeitos  indiretos  pequenos  (ou  seja,  menores  do  que 
0,08)  raramente  são  de  interesse  e  dificilmente  acrescen¬ 
tam  algo  às  conclusões  substanciais.  Nesta  ilustração  da 
HBAT,  a  relação  indireta  EP-SI  não  seria  interpretada. 


Moderação 

Um  efeito  moderador  ocorre  quando  uma  terceira  variá¬ 
vel  ou  construto  muda  a  relação  entre  duas  variáveis/cons- 
trutos  relacionadas.  Um  moderador  significa  que  a  relação 
entre  duas  variáveis  muda  com  o  nível  de  outra  variável/ 
construto.  A  interpretação  de  moderadores  é  mais  difícil, 
pois  um  moderador  fica  mais  fortemente  relacionado  com 
alguma  das  demais  variáveis/construtos  envolvidas  na  aná¬ 
lise.  Logo,  a  análise  de  moderadores  é  mais  fácil  quando  o 
moderador  não  apresenta  relação  linear  signiflcante  com 
o  preditor  ou  a  variável  de  critério  (construto  resultante) 
[5,  7, 10].  A  falta  de  uma  relação  entre  o  moderador  e  as 
variáveis  preditoras  e  de  critério  ajuda  a  distinguir  mode¬ 
radores  de  mediadores.  Isso  facilita  também  na  interpreta¬ 
ção,  uma  vez  que  multicolinearidade  elevada,  como  o  caso 
em  que  o  moderador  é  altamente  relacionado  com  o  predi¬ 
tor  ou  o  critério,  torna  difícil  uma  interpretação  válida. 

Moderadores  não-métricos.  Uma  variável  moderadora 
pode  ser  métrica  ou  não-métrica.  Variáveis  categóricas 
não-métricas  freqüentemente  são  teorizadas  como  mo¬ 
deradoras.  Elas  tipicamente  são  variáveis  de  classificação 
de  algum  tipo.  Por  exemplo,  com  freqüência  sexo  é  usado 
como  moderador.  Analogamente,  cultura  pode  se  mos¬ 
trar  um  importante  moderador.  Se  um  pesquisador  está 
examinando  o  efeito  de  um  anúncio  em  inglês  em  uma 
comunidade  bilíngüe  (como  francês  e  inglês),  espera-se 
que  a  força  de  uma  relação  entre  exposição  ao  anúncio  e 
efetividade  do  mesmo  seja  maior  entre  os  respondentes 
de  origem  inglesa  do  que  entre  os  de  origem  francesa. 

Teoria  é  importante  na  avaliação  de  um  moderador, 
pois  um  pesquisador  deveria  ter  alguma  razão  para  espe¬ 
rar  que  o  moderador  mudasse  uma  relação.  No  exemplo 
precedente  é  razoável  esperar  que  maior  exposição  ao 
anúncio  terá  maior  efeito  sobre  consumidores  que  o  com¬ 
preendem  melhor.  Em  suma,  indivíduos  com  maior  pro¬ 
ficiência  no  idioma  compreendem  melhor  a  mensagem  e 
provavelmente  responderão  a  ela.  Caso  contrário,  é  um 
anúncio  ruim! 


Uso  de  SEM  de  múltiplos  grupos  para  testar  mode¬ 
ração.  SEM  de  multigrupos  é  freqüentemente  usada 
para  testar  efeitos  moderadores.  Por  exemplo,  considere 
que  o  construto  C  na  Figura  12-3b  é  quantia  de  anúncio  e 
o  construto  D  é  efetividade  do  anúncio.  Um  modelo  SEM 
multigrupo  é  conduzido  como  descrito  no  capítulo  ante¬ 
rior  para  CEA  de  múltiplos  grupos.  Os  procedimentos 
que  são  utilizados  para  testar  moderação  desta  maneira 
seguem  de  modo  muito  próximo  os  testes  de  invariância 
executados  em  CEA.  Ou  seja,  a  mesma  estrutura  de  mo¬ 
delo  SEM  é  usada  com  ambos  os  grupos.  Os  dois  grupos 
representam  duas  culturas  diferentes:  os  que  falam  inglês 
e  os  que  falam  francês. 


Inicialmente,  o  modelo  de  dois  grupos  seria  testado  per¬ 
mitindo  que  todas  as  relações  teorizadas,  incluindo  Pj  i 
(relação  entre  C  e  D),  fossem  livremente  estimadas  em 
ambos  os  grupos.  Este  modelo  seria  o  equivalente  estru¬ 
tural  do  modelo  CFA  TF.  A  seguir,  um  segundo  modelo 
é  testado  adicionando-se  uma  restrição  que  fixa  a  rela¬ 
ção  entre  C  e  D  como  sendo  igual  entre  os  dois  grupos. 
O  resultado  é  que  a  relação  entre  C  e  D  assumiria  o  mes¬ 
mo  valor  nas  amostras  de  inglês  e  francês. 

Esta  restrição  afeta  negativamente  o  ajuste  do  mo¬ 
delo?  O  efeito  sobre  ajuste  pode  ser  estimado  via  Ax^. 
Se  for  significante,  então  a  restrição  de  igualar  a  relação 
nos  dois  grupos  prejudicou  o  ajuste  do  modelo.  Portan¬ 
to,  moderação  seria  sustentada.  Em  outras  palavras,  o 
modelo  tem  melhor  ajuste  quando  se  permite  que  a  re¬ 
lação  seja  diferente  com  base  na  variável  moderadora 
(cultura,  neste  caso). 

Se  a  relação  entre  C  e  D  for  maior  nos  dados  de  in¬ 
glês  do  que  nos  dados  de  francês,  então  o  teste  de  mo¬ 
deração  está  completo  e  ela  é  suportada.  Se  a  restrição 
de  igualdade  não  prejudicar  o  ajuste  (Ax^  insignificante), 
então  moderação  não  encontra  apoio  e  a  conclusão  lógi¬ 
ca  é  que  a  relação  exposição  ao  anúncio  ^  efetividade 
do  anúncio  é  a  mesma  entre  consumidores  que  falam  in¬ 
glês  e  aqueles  que  falam  francês. 


Moderadores  métricos.  Um  moderador  pode  também 
ser  métrico  e  ser  avaliado  usando-se  SEM.  Se  a  variável 
contínua  puder  ser  categorizada  de  uma  maneira  que 
faça  sentido,  então  grupos  podem  ser  criados  e  os  mes¬ 
mos  procedimentos  anteriormente  descritos  podem  ser 
usados  para  testar  moderação,  mas  somente  se  grupos 
lógicos  puderem  ser  justificados.  Por  exemplo,  se  a  variá¬ 
vel  contínua  mostra  bimodalidade  (isto  é,  a  distribuição 
de  freqüência  mostra  claramente  dois  picos  no  lugar  de 
um),  então  grupos  lógicos  podem  ser  criados  em  torno  de 
cada  moda.  Análise  de  agrupamentos  ou  MDA  também 
podem  ser  úteis  para  formar  grupos.  Por  outro  lado,  se 
a  variável  moderadora  retrata  uma  distribuição  unimodal 
(um  pico),  agrupamento  não  se  justifica.  E  possível  que 
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alguma  fração  (como  1/3)  das  observações  em  torno  do 
valor  mediano  possam  ser  eliminadas  e  as  restantes  (que 
agora  provavelmente  são  bimodais)  sejam  usadas  para 
criar  grupos.  Uma  desvantagem  óbvia  desta  abordagem  é 
o  aumento  de  custo,  tempo  e  esforço  associado  com  a  ne¬ 
cessidade  se  juntar  uma  amostra  maior.  A  vantagem  é  que 
a  análise  multigrupo  representa  uma  maneira  intuitiva  de 
mostrar  moderação. 

O  pesquisador  pode  também  modelar  uma  interação 
contínua  criando  termos  de  interação,  como  se  faz  quan¬ 
do  se  usa  uma  técnica  de  regressão.  Usando  terminologia 
de  regressão,  a  variável  independente  pode  ser  multiplica¬ 
da  pelo  moderador  para  criar  um  termo  de  interação.  Não 
obstante,  seguir  esta  abordagem  com  construtos  de  múl¬ 
tiplos  itens  é  complicado  por  numerosos  fatores.  Logo, 
consideramos  este  tópico  bastante  avançado.  Segue  uma 
breve  introdução,  mas  encorajamos  todos  os  usuários,  ex¬ 
ceto  os  experientes,  a  aplicarem  a  abordagem  de  múltiplos 
grupos,  a  menos  que  isso  não  possa  ser  justificado. 

Interações  de  variáveis  contínuas.  Outra  técnica 
para  lidar  com  um  moderador  contínuo  é  criar  uma  in¬ 
teração  entre  o  moderador  e  o  preditor.  Interações  entre 
variáveis  individuais  foram  tratadas  em  capítulos  ante¬ 
riores  e,  assim,  nos  concentramos  aqui  em  um  construto 
moderador  que  seria  medido  por  múltiplos  indicadores. 
A  Figura  12-11  ilustra  uma  maneira  para  lidar  com  intera¬ 
ções  de  variáveis  contínuas.  Considere  um  modelo  SEM 
com  dois  construtos  exógenos  prevendo  um  único  cons¬ 
truto  endógeno.  Cada  construto  é  indicado  por  quatro 
itens  medidos.  Se  o  primeiro  construto  (^j)  é  teorizado 
como  preditor  e  o  segundo  (^2)  ®  assumido  como  sendo 
um  moderador,  então  um  construto  de  interação  pode  ser 
criado  para  representar  o  efeito  moderador  pela  multipli¬ 
cação  dos  indicadores  dos  construtos  preditor  e  modera¬ 
dor  juntos.  Usando-se  esta  linha  de  raciocínio,  os  indica¬ 
dores  para  o  terceiro  construto  de  interação  (^3)  podem 
ser  computados  como  se  segue: 

Xg  =  Xj  X  Xj 
Xjo  =  Xj  X  Xg 

Xji  =  X3  X  X7 
X12  =X4XX8 

Essas  variáveis  computadas  podem  então  ser  acrescen¬ 
tadas  aos  dados  reais  que  contêm  12  variáveis  medidas  e  os 
termos  de  covariância  entre  essas  variáveis  calculadas  e  as 
demais  que  podem  ser  computadas.  Agora,  a  matriz  de  co¬ 
variância  para  este  modelo  mudaria  de  12  x  12  para  16  x  16. 

A  estimação  deste  modelo  é  complicada  por  diversos 
fatores  [15].  Tais  fatores  incluem  o  fato  de  que  a  suposição 
de  não-correlação  entre  termos  de  erro  não  é  mais  plau¬ 
sível,  pois  as  cargas  para  o  terceiro  construto  (^3)  são  uma 
função  matemática  daquelas  para  os  construtos  1  e  2  (^3 
e  ^2)-  Este  fato  leva  a  uma  configuração  muito  complexa 
do  modelo  SEM  que  é  recomendada  somente  para  usuá¬ 
rios  avançados.  Assim,  aqui  descrevemos  apenas  tal  téc¬ 


nica  brevemente.  Esta  configuração  requer  que  os  termos 
de  intercepto  para  os  itens  medidos  (t^)  sejam  estimados 
como  descrito  no  Capítulo  11.  O  padrão  de  cargas  fato¬ 
riais  exógenas  não  pode  mais  exibir  uma  estrutura  sim¬ 
ples.  Ainda  que  as  estimativas  de  cargas  para  o  terceiro 
construto  possam  ser  computadas  pela  multiplicação  das 
estimativas  de  cargas  correspondentes  às  variáveis  que 
criaram  cada  indicador  de  interação,  cargas  cruzadas  en¬ 
tre  construtos  também  existem  para  o  termo  de  interação. 
Elas  são  calculadas  cruzando-se  os  termos  com  as  res¬ 
pectivas  estimativas  de  cargas.  Novamente,  este  processo 
é  muito  complicado  de  se  seguir,  mas,  como  exemplo,  a 
li"  linha  de  A^,  hcaria  da  seguinte  maneira: 


Além  disso,  a  matriz  de  variância-covariância  de 
erro  para  as  variáveis  x  (6g)  devem  agora  incluir  termos 
para  os  itens  apropriados  de  covariância  de  erro,  que 
existem  devido  à  natureza  computacional  do  construto 
intercepto.  Esses  itens  não  precisam  ser  estimados,  pois 
eles  são  matematicamente  determinados  como  o  termo 
intercepto  para  o  item  medido  utilizado  para  computar 
o  indicador  de  interação  vezes  a  variância  de  erro  para 
um  construto.  Este  conceito  é  mais  facilmente  ilustrado 
por  um  exemplo.  O  parâmetro  8,  é  o  termo  de  variância 
de  erro  para  Xg,  o  primeiro  indicador  para  o  construto 
moderador.  Uma  vez  que  ele  é  computado  como  Xj  ve¬ 
zes  Xj,  um  termo  de  covariância  de  erro  faz-se  necessário 
para  ambos  Ogg  j  e  659  5.  Os  valores  seriam  fixados  como  Tj 
vezes  653  3  e  T5  vezes  6555,  respectivamente. 

Depois  de  se  terminar  uma  conhguração  seguindo  es¬ 
sas  orientações,  o  modelo  pode  ser  estimado  especihcan- 
do-se  apenas  o  caminho  estrutural  entre  o  construto  de 
interação  e  o  resultado.  Se  moderação  for  sustentada,  a 
estimativa  correspondente,  733,  neste  caso,  seria  signih- 
cante.  Note  que  os  efeitos  de  e  ^2  sobre  in3  são  de  vali¬ 
dade  questionável  na  presença  de  uma  interação  signih- 
cante.  Portanto,  eles  devem  ser  estimados  e  interpretados 
somente  no  caso  de  o  termo  de  interação  estrutural  (73  3) 
ser  insignihcante  [15]. 

Por  vezes,  termos  de  interação  causam  problemas  com 
convergência  do  modelo  e  distorção  dos  erros  padrão  [1]. 
Assim,  amostras  maiores  são  freqüentemente  exigidas 
para  minimizar  a  distorção.  Um  tamanho  amostrai  míni¬ 
mo  absoluto  seria  de  300  para  este  tipo  de  análise,  sendo 
amostras  de  500  ou  mais  recomendadas. 

Ilustração  HBAT  de  moderação.  A  ilustração  HBAT 
pode  ser  empregada  para  exemplihcar  um  teste  de  mode¬ 
ração  com  SEM.  Aqui,  uma  variável  categórica  é  teoriza¬ 
da  como  moderador. 


A  HBAT  suspeita  também  que  homens  e  mulheres  po¬ 
dem  não  exibir  as  mesmas  relações  em  cada  caso.  Es- 

(Continua) 
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FIGURA  1 2-1 1  Modelo  usando  um  construto  moderador  de  variável  continua. 

*Os  rótulos  restantes  para  as  oovariantes  de  erros  foram  omitidos  do  diagrama  por  simplificação.  As  cargas  cruzadas  ao  longo  dos  construtos  e  as 
covariâncias  de  erros  associadas  com  a  natureza  computacional  do  construto  de  interação  são  mostradas. 


{Continuação) 

peciflcamente,  eles  estão  interessados  no  papel  teórico 
que  atitudes  com  colegas  podem  desempenhar  na  cria¬ 
ção  de  satisfação  com  o  trabalho.  Com  base  em  teoria, 
eles  supuseram  uma  diferença  nesta  relação,  sugerindo 
que  a  relação  AC-JS  seria  maior  entre  mulheres,  se  com¬ 
parada  com  os  homens.  Assim,  decidiram  conduzir  uma 
análise  de  múltiplos  grupos  usando  a  variável  de  classi¬ 
ficação  de  sexo. 


Muito  do  trabalho  no  exame  desta  hipótese  é  descrito 
no  Capítulo  10.  Lembre-se  que  comparações  válidas  de  re¬ 
lações  entre  amostras  requerem  evidência  de  invariância 
métrica  entre  amostras.  A  CFA  de  múltiplos  grupos  esta¬ 
beleceu  invariância  métrica  parcial.  Ou  seja,  pelo  menos 
duas  cargas  fatoriais  por  construto  eram  invariantes  entre 
amostras  (ver  Capítulo  11).  Invariância  métrica  parcial  é 
suficiente  para  viabilizar  comparações  entre  construtos. 


Seguindo  os  mesmos  passos  que  foram  usados  para 
converter  o  modelo  CFA  de  um  grupo  em  um  de  dois 
grupos,  um  modelo  estrutural  de  dois  grupos  foi  configu¬ 
rado.  O  modelo  estrutural  TF  estima  o  modelo  estrutu¬ 
ral  idêntico  em  ambos  os  grupos  simultaneamente.  Em 
seguida,  um  modelo  é  testado,  o  qual  restringe  a  relação 
AC-JS  (712)  3  ser  igual  em  cada  amostra. 

Os  resultados  de  ajuste  para  cada  modelo  são  mos¬ 
trados  na  tabela  a  seguir: 


TF 

AC^JS 

É  igual 

Ax" 

X2 

401,1 

412,2 

11,1 

df 

360 

361 

1 

CFI 

0,99 

0,99 

RMSEA 

0,024 

0,027 

(Continua) 
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(Continuação) 

o  CFI  não  muda  até  duas  casas  decimais.  A  RMSEA 
é  um  pouco  maior  no  modelo  em  que  AC  ^  JS  (712)  é 
igual  nos  grupos  de  homens  e  mulheres.  Ax^=  11,2*  com 
um  grau  de  liberdade  e  é  significante  {p  <  0,001).  Dado 
o  valor  significante  Ax^,  a  conclusão  adequada  é  que  res¬ 
tringir  o  parâmetro  para  ser  igual  entre  os  grupos  produz 
ajuste  pior.  Logo,  o  modelo  TF,  no  qual  a  relação  AC  — > 
JS  é  livremente  estimada  em  ambos  os  grupos,  encontra 
respaldo.  Este  resultado  sugere  que  sexo  modera  a  rela¬ 
ção  entre  AC  e  JS. 

Olhando  as  estimativas  paramétricas  padronizadas 
para  os  resultados  TF,  o  pesquisador  da  HBAT  desco¬ 
bre  que  a  relação  AC  ^  JS  é  significante  em  ambos  os 
grupos.  Como  previsto,  a  relação  é  maior  para  mulhe¬ 
res,  com  uma  estimativa  completamente  padronizada  de 
0,24,  enquanto  a  mesma  estimativa  é  de  -0,17  para  ho¬ 
mens.  Assim,  parece  que  atitude  com  colegas  de  trabalho 
é  positivamente  relacionada  com  satisfação  no  emprego 
entre  mulheres,  mas  negativamente  relacionada  entre 
homens.  O  resultado  é  um  caso  claro  de  moderação,  no 
qual  a  natureza  de  uma  relação  (AC  ^  JS,  neste  caso) 
muda  conforme  uma  terceira  variável  (sexo). 


Assim,  este  exemplo  demonstra  como  SEM  pode  ser 
usada  para  evidenciar  moderação.  Uma  variável  categóri¬ 
ca,  como  sexo,  muda  os  parâmetros  entre  construtos. 

Análises  multigrupo 

Análises  multigrupo  para  modelos  estruturais  são  uma  ex¬ 
tensão  do  caso  CFA  de  múltiplos  grupos.  O  interesse  agora 
se  foca  nas  similaridades  e  diferenças  entre  parâmetros  es¬ 
truturais  que  indicam  distinções  em  relações  entre  os  gru¬ 
pos.  Freqüentemente,  pesquisadores  desenvolvem  uma  teo¬ 
ria  que  prevê  que  uma  ou  mais  relações  estruturais  variam 
entre  grupos.  Esta  teoria  tipicamente  envolve  um  teste  de 
moderação,  como  anteriormente  descrito  com  o  exemplo  de 
moderação  envolvendo  grupos  de  homens  e  mulheres.  SEM 
multigrupo  é  adequada  nessas  situações.  Discutimos  um 
exemplo  envolvendo  cruzamento  de  culturas  nesta  seção. 


A  Figura  12-12  é  uma  ilustração  de  um  modelo  estrutural 
de  múltiplos  grupos.  Considere  que  ele  é  testado  usando 
dados  obtidos  de  duas  populações,  cada  uma  de  um  país 
diferente.  Motivos  teóricos  levam  a  expectativas  de  que  al¬ 
gumas  relações  podem  diferir  entre  países.  O  pesquisador 
pode  acreditar  que  relações  em  um  país  não  são  tão  fortes 
como  em  outro,  por  exemplo.  Esta  crença  sugere  um  teste 
de  moderação.  Suponha  que  o  pesquisador  tivesse  expec¬ 
tativas  teóricas  que  levavam  à  previsão  de  que  ambos  os 
construtos  A  e  B  são  mais  fortemente  relacionados  com  C 
no  país  1  do  que  no  país  2.  Um  modelo  SEM  de  dois  gru¬ 
pos  poderia  ser  utilizado  para  testar  esta  expectativa. 


*  N.  de  R.  T.:  O  valor  representado  na  Tabela  é  11,7.  Na  realidade, 
ambos  os  valores  11,2  (no  texto)  e  11,7  (na  tabela)  estão  incorretos. 
O  valor  seria,  de  fato,  11,1  (=  412,2  -  401,1). 


Lembre-se  do  Capítulo  11  que,  antes  que  comparações 
válidas  entre  relações  possam  ser  feitas,  equivalência  mé¬ 
trica  deve  ser  estabelecida.  Assumindo  que  um  modelo 
CFA  é  testado,  restringindo  as  cargas  de  mensuração  a 
serem  iguais  em  cada  grupo,  e  que  este  modelo  não  apre¬ 
senta  ajuste  significativamente  pior  do  que  o  modelo  TF 
CFA,  invariância  métrica  é  sustentada.  Assim  como  um 
modelo  estrutural  pode  ser  construído  a  partir  de  um  mo¬ 
delo  CFA  na  situação  de  um  grupo,  um  modelo  estrutural 
pode  ser  testado  ao  longo  de  ambos  os  grupos  simulta¬ 
neamente.  Primeiro,  a  mesma  teoria  pode  ser  avaliada 
para  cada  grupo,  especificando  padrões  correspondentes 
de  parâmetros  estruturais  livres  e  fixados  em  cada  grupo. 
Segundo,  pode  ser  testado  um  modelo  que  restringe  essas 
relações  específicas  para  serem  iguais  em  cada  grupo. 

Os  ajustes  do  modelo  podem  ser  comparados  assim 
que  ele  seja  estimado.  Se  o  modelo  que  restringe  as  rela¬ 
ções  para  serem  iguais  se  ajustar  tão  bem  quanto  aquele 
original  que  permite  que  cada  7  seja  livremente  estima¬ 
do  em  cada  grupo,  então  o  resultado  é  consistente  com 
estimativas  paramétricas  estruturais  invariantes  e,  assim, 
inconsistente  com  a  previsão.  Se,  contudo,  o  modelo  com 
restrições  de  igualdade  tiver  ajuste  significativamente 
pior  (usando  os  critérios  descritos  no  Capítulo  11),  então 
permitir  que  os  parâmetros  tenham  diferentes  valores  em 
cada  grupo  parece  ser  mais  válido.  Dada  esta  abordagem, 
se  as  estimativas  de  parâmetros  forem  maiores  no  grupo 
associado  com  o  país  1,  então  a  hipótese  do  pesquisador 
será  sustentada.  Perceba  que  pode  também  ser  o  caso  de 
que  apenas  uma  das  estimativas  paramétricas  seria  consis¬ 
tente  com  a  previsão. 

Técnicas  similares  podem  ser  úteis  na  validação  cru¬ 
zada  de  parâmetros  estruturais  ao  longo  de  diferentes 
grupos  ou  no  exame  de  diferenças  baseadas  em  outras  va¬ 
riáveis  importantes  de  classificação  cruzada.  Além  disso, 
moderação  é  testada  por  meio  desta  ferramenta. 


No  exemplo  anterior,  a  variável  dicotômica  de  país  é 
usada  para  separar  os  dados  em  grupos.  As  hipóteses 
implicam  que  ela  modera  as  relações  entre  A  e  C  e  B 
e  C.  Na  prática,  este  tipo  de  análise  é  útil  e  freqüente¬ 
mente  aplicado.  Pesquisa  organizacional  freqüentemen¬ 
te  se  concentra  na  maneira  como  diferentes  fenômenos 
no  ambiente  de  trabalho  afetam  homens  e  mulheres  de 
forma  distinta.  Em  algumas  ocasiões,  particularmente 
com  variáveis  relacionadas  com  stress,  homens  e  mulhe¬ 
res  reagem  de  forma  muito  diferente.  Por  exemplo,  um 
modelo  SEM  de  múltiplos  grupos  foi  utilizado  para  de¬ 
monstrar  como  a  relação  entre  conflito  e  desempenho  é 
maior  entre  homens  do  que  entre  mulheres  [4]. 


Dados  longitudinais 

SEM  tem  sido  cada  vez  mais  aplicada  em  dados  longitu¬ 
dinais.  Dada  a  visão  resultante  de  acompanhar  mudanças 
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Amostra  1 


FIGURA  12-12  Ilustração  de  modelo  estrutural  de  dois  grupos. 


em  construtos  e  relações  ao  longo  do  tempo,  o  crescen¬ 
te  emprego  de  dados  longitudinais  pode  ser  benéfico  em 
muitas  áreas.  Como  muitos  tipos  diferentes  de  planeja¬ 
mentos  de  estudos  longitudinais  conduzem  a  muitas  apli¬ 
cações  distintas  de  SEM,  esta  seção  oferece  apenas  uma 
breve  introdução  a  algumas  das  diferenças  fundamentais 
ao  se  lidar  com  dados  longitudinais.  O  leitor  interessado 
deve  consultar  outras  fontes  para  uma  discussão  mais  de¬ 
talhada  [8]. 

Fontes  adicionais  de  covariância:  tempo 

Uma  das  questões  importantes  na  modelagem  de  dados 
longitudinais  com  SEM  envolve  fontes  adicionadas  de 
covariância  associadas  com  tomadas  de  medidas  sobre 


as  mesmas  unidades  ao  longo  do  tempo.  Por  exemplo, 
considere  um  modelo  que  suponha  que  habilidade  de 
leitura  provoca  habilidade  matemática.  O  argumento  te¬ 
órico  pode  se  basear  no  fato  de  que  é  necessário  saber  ler 
para  estudar  matemática  adequadamente  [14].  Suponha 
que  dados  longitudinais  estejam  disponíveis  e  que  habili¬ 
dades  em  matemática  e  leitura  sejam  tratadas  cada  uma 
como  construtos  latentes  medidos  por  indicadores  múlti¬ 
plos.  Habilidade  matemática  em  qualquer  dado  instante 
(f)  pode  ser  modelada  como  uma  função  de  habilidade 
de  leitura  no  instante  (í),  habilidade  de  leitura  no  ins¬ 
tante  anterior  (f-1)  e  habilidade  matemática  no  instante 
anterior  (í-1).  A  relação  de  uma  habilidade  significativa 
de  leitura  no  instante  (t-1)  habilidade  matemática  no 
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instante  (í)  ajudaria  a  fornecer  evidência  de  causalidade, 
no  sentido  de  que  seria  consistente  com  uma  seqüência 
temporal  causal  e  estabeleceria  covariância.  É  fácil  per¬ 
ceber  como  o  modelo  poderia  ser  estendido  para  mais 
períodos  de  tempo. 

Uma  questão  estratégica  é  se  é  razoável  esperar  que 
as  medidas  indicadoras  correspondentes  em  diferentes 
períodos  de  tempo  sejam  não-relacionadas.  Em  outras 
palavras,  se  velocidade  de  leitura  é  um  indicador  do  cons- 
truto  de  habilidade  de  leitura  em  cada  período  de  tempo, 
deveria  ser  modelada  a  correlação  entre  o  teste  indicador 
de  velocidade  de  leitura  no  instante  t-1  e  o  teste  indicador 
de  velocidade  de  leitura  no  instante  tl  Falando  em  termos 
gerais,  a  resposta  é  positiva. 

Uso  de  covariâncias  de  erro  para 
representar  covariância  adicionada 

Incluir  um  termo  de  covariância  de  erro  de  medição  ou 
um  construto  adicional  que  é  visto  como  uma  outra  cau¬ 
sa  dos  indicadores  correspondentes  representará  a  cova¬ 
riância  adicionada.  A  Figura  12-13  fornece  um  diagrama 
de  caminhos  do  tipo  AMOS  para  o  uso  de  parâmetros  de 


covariância  de  erro  com  o  propósito  de  capturar  a  fonte 
extra  de  comunalidade.  Cada  caminho  que  deve  ser  esti¬ 
mado  é  indicado  com  uma  seta.  Note  que  setas  curvadas 
de  dois  sentidos  são  agora  mostradas  a  partir  de  cada  ter¬ 
mo  de  erro  de  variável  medida  (Og  ou  9^)  para  testes  de 
correspondência.  Colocando  de  outra  forma,  o  primeiro 
teste  de  leitura  (teste  1)  é  o  mesmo  aplicado  em  ambos  os 
instantes  t  e  t-1,  de  forma  que  o  escore  de  um  estudante 
em  cada  um  deve  ser  correlacionado.  O  mesmo  pode  ser 
dito  para  cada  um  dos  quatro  testes  em  separado  de  ma¬ 
temática.  Dessa  maneira,  pode  ser  feita  uma  tentativa  de 
controlar  as  fontes  adicionais  de  covariância  que  acompa¬ 
nham  os  dados  longitudinais.  Ainda  que  essas  tentativas 
de  controle  se  tornem  complicadas  rapidamente  à  medida 
que  o  número  de  construtos  e  de  variáveis  aumenta  e  ao 
longo  de  diferentes  tipos  de  situações  envolvendo  dados 
longitudinais,  tais  modelos  viabilizam  um  exame  mais 
próximo  de  efeitos  de  tendências  e  podem  ajudar  a  esta¬ 
belecer  a  condição  de  seqüência  temporal  para  causalida¬ 
de.  Uma  advertência  final  é  que  o  número  aumentado  de 
parâmetros  estimados  pode,  às  vezes,  levar  a  problemas 
com  identificação  estatística. 


Legenda  da  variável  medida: 

Rótulo  Escore  no  Instante 

X.|  =  Teste  1  de  leitura  em  f-1 
=  Teste  2  de  leitura  em  f-1 
=  Teste  3  de  leitura  em  f-1 
=  Teste  4  de  leitura  em  f-1 
=  Teste  1  de  leitura  em  f 
=  Teste  2  de  leitura  em  f 
=  Teste  3  de  leitura  em  f 
=  Teste  4  de  leitura  em  f 
=  Teste  1  de  matemática  em  f-1 
=  Teste  2  de  matemática  em  f-2 
=  Teste  3  de  matemática  em  f-3 
=  Teste  4  de  matemática  em  f-4 
=  Teste  1  de  matemática  em  f 
=  Teste  2  de  matemática  em  f 
=  Teste  3  de  matemática  em  f 
=  Teste  4  de  matemática  em  f 


V^e 

V'b 

>'10 

V9 

FIGURA  12-13  Modelo  SEM  usando  termos  de  covariância  fora  da  diagonal  para  modelar  correlação  de  medidas  correspondentes  ao  longo 
de  diferentes  períodos  de  tempo. 
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Outra  forma  na  qual  análises  longitudinais  são  condu¬ 
zidas  com  modelos  SEM  é  mediante  o  acompanhamento 
de  mudanças  em  correlações  ao  longo  de  diferentes  pe¬ 
ríodos  de  tempo.  Imagine  que  um  modelo  SEM  foi  cole¬ 
tado  para  três  diferentes  períodos  de  tempo.  Uma  análise 
multigrupo  pode  ser  conduzida  sobre  os  três  grupos  para 
rastrear  potenciais  mudanças  em  médias  ou  relações  de 
construtos.  O  processo  evolui  de  maneira  muito  pareci¬ 
da  com  o  procedimento  multigrupo  para  moderação  an¬ 
teriormente  descrito.  Por  exemplo,  um  modelo  que  fixa 
uma  relação  em  especial  para  que  ela  seja  igual  ao  longo 
dos  três  períodos  de  tempo  pode  ser  testado  em  compara¬ 
ção  com  um  modelo  que  permita  que  a  relação  seja  esti¬ 
mada  nesses  três  períodos.  Os  ajustes  para  os  dois  mode¬ 
los  podem  ser  comparados  para  ver  se  a  relação  é  estável 
ao  longo  do  tempo. 

Mínimos  quadrados  parciais 

Mínimos  quadrados  parciais  (PLS)  têm  sido  oferecidos 
como  uma  alternativa  a  SEM.  PLS  podem  fornecer  esti¬ 
mativas  paramétricas  para  um  sistema  de  equações  linea¬ 
res,  como  a  SEM  faz.  Mas  eles  se  diferenciam  em  diversos 
aspectos  importantes.  Essas  diferenças  incluem  as  seguin¬ 
tes: 

•  PLS  tratam  os  fatores  como  escores  compostos  individuais. 
Em  outros  termos,  eles  não  tentam  recriar  a  covariância  en¬ 
tre  escores  de  itens  medidos. 

•  Graus  de  liberdade  não  desempenham  um  papel  significati¬ 
vo  em  PLS,  como  acontece  em  SEM. 

•  Em  geral,  PLS  não  se  baseiam  em  procedimentos  de  otimi¬ 
zação,  como  ocorre  com  SEM. 

•  Modelos  de  PLS  apresentam  menos  problemas  com  identi¬ 
ficação  estatística  e  com  erros  fatais  que  impedem  soluções. 

•  PLS  encontram  soluções  baseadas  na  minimização  da  va¬ 
riância  em  construtos  endógenos.  SEM  tenta  reproduzir  co¬ 
variância  observada  entre  itens  medidos. 

•  PLS  não  podem  distinguir  indicadores  formativos  de  refle¬ 
xivos. 

•  PLS  não  exigem  as  características  da  boa  medição  para  pro¬ 
duzir  resultados. 

•  PLS  são  menos  sensíveis  a  considerações  sobre  tamanho 
amostrai. 

Claramente,  PLS  apresentam  vantagens  e  desvanta¬ 
gens  em  relação  a  SEM.  As  vantagens  repousam  principal¬ 
mente  em  sua  robustez,  o  que  significa  que  eles  oferecem 
uma  solução  mesmo  quando  existem  problemas  que  po¬ 
dem  impedir  uma  solução  em  SEM.  Os  primeiros  proble¬ 
mas  são  as  dificuldades  de  medição.  Por  exemplo,  quan¬ 
do  um  pesquisador  se  depara  com  um  modelo  estrutural 
com  medidas  de  um  só  item  ou  uma  mistura  de  diversas 
medidas  de  um  ou  dois  itens,  PLS  podem  ser  um  método 
alternativo  que  mais  provavelmente  fornecerá  estimativas 
confiáveis  das  relações  entre  construtos  do  que  acontece 
em  SEM.  Quando  a  validação  de  medidas  de  um  e  dois 
itens  no  contexto  de  uma  teoria  de  mensuração  tiver  pou¬ 
co  significado,  PLS  podem  ser  uma  abordagem  útil. 


O  que  um  pesquisador  deveria  fazer  se  uma  teoria  de 
mensuração  não  consegue  manter  a  investigação  de  uma 
CEA  e  o  subseqüente  teste  de  validade  convergente?  PLS 
ainda  oferecem  estimativas  de  relações  entre  os  constru¬ 
tos  do  modelo.  Cabe  ao  pesquisador,  em  tais  situações, 
qualificar  os  resultados  com  base  na  adequação  das  me¬ 
didas.  Conforme  aumenta  a  preocupação  com  qualidade 
de  boa  medida  e  as  medidas  de  múltiplos  itens  se  tornam 
disponíveis  para  construtos  latentes,  PLS  não  são  reco¬ 
mendados  como  alternativa  a  SEM. 

As  características  de  PLS  os  tornam  muito  diferentes 
da  SEM  em  termos  de  metas.  PLS  estatisticamente  pro¬ 
duzem  estimativas  paramétricas  que  maximizam  variân¬ 
cia  explicada  de  maneira  muito  parecida  com  regressão 
múltipla  OLS.  Logo,  o  foco  é  muito  mais  sobre  previ¬ 
são.  SEM,  por  outro  lado,  tenta  reproduzir  a  covariação 
observada  entre  medidas,  e  esta  tentativa  permite  uma 
avaliação  de  ajuste  com  base  no  quão  bem  elas  são  re¬ 
produzidas.  Assim,  podemos  fazer  uma  asserção  sobre 
o  quão  bem  uma  dada  teoria,  como  representada  por 
um  modelo  SEM,  explica  essas  observações.  Portanto,  a 
SEM  está  mais  preocupada  com  explicação  [12]  e  é  uma 
ferramenta  mais  adequada  para  teste  de  teoria.  PLS  tam¬ 
bém  podem  ser  uma  maneira  útil  de  rapidamente  explo¬ 
rar  um  grande  número  de  variáveis  para  identificar  con¬ 
juntos  de  variáveis  (componentes  principais)  que  podem 
prever  alguma  variável  de  resultado.  Neste  sentido,  PLS 
têm  algo  em  comum  com  análise  canônica,  mas  alguns 
usuários  podem  achá-los  mais  fáceis  de  usar. 

Diversas  versões  de  algoritmos  PLS  podem  ser  con¬ 
duzidas  dentro  de  programas  SEM,  como  LISREL  [12]. 
Uma  variação  de  PLS  está  também  disponível  no  pacote 
estatístico  SAS.  Ela  é  fácil  de  utilizar,  e  tudo  o  que  o  pes¬ 
quisador  precisa  especificar  é  a  variável  pretendida  de  re¬ 
sultado,  o  conjunto  de  variáveis  medidas  que  podem  pre- 
vê-la,  e  o  número  de  fatores  que  existem  dentro  daquele 
conjunto  de  itens.  O  pesquisador  não  tem  que  especificar 
um  padrão  fatorial  como  em  SEM. 


A  Figura  12-14  mostra  uma  saída  PLS  comentada.  Este 
modelo  em  particular  está  tentando  prever  o  custo  de 
todos  os  itens  comprados  por  um  consumidor,  com  base 
nas  emoções  sentidas  durante  as  compras.  A  variável  de¬ 
pendente  é  um  único  item  (custo).  Os  itens  que  compõem 
os  fatores  são  rotulados  de  emotl  a  emotlO.  Neste  caso, 
as  perspectivas  para  explicar  a  variável  dependente  não 
são  tão  boas.  Os  dois  componentes  extraídos  explicam 
menos  do  que  5%  da  variância  na  medida  dependente. 
As  cargas  podem  ser  interpretadas  exatamente  como  na 
discussão  do  Capítulo  3.  A  componente  1  tem  sua  carga 
mais  alta  para  a  variável  emotS.  A  componente  2  apre¬ 
senta  sua  carga  mais  elevada  para  emot9.  Isso  deve  ser 
útil  para  verificar  o  significado  da  componente.  A  parte 
final  da  saída  mostra  os  coeficientes  não-padronizados 

(Continua) 
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de  regressão.  Neste  caso,  ambas  as  componentes  pro¬ 
duzem  estimativas  paramétricas  parecidas  (0,10  e  0,08, 
respectivamente).  Diferentes  opções  de  saída  podem  ser 
especificadas  para  produzir  outras  estatísticas  comuns  de 
modelos. 


Conceitualmente  e  na  prática,  PLS  são  similares  ao 
emprego  de  análise  de  regressão  múltipla  no  exame  de 
possíveis  relações  entre  fatores  compostos  obtidos  atra¬ 
vés  de  EFA.  Em  certos  casos,  particularmente  quando  as 
medidas  são  problemáticas,  eles  podem  ser  uma  alternati¬ 
va  a  SEM.  Não  obstante,  PLS  não  oferecem  um  teste  tão 
completo  quanto  SEM. 

Confusão  de  interpretação 

Quando  um  modelo  CEA  é  alterado  para  representar 
um  modelo  estrutural,  por  vezes  as  estimativas  paramé¬ 
tricas  que  correspondem  ao  modelo  de  mensuração  (es¬ 
pecialmente  Ax  e  Ay)  mudam.  Quando  isso  acontece, 
elas  indicam  um  problema  com  as  medidas.  Confusão  de 
interpretação  ocorre  quando  estimativas  de  cargas  va¬ 
riam  substancialmente  de  um  modelo  SEM  para  outro 
que  é  o  mesmo,  exceto  pela  mudança  de  especificação 
de  uma  ou  poucas  relações.  Essa  mudança  significa  di¬ 
ficuldade  na  classificação  de  qual  item  indicador  mede 
um  construto  latente  em  particular  [6].  Freqüentemen- 
te,  a  confusão  de  interpretação  resulta  da  instabilidade 


associada  com  fatores  sub-identificados.  Qu  seja,  fatores 
com  menos  de  três  itens  são  tipicamente  associados  a 
este  problema. 

Confusão  de  interpretação  pode  ser  eliminada  quan¬ 
do  a  validade  do  modelo  de  mensuração  é  avaliada  sepa¬ 
radamente  da  validade  do  modelo  estrutural.  Se  o  pes¬ 
quisador  observa  mudanças  substanciais  em  estimativas 
de  cargas  quando  compara  os  resultados  de  mensuração 
com  os  estruturais,  então  confusão  de  interpretação  é 
um  problema  provável  e  as  medidas  podem  precisar  de 
mais  desenvolvimento  ou  refinamento.  Além  disso,  o 
método  de  dois  passos  oferece  uma  avaliação  única  de 
validade  de  construto,  testando  a  teoria  de  mensuração 
que  especifica  como  itens  medidos  estão  relacionados  a 
construtos. 

CEA  é  o  primeiro  estágio  no  processo  SEM  de  dois 
passos.  Q  segundo  passo  é  o  teste  do  modelo  teórico  ou 
causal.  No  entanto,  os  dois  passos  não  são  independen¬ 
tes,  pois  os  caminhos  estimados  que  conectam  os  itens 
medidos  aos  construtos  estão  envolvidos  no  cálculo  das 
estimativas  dos  caminhos  estruturais.  Ajuste  é  avaliado 
duas  vezes,  sendo  que  uma  vez  para  o  modelo  de  mensu¬ 
ração  e  outra  para  o  estrutural.  Um  método  alternativo 
é  a  execução  de  uma  só  análise,  resultando  em  uma  ava¬ 
liação  de  ajuste.  No  entanto,  faltas  de  ajuste  não  podem 
ser  atribuídas  ao  modelo  de  mensuração  ou  o  estrutural. 
Além  disso,  se  o  modelo  de  mensuração  é  ruim,  então  os 
resultados  estruturais  não  são  confiáveis.  Por  essas  razões, 
a  abordagem  de  dois  passos  é  preferível. 


O  sistema  SAS 
0  procedimento  PLS 

Leitura  de  declarações  :  ^ 

proc  pis  nfactors  =  2  details;  ^ 

model  cost  =  emotl-emotlO ; 

Variação  percentual  explicada  por 
fatores  de  mínimos  quadrados  parciais 

Número  de 

fatores  Efeitos  de  modelo 

extraídos  Corrente  Total 

1 
2 


O  nfactors  =  2  é  uma  especificação  de  usuário  que 
diz  ao  programa  PLS  para  formar  dois  fatores  a 
partir  do  conjunto  de  variáveis  listadas.  O  modelo 
especifica  custo  (cost)  como  uma  variável 
dependente  e  as  variáveis  emot1-emot10  como  o 
conjunto  de  preditores  potenciais. 


A  saída  básica.  Os  Efeitos  de  Modelo 
mostram  o  grau  de  variação  explicada  nas 
variáveis  preditoras  usando  duas  compo¬ 
nentes  (48,4%).  As  colunas  de  variáveis 
dependentes  mostram  variância  explicada 
na  variável  dependente  usando  essas 
componentes  (4,39%). 


34,6523 
13 , 7581 


Variáveis  dependentes 
Corrente  Total 


34,6523 

48,4105 


3,4163 

0,9778 


3,4163 

4,3941 


Cargas  de  efeito  de  modelo 


Número  de  fatores 


extraídos  eraotl  emot2 


emot3  emot4 


emot5  emot6 


emot7 


emot8  emot9  eraotlO 


1 

2 


0,4100 

0,3166 


-0,3284 

0,1006 


0,3704 

0,0136 


-0,2447 

0.5063 


0,4273  -0,2661  0,4156  0,2854  0,0292  0,1352 

0,0664  0,4332  -0,1102  -0,2822  0,5391  0,2414 


FIGURA  12-14  Análise  PLS  de  SAS  anotada. 
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-  REGRAS  PRÁTICAS  12-2  - 

Tópicos  avançados 

•  Efeitos  indiretos  que  são  pequenos  (menores  do  que 
0,08)  geralmente  não  despertam  interesse,  pois  eles 
são  provavelmente  irrelevantes  relativamente  a  efeitos 
diretos 

•  Moderação  por  uma  variável  de  classificação  pode  ser 
testada  com  SEM  de  múltiplos  grupos: 

•  Uma  SEM  de  múltiplos  grupos  primeiramente 
permite  que  todos  os  parâmetros  teorizados  sejam 
livremente  estimados 

•  Em  seguida,  é  estimado  um  segundo  modelo,  no 
qual  as  relações  que  são  consideradas  moderadas  são 
restritas  a  serem  iguais  em  todos  os  grupos 

•  Se  o  segundo  modelo  se  ajusta  tão  bem  quanto  o 
primeiro,  moderação  não  encontra  sustentação 

•  Se  seu  ajuste  for  significativamente  pior,  então  a 
moderação  fica  evidente 

•  O  modelo  de  múltiplos  grupos  é  conveniente  para  testar 
moderação: 

•  Se  uma  variável  moderadora  contínua  pode  ser 
alterada  em  grupos  de  um  modo  que  faça  sentido, 
então  grupos  podem  ser  criados  e  os  procedimentos 
anteriormente  descritos  podem  ser  empregados  para 
testar  moderação 

•  Este  procedimento  pode  demandar  a  eliminação  de 
um  terço  das  respostas  mais  próximas  da  mediana,  a 
fim  de  se  criar  dados  bimodais  (dois  grupos  lógicos) 

•  Análise  de  agrupamentos  pode  ser  utilizada  para 
a  identificação  de  grupos  para  fins  de  comparação 
entre  eles 

•  Dados  unimodais  não  devem  ser  divididos  em  grupos 
com  base  em  uma  simples  partição  pela  mediana 

•  Quando  se  usa  uma  variável  contínua  moderadora 
formada  como  uma  interação  de  construto: 

•  As  relações  diretas  entre  o  construto  preditor  e  o 
construto  resultado  e  entre  o  construto  moderador  e 
o  construto  resultado  devem  ser  estimadas  somente 
se  a  relação  entre  a  interação  de  construto  e  o 
resultado  for  insignificante 

•  Amostras  maiores  são  necessárias  para  acomodar 
interações  de  variáveis  contínuas  (ou  seja,  N  >  500) 

•  Equivalência  métrica  (pelo  menos  parcial)  deve  ser 
estabelecida  antes  que  possam  ser  feitas  comparações 
válidas  de  relações  entre  grupos 


Resumo 

Uma  análise  SEM  completa  envolve  tanto  o  teste  da  teo¬ 
ria  de  mensuração  quanto  da  teoria  estrutural  que  conecta 
construtos  entre  si  de  uma  maneira  logicamente  significa¬ 
tiva.  Neste  capítulo,  aprendemos  como  completar  a  aná¬ 
lise  estendendo  nosso  modelo  CFA  de  um  modo  que  per¬ 
mitiu  um  teste  do  modelo  estrutural  como  um  todo,  o  que 
inclui  o  conjunto  de  relações  que  mostram  como  os  cons¬ 
trutos  se  relacionam.  SEM  não  é  apenas  mais  uma  técnica 


estatística  multivariada:  é  uma  maneira  de  testar  teorias. 
Ferramentas  estatísticas  muito  mais  fáceis  e  mais  apro¬ 
priadas  estão  disponíveis  para  a  exploração  de  relações. 
Mas  quando  um  pesquisador  conhece  o  suficiente  sobre 
um  assunto  para  especificar  um  conjunto  de  relações  en¬ 
tre  construtos,  além  da  maneira  como  tais  construtos  são 
medidos,  a  SEM  passa  a  ser  um  poderoso  e  adequado  re¬ 
curso.  Este  capítulo  destaca  diversos  pontos  estratégicos 
associados  a  SEM,  incluindo  os  seguintes: 

Distinguir  um  modelo  de  mensuração  de  um  estrutu¬ 
ral.  A  principal  diferença  entre  um  modelo  de  mensu¬ 
ração  e  um  estrutural  é  o  modo  como  relações  entre  cons¬ 
trutos  são  tratadas.  Em  CFA,  um  modelo  de  mensuração 
é  testado,  o  qual  geralmente  assume  que  cada  construto 
se  relaciona  com  outro.  Nenhuma  distinção  é  feita  entre 
construtos  exógenos  e  endógenos,  e  as  relações  são  repre¬ 
sentadas  como  correlações  simples  com  uma  seta  curva 
de  dois  sentidos.  No  modelo  estrutural,  construtos  endó¬ 
genos  são  diferenciados  dos  exógenos.  Os  exógenos  não 
têm  setas  chegando  neles.  Construtos  endógenos  são  de¬ 
terminados  por  outros  construtos  no  modelo,  como  visu¬ 
almente  indicado  pelo  padrão  de  setas  de  um  só  sentido 
que  apontam  para  construtos  endógenos. 

Descrever  as  similaridades  entre  SEM  e  outras  técnicas 
multivariadas.  Apesar  de  CFA  ter  muito  em  comum 
com  EFA,  a  parte  estrutural  da  SEM  é  parecida  com  re¬ 
gressão  múltipla.  As  diferenças  importantes  residem  no 
fato  de  que  o  foco  é  geralmente  em  como  os  construtos 
se  relacionam  entre  si,  e  não  em  como  as  variáveis  fazem 
isso.  E  bastante  provável  também  que  um  construto  endó¬ 
geno  seja  usado  como  preditor  de  outro  endógeno  dentro 
do  modelo  SEM. 

Descrever  um  modelo  teórico  com  relações  de  dependên¬ 
cia  usando  um  diagrama  de  caminhos.  O  capítulo  des¬ 
creveu  procedimentos  para  converter  um  diagrama  de  ca¬ 
minhos  de  CFA  em  um  diagrama  estrutural  de  caminhos. 
Em  um  diagrama  como  este  último,  as  relações  entre 
construtos  são  representadas  por  setas  de  um  só  sentido. 
As  abreviações  comuns  também  mudam.  Itens  indicado¬ 
res  medidos  para  construtos  endógenos  são  geralmente 
chamados  de  y,  enquanto  os  indicadores  de  construtos 
exógenos  são  denotados  por  x. 

Testar  um  modelo  estrutural  usando  SEM.  A  configu¬ 
ração  de  CFA  pode  ser  modificada  e  o  modelo  estrutural 
testado  usando  o  mesmo  programa  SEM.  Modelos  são 
sustentados  em  um  sentido  mais  amplo  quando  as  estatís¬ 
ticas  de  ajuste  sugerem  que  as  covariâncias  observadas  são 
adequadamente  reproduzidas  pelo  modelo.  As  mesmas 
diretrizes  que  se  aplicam  a  modelos  CFA  funcionam  para 
o  ajuste  do  modelo  estrutural.  Além  disso,  quanto  mais 
próximo  o  ajuste  do  modelo  estrutural  estiver  do  ajuste 
do  modelo  CFA,  maior  confiança  o  pesquisador  pode  ter 


CAPITULO  12  SEM:  Teste  de  um  Modelo  Estrutural  671 


no  modelo.  Finalmente,  o  pesquisador  deve  também  exa¬ 
minar  a  significância  estatística  e  a  direção  das  relações. 
O  modelo  é  sustentado  na  medida  em  que  as  estimativas 
paramétricas  são  consistentes  com  as  hipóteses  que  as  re¬ 
presentaram  antes  do  teste. 

Diagnosticar  problemas  com  os  resultados  de  SEM.  A 

mesma  informação  diagnóstica  pode  ser  utilizada  tanto 
para  ajuste  do  modelo  estrutural  quanto  para  ajuste  do 
modelo  CFA.  A  significância  estatística  de  relações-chave 
(ou  a  falta  dela),  os  resíduos  padronizados  e  os  índices  de 
modificação  podem  todos  ser  usados  na  identificação  de 
problemas  com  um  modelo  SEM. 

Entender  o  conceito  de  mediação  e  moderação  estatísti¬ 
ca.  Diversos  tipos  diferentes  de  relações  são  discutidos. 
Em  particular,  as  noções  de  mediação  e  moderação  são 
explicadas.  Mediação  envolve  uma  seqüência  de  relações 
tal  que  algum  construto  intervém  em  uma  seqüência  entre 
dois  outros.  Moderação  envolve  mudanças  em  relações 
baseadas  na  influência  de  uma  terceira  variável  ou  cons¬ 
truto.  Moderação  foi  discutida  no  contexto  de  modelos 
SEM  de  múltiplos  grupos  e  interações  de  variáveis  con¬ 
tínuas.  Sempre  que  possível,  a  abordagem  multigrupo  é 
recomendada. 


Questões 

1.  De  que  maneira  uma  teoria  de  mensuração  é  diferente  de 
uma  estrutural?  Quais  implicações  essas  diferenças  têm  so¬ 
bre  a  maneira  como  um  modelo  SEM  é  testado?  Como  o 
diagrama  visual  de  um  modelo  de  mensuração  se  distingue 
daquele  de  um  modelo  SEM? 

2.  Como  uma  variável  medida  representada  com  um  único 
item  pode  ser  incorporada  em  um  modelo  SEM? 

3.  Qual  é  a  característica  marcante  de  um  modelo  SEM  não- 
recursivo? 

4.  Como  é  estimada  a  validade  de  um  modelo  SEM? 

5.  Qual  é  a  maior  preocupação  quando  se  usam  técnicas  SEM 
com  dados  longitudinais? 

6.  Q  que  são  PLS  e  como  se  diferenciam  de  SEM? 

7.  Esboce  um  modelo  estrutural  supondo  que  três  construtos 
exógenos,  X,  Y  e  Z,  afetam,  cada  um,  o  construto  mediador 
M,  que,  por  sua  vez,  determina  outros  dois  resultados  P  e  R. 

8.  Como  SEM  pode  testar  um  efeito  moderador? 

9.  Por  que  é  importante  examinar  os  resultados  de  um  modelo 
de  mensuração  antes  de  se  prosseguir  com  o  teste  do  mode¬ 
lo  estrutural? 

Leituras  sugeridas 

Uma  lista  de  leituras  sugeridas  que  ilustra  problemas  e 
aplicações  de  técnicas  multivariadas  em  geral  está  dispo¬ 
nível  na  Web  em  www.prenhall.com/hair  (em  inglês). 


Apêndice  12  A 

As  relações  multivariadas  em  SEM 


Diversos  grupos  de  equações  multivariadas  estão  envol¬ 
vidos  na  estimativa  de  um  modelo  estrutural.  Não  se  diz 
modelagem  de  “equações”  estruturais  por  acaso!  Ainda 
que  seja  possível  aprender  como  executar  um  modelo 
SEM  sem  uma  compreensão  completa  sobre  suas  equa¬ 
ções,  conhecer  o  básico  pode  ser  útil  no  entendimento 
da  distinção  entre  variáveis  medidas  e  construtos  e  entre 
construtos  exógenos  e  endógenos.  Além  disso,  as  equa¬ 
ções  ajudam  também  a  mostrar  como  a  SEM  é  parecida 
com  outras  técnicas. 

A  principal  equação  estrutural 

As  equações  que  explicam  as  variáveis  medidas  (x  e  y)  do 
Capítulo  11  são  necessárias  em  SEM.  Elas  são  essenciais 
porque  são,  em  última  instância,  as  equações  que  forne¬ 
cem  os  valores  previstos  das  variáveis  medidas.  Em  re¬ 
gressão,  nossa  meta  era  construir  um  modelo  que  previsse 
uma  única  variável  dependente.  Aqui,  estamos  tentando 
prever  e  explicar  um  conjunto  de  construtos  endógenos. 
Portanto,  precisamos  de  equações  que  expliquem  cons¬ 
trutos  endógenos  (q)  além  daquelas  que  explicam  os  itens 
medidos.  Sem  surpresa,  percebemos  que  essas  equações 
são  semelhantes  à  equação  de  regressão  múltipla  que  ex¬ 
plica  a  variável  dependente  (y)  com  múltiplas  variáveis 
independentes  (ou  seja,  Xj  e  Xj* *).  Esta  equação  estrutural 
chave  pode  ser  expressa  como  (consulte  o  guia  de  abre¬ 
viações  no  Apêndice  lOB  para  qualquer  ajuda  necessária 
com  pronúncias  ou  definições): 

q  =  Bq  -t  -t  ^ 

O  q  representa  os  construtos  endógenos  em  um  mode¬ 
lo.  A  Figura  12-2  mostra  dois  construtos  endógenos:  Gas¬ 
tos  e  Comprometimento  de  cliente.  Esses  valores  serão 
previstos  pelo  modelo.  O  q  aparece  em  ambos  os  lados 
da  equação  porque  construtos  endógenos  podem  ser  de¬ 
pendentes  uns  dos  outros*.  Na  figura,  comprometimento 
de  clientes  (q2)  é  dependente  de  gastos  de  clientes  (q^); 
logo,  resultará  uma  estimativa  paramétrica  que  sugere 
como  eles  se  relacionam.  O  B  representa  os  coeficientes 


*  Este  cálculo  é  possível  graças  à  álgebra  linear  envolvida  na  compu¬ 
tação.  O  resultado  final  é  que  um  iq  pode  ser  uma  função  de  outros. 
Por  exemplo,  uma  representação  escalar  da  equação  de  regressão 
para  tij  pode  aparecer  como: 

*  N.  de  R.  T.:  Na  realidade,  múltiplas  variáveis  independentes  seriam 
denotadas  mais  adequadamente  por  Xj,  X2, 


paramétricos  que  conectam  construtos  endógenos  com 
outros  construtos  endógenos.  O  B  é  uma  matriz  que  con¬ 
siste  de  tantas  linhas  e  colunas  quanto  o  número  de  cons¬ 
trutos  endógenos.  Assim,  para  o  modelo  da  Figura  12-2, 
B  seria  uma  matriz  2x2,  com  duas  linhas  e  duas  colunas. 
Os  elementos  individuais  de  B  são  designados  por  um  |3, 
como  mostrado  na  figura.  O  F  é  a  matriz  correspondente 
de  coeficientes  paramétricos  que  conectam  os  construtos 
exógenos  (q)  com  os  endógenos  (q).  E  igualmente  uma 
matriz  que  apresenta  tantas  linhas  quanto  o  número  de 
construtos  exógenos  e  tantas  colunas  quanto  a  quantia  de 
construtos  endógenos.  O  modelo  da  Figura  12-2  produz 
uma  matriz  (E)  3x2.  Seus  elementos  individuais  são  de¬ 
signados  por  7,  como  mostrado  na  figura.  Finalmente,  ^ 
representa  o  erro  na  previsão  de  q.  Ele  pode  ser  consi¬ 
derado  como  o  recíproco  do  conceito  de  em  regressão 
(ou  seja,  1  -  R^). 

Outra  maneira  de  pensar  na  equação  estrutural  é  como 
uma  equação  de  regressão  múltipla  que  prevê  q  (um  cons- 
truto)  ao  invés  de  y,  com  os  outros  valores  q  e  ^  como  pre- 
ditores.  B  (Py,...)  e  E  (7j  j,...)  fornecem  estimativas  de 
parâmetros  estruturais.  Na  equação  de  regressão,  os  valo¬ 
res  preditores  foram  representados  por  x,  e  as  estimativas 
paramétricas  padronizadas,  por  p.  Em  ambos  os  casos,  a 
estimativa  paramétrica  descreve  a  relação  linear  entre  um 
preditor  e  um  resultado  final.  Assim,  existem  claras  seme¬ 
lhanças  entre  SEM  e  análise  de  regressão. 

Uso  de  estimativas  paramétricas 
para  explicar  construtos 

Podemos  mostrar  como  qualquer  construto  em  particu¬ 
lar  seria  representado  pela  substituição  de  valores  em  tal 
equação.  Você  pode  recordar  nossa  discussão  sobre  como 
valores  para  7  podem  ser  obtidos  a  partir  de  resultados 
de  regressão  (Capítulo  4).  Seguindo  esses  mesmos  pro¬ 
cedimentos,  pode  ser  obtida  uma  equação  para  gastos  de 
cliente  (qj  na  Figura  12-2: 

Analogamente,  uma  previsão  de  comprometimento  de 
cliente  (q2)  pode  ser  representada  como  uma  função  de 
gastos  de  clientes  (qj),  a  qual  é  uma  função  dos  três  cons¬ 
trutos  exógenos  mostrados  (Preço,  Serviço,  Atmos¬ 
fera,  ^3),  exibida  a  seguir,  com  base  na  Figura  12-2: 

A  =  p2.lhl+^2 
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A  suposição  é  de  que  o  valor  esperado  dos  termos  de 
erro  e  ^2)  é  0,  podendo  assim  ser  descartados  no  cálcu¬ 
lo  de  valores  previstos. 

Uso  de  construtos  para  explicar 
variáveis  medidas 

Uma  vez  que  são  conhecidos  valores  para  iq,  podemos  tam¬ 
bém  prever  as  variáveis  y  usando  uma  equação  da  forma: 

Novamente,  o  valor  esperado  de  Cj  é  0.  Valores  previs¬ 
tos  para  cada  y  (y^  -  Vg)  podem  ser  computados  de  manei¬ 
ra  análoga.  Valores  previstos  para  cada  x  também  podem 
ser  computados  da  mesma  maneira  usando-se  a  seguinte 
equação: 


Os  valores  previstos  para  cada  variável  observada 
(seja  um  x  previsto  ou  um  y)  podem  ser  usados  para 
calcular  estimativas  de  covariância  que  podem  ser  com¬ 
paradas  com  os  termos  reais  de  covariância  observada 
na  avaliação  do  ajuste  do  modelo.  Em  outras  palavras, 
podemos  usar  as  estimativas  paramétricas  para  modelar 
as  verdadeiras  variáveis  observadas.  A  matriz  de  cova¬ 
riância  obtida  pela  computação  de  covariação  entre  valo¬ 
res  previstos  para  os  itens  medidos  é  X*..  Lembre-se  que 
a  diferença  entre  a  matriz  real  de  covariância  para  itens 
observados  (S)  e  a  matriz  de  covariância  estimada  é  uma 
parte  importante  da  análise  de  validade  de  qualquer  mo¬ 
delo  SEM. 

Na  maioria  das  aplicações,  raramente  é  necessário  listar 
valores  previstos  com  base  nos  valores  de  outras  variáveis 
ou  construtos.  A  despeito  de  ser  útil  compreender  como 
valores  previstos  podem  ser  obtidos,  pelo  fato  de  que  isso 
ajuda  a  demonstrar  o  modo  como  SEM  funciona,  o  foco  em 
ciências  sociais  geralmente  é  sobre  a  explicação  de  relações. 


Apêndice  12B 


Como  fixar  cargas  fatoriais  para  um  valor 
específico  em  LISREL 


Se  um  pesquisador  desejasse  fixar  as  cargas  fatoriais  de 
um  modelo  SEM  para  os  valores  identificados  na  CFA, 
procedimentos  como  os  que  aqui  estão  descritos  pode¬ 
riam  ser  usados.  Voltando  à  Figura  12-5,  o  pesquisador 


seguiria  os  seguintes  passos,  no  caso  de  estar  utilizando  o 
programa  FISREF. 

As  estimativas  de  cargas  a  seguir  seriam  fixadas  e  seus 
valores  seriam  atribuídos  da  seguinte  maneira: 
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Os  termos  de  variância  de  erro  também  podem  ser  fixados  em  suas  estimativas  CFA  como  se  mostra  a  seguir: 
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5  TD  6 
5  TE  6 


6  TD  7  7  TD  8  8 
6  TE  7  7  TE  8  8 


O  pesquisador  poderia  então  prosseguir  para  especificar  os  elementos  livres  da  teoria  estrutural. 


Apêndice  12C 


Mudança  de  uma  configuração  CF  A  em  LISREL 
para  um  teste  de  modelo  estrutural 


Um  modelo  estrutural  deve  ser  comunicado  ao  programa 
SEM  antes  que  os  resultados  possam  ser  obtidos.  Diferen¬ 
tes  programas  oferecem  diferentes  opções  para  este  pro¬ 
cesso.  Listam-se  aqui  exemplos  de  mudanças  na  sintaxe 


de  LISREL  que  correspondem  à  Ligura  12-3.  As  linhas 
que  não  são  exibidas  aqui  (DA,  SE,  OU  etc.)  não  têm  que 
ser  modificadas. 


Comandos  de  modelo  de  mensuração: 

MO  NX  =  16  NK  =  4  PH  =  SY,FR  < - 

VA  1 . 0  LX  1  1  LX  5  2  LX  9  3  LX  13  4 

FR  LX  2  1  LX  3  1  LX  4  1  LX  6  2  LX  7  2  LX  8  2 

FR  LX  10  3  LX  11  3  LX  12  3  LX  14  4  LX  15  4  LX  16  4 


Isto  especifica  quatro  construtos 
com  16  variáveis  medidas.  Não 
são  separados  em  construtos 
endógenos  e  exógenos. 


Comandos  de  modelo  estrutural: 

MO  NY  =  8  NE  =  2  NX  =  8  NK  =  2  PH  =  SY,FR  PS  =  Dl , FR  GA  =  FU,FI  BE  =  FU,FI 

VA  1 . 0  LX  1  1  LX  5  2  LY  1  1  LY  5  2  _ 

Esta  linha  especifica  dois  construtos  endógenos 
e  dois  exógenos.  As  variáveis  medidas  são  ago¬ 
ra  distinguidas  como  x  ou  y,  respectivamente. 


FR  LX  2  1  LX  3  1  LX  4  1  LX  6  2  LX  7  2  LX  8  2 
FR  LY  2  1  LY  3  1  LY  4  1  LY  6  2  LY  7  2  LY  8  2 
FR  GA  1  1  GA  1  2 
FR  BE  2  1 


Essas  linhas  ilustram  as  mudanças  necessárias  para  o 
comando  do  modelo  e  para  os  padrões  de  matriz  de  pa¬ 
râmetros  para  converter  o  modelo  CEA  em  um  modelo 
estrutural.  Os  comandos  CEA  são  familiares,  dadas  as 
configurações  descritas  no  capítulo  anterior.  A  configura¬ 
ção  do  modelo  estrutural  mostrada  na  metade  de  baixo  da 
Figura  12-3  tem  diversas  modificações: 

1.  O  comando  MO  agora  fornece  valores  para: 

a.  O  número  de  indicadores  de  construtos  endógenos  (NY 

=  8) 

b.  O  número  de  construtos  endógenos  (NE  =  2) 

c.  O  novo  número  de  indicadores  de  construtos  exógenos 
(NX  =  8) 

d.  O  novo  número  de  construtos  exógenos  (NK  =  2) 

2.  O  comando  MO  agora  fornece  as  matrizes  paramétricas 
para  as  estimativas  de  parâmetros  estruturais: 

a.  GA  se  refere  às  relações  entre  construtos  exógenos  e 
endógenos  (F,  ou  gama  do  Capítulo  10).  É  especificada 
como  completa  (FU)  e  fixada  (FI).  A  convenção  é  espe¬ 
cificar  elementos  livres  individuais  embaixo. 

b.  BE  se  refere  às  relações  entre  construtos  endógenos  (p, 
beta  do  Capítulo  10).  Também  é  especificada  como  FU 


e  FI.  Os  elementos  livres  serão  especificados  com  um 
comando  FR  abaixo  da  linha  MO. 

3.  As  escalas  são  fixadas  para  os  construtos  exógenos  e  endó¬ 
genos  fazendo  uma  carga  igual  a  1,0,  como  se  segue: 

VA  1 . 0  LX  1  1  LX  5  2  LY  1  1  LY  5  2 

4.  O  padrão  fatorial  para  e  A,,  (as  respectivas  matrizes  de 
cargas)  é  especificado  de  maneira  muito  parecida  como  se 
faz  no  modelo  CFA.  A  única  diferença  é  que  os  indicadores 
de  itens  para  os  construtos  C  e  D  são  agora  chamados  de 
LY,  ao  invés  de  LX. 

5.  O  padrão  de  hipóteses  entre  construtos  latentes  é  represen¬ 
tado  liberando-se  os  elementos  apropriados  de  F  e  B,  res¬ 
pectivamente. 

a.  FR  GA  11  GA  12 

b.  FR  BE  21 

O  restante  da  sintaxe  do  modelo  pode  ser  especifica¬ 
do  como  na  configuração  do  modelo  CFA,  com  a  exceção 
dos  comandos  opcionais  de  rótulo  (LA).  Comandos  sepa¬ 
rados  de  rótulos  são  necessários  para  construtos  exógenos 
e  endógenos.  Tais  linhas  começam  com  LK  e  LE,  respec- 
tiv  amente. 
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Sintaxe  do  programa  SEM  do  exemplo 
HE  A  T  para  LISREL 


A  sintaxe  do  programa  LISREL  pode  ser  desenvolvida  a  tados  números  à  esquerda  das  linhas  para  ajudar  a  descre- 
partir  da  CFA  da  HBAT.  Uma  configuração  que  repre-  ver  a  sintaxe, 
senta  a  SEM  da  HBAT  é  mostrada  aqui.  Foram  acrescen- 
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As  mudanças  aqui  correspondem  àquelas  descritas 
anteriormente  no  capítulo.  A  primeira  mudança  na  con¬ 
figuração  CFA  é  observada  na  linha  09.  O  comando  do 
modelo  deve  agora  especificar  um  número  de  variáveis  e 
construtos  para  o  caso  de  construtos  exógenos  e  endóge¬ 
nos.  Assim,  a  linha  MO  especifica  NY  =  13  (5  itens  para 
JS,  4  itens  para  OC,  4  itens  para  SI).  Ainda  que  esses  se¬ 
jam  os  mesmos  itens  representados  por  tais  construtos  no 
modelo  CFA,  eles  agora  se  tornam  variáveis  y,  pois  eles 
são  associados  com  um  construto  endógeno.  Seus  parâ¬ 
metros  de  carga  são  agora  modificados  para  (LY)  para 
serem  consistentes  com  isso.  A  seguir,  a  linha  MO  espe¬ 
cifica  NE  =  3,  indicando  três  construtos  endógenos.  Este 
processo  é  repetido  para  os  construtos  exógenos  (NX  =  8 
e  NK  =  2).  PH  e  TD  permanecem  os  mesmos. 

Diversas  novas  matrizes  são  especificadas.  BE  =  FU,FI 
significa  que  B,  que  lista  todos  os  parâmetros  que  conec¬ 
tam  construtos  endógenos  com  outro  ((3),  é  marcado 
como  completa  e  fixada.  Isso  significa  que  liberamos  os 
elementos  correspondentes  às  hipóteses  seguintes.  GA 
representando  E,  que  lista  todos  os  parâmetros  que  co¬ 
nectam  construtos  exógenos  com  endógenos  (7),  é  tratada 
da  mesma  maneira.  Como  temos  agora  construtos  endó¬ 
genos,  os  termos  de  variância  de  erro  associados  com  as 


13  variáveis  y  são  agora  mostrados  em  0,,,  que  é  abreviado 
por  TE  =  DI,FR,  o  que  corresponde  a  dizer  que  se  trata 
de  uma  matriz  diagonal  e  que  os  elementos  da  diagonal 
serão  estimados. 

A  linha  10  fixa  a  escala  para  fatores,  assim  como  no 
modelo  CFA,  com  a  exceção  de  que  três  dos  valores  fi¬ 
xados  são  para  variáveis  y  (valores  X^:  LY  1,  1;  LY  6,  2; 
LY  10,  3).  As  linhas  11  e  12  especificam  os  valores  livres 
para  os  itens  medidos,  como  na  CFA.  Estamos  seguindo 
a  regra  prática  de  que  os  parâmetros  de  carga  fatorial  li¬ 
vres  devem  ser  estimados  ao  invés  de  fixados,  mesmo  que 
tenhamos  alguma  idéia  sobre  seus  valores  com  base  nos 
resultados  de  CFA.  As  linhas  13  e  14  especificam  o  padrão 
de  parâmetros  estruturais  livres.  A  linha  13  especifica  os 
elementos  livres  de  F.  Estes  correspondem  a  Hj  -  H4  na 
Figura  12-6  (7^^  se  lista  como  GA  1, 1).  Analogamente,  a 
linha  14  especifica  os  elementos  livres  de  B.  As  linhas  15 
e  16  listam  os  rótulos  para  os  construtos  ^  (LK).  As  linhas 
17  e  18  fazem  o  mesmo  para  os  construtos  iq  (LE).  A  linha 
19  contém  um  PD  que  diz  ao  programa  para  gerar  um  dia¬ 
grama  de  caminhos  a  partir  da  entrada.  A  linha  20  é  a  de 
saída  e  é  a  mesma  do  exemplo  CFA,  exceto  pela  adição  de 
EF,  o  que  fornece  uma  lista  separada  de  todos  os  efeitos 
diretos  e  indiretos. 
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Se  O  usuário  está  empregando  uma  interface  gráfica 
(p.  ex.,  AMOS  ou  LISREL),  ele  precisará  fazer  as  mo¬ 
dificações  correspondentes  no  diagrama  de  caminhos. 
Essas  modificações  incluem  a  garantia  de  que  os  constru- 
tos  estão  apropriadamente  designados  como  exógenos 
ou  endógenos  e  que  cada  variável  observada  apresenta 
um  respectivo  termo  de  variância  de  erro.  Em  seguida, 
cada  uma  das  setas  curvas  de  dois  sentidos  que  designa 
covariância  entre  construtos  na  CEA  deverá  ser  substi¬ 
tuída  por  uma  seta  de  um  sentido  para  representar  rela¬ 
ções  teorizadas.  Setas  entre  construtos  para  os  quais  ne¬ 
nhuma  relação  é  teorizada  são  desnecessárias.  Logo,  os 
caminhos  de  dois  sentidos  entre  tais  construtos  na  CEA 
podem  ser  eliminados.  Uma  vez  que  essas  mudanças 


são  promovidas,  o  usuário  pode  reestimar  o  modelo,  e 
os  resultados  agora  devem  refletir  o  produto  do  modelo 
estrutural.  Se  a  sintaxe  do  programa  mudar  como  indica¬ 
do,  o  software  produzirá  automaticamente  o  diagrama 
de  caminhos  adequado. 

Um  diagrama  visual  correspondente  à  SEM  pode  ser 
obtido  selecionando-se  Stmctiiral  Model  (Modelo  Estru¬ 
tural)  a  partir  das  opções  de  visualização  e  solicitando-se 
que  as  estimativas  completamente  padronizadas  sejam 
mostradas  pelo  programa  SEM.  Em  LISREL,  por  exem¬ 
plo,  os  valores  no  diagrama  de  caminhos  podem  ser  requi¬ 
sitados  de  forma  que  as  estimativas  são  exibidas  sobre  o 
diagrama,  ou  os  valores-í  para  cada  estimativa,  ou  outras 
estimativas  importantes,  como  os  índices  de  modificação. 
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188-195 

Variável  preditora  (Y„).  Ver  Variáveis 
independentes 

VARIMAX,  102, 117-120, 133-136 
VE  (Variância  extraída),  587-589, 591-592 
Vetor,  222-224,  249-250, 482-485, 502-503 
Vetor  expandido,  222-224,  249-250 
Viés  de  método  constante,  587-589, 
633-634 

VIF  (fator  de  inflação  de  variância),  151, 
153-154, 190-193,  201 


